Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare"

Transcript

1 Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare

2 La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per il modello di regressione sono sempre state considerate valide. Quali conseguenze possono verificarsi in caso contrario? In generale il metodo di stima dei minimi quadrati risulta piuttosto robusto, ossia piccole violazioni delle ipotesi del modello non invalidano l inferenza o le conclusioni a cui esso conduce. Violazioni più consistenti per almeno una delle ipotesi possono comportare serie difficoltà nel processo di stima dei parametri o condurre a conclusioni gravemente fuorvianti. 2

3 Richiami alle ipotesi del modello 1. Linearità del modello 2. Assenza di multicollinearità esatta 3. Outlier estremi sono improbabili 4. le caratteristiche dell errore errore u i disturbi sono assunti normali ed indipendentemente distribuiti, con media 0 e varianza costante: Var( u X ) i 2 = σ u E( uu ) = 0 i j i j i omoschedasticità Incorrelazione degli errori 3

4 Analisi dei residui standardizzazione dei residui Il metodo più semplice ed efficace per diagnosticare la maggior parte delle violazioni di ipotesi è l analisi dei residui In genere i residui e i hanno media nulla ma non varianza costante: ciò può rappresentare un inconveniente nell analisi diagnostica. Si può rimediare attraverso la standardizzazione (o «studentizzazione») dei residui. e is = ei stima dell ' errore standard di e i NB. Con il simbolo e i vengono indicati i residui stimati. In modo equivalente si può utilizzare il simbolo u i 4

5 Analisi dei residui standardizzazione dei residui I grafici più comunemente utilizzati consistono in diagrammi di dispersione che riportano i residui e is in ordinata mentre in ascissa possono essere rappresentate alternativamente le seguenti quantità: i valori stimati della variabile dipendente Ŷ i i valori osservati di una delle variabili indipendenti X j Se le assunzioni sono verificate tali diagrammi di dispersione danno luogo ad una nuvola di punti che non presenta particolari strutture. In particolare i punti del diagramma tendono a disporsi tra i valori 2 e 2 e risultano distribuiti casualmente intorno allo 0. 5

6 Esempio di diagramma di dispersione dei residui 2,5 2 1,5 1 0,5 e s i 0-0, ,5-2 Yˆi Ŷ i Questo diagramma corrisponde al caso base in cui non si riscontrano violazioni delle assunzioni Un esame accurato dei residui, attraverso l osservazione dei relativi diagrammi di dispersione, costituisce una parte integrante dell analisi di regressione. 6

7 Le più comuni violazioni delle ipotesi del modello di regressione riguardano: 1. Linearità (relazione non lineare); 2. Omoschedasticità (presenza di eteroschedasticità); 3. Incorrelazione degli errori (errori correlati); 4. Normalità della distribuzione (errori non normali) 5. Assenza di collinearità perfetta (collinearità perfetta e imperfetta) 6. I valori anomali sono improbabili (Presenza di valori anomali-outlier) 7

8 La trasformazione di variabili Costituisce uno dei rimedi più efficaci in diversi casi di violazione delle assunzioni. Può consentire di raggiungere diversi scopi tra cui: a. assicurare la linearità della relazione b. conseguire la normalità c. stabilizzare la varianza dei termini di disturbo Nella pratica è molto comune la stima di un modello su variabili trasformate piuttosto che su quelle originali 8

9 Alcuni esempi di trasformazione delle variabili La trasformazione delle variabili può essere applicata alternativamente alla variabile risposta, alla variabile esplicativa (o - nel caso di più variabili indipendenti - ad alcune di esse) oppure ad entrambe. Lo schema seguente riporta alcuni dei più comuni tipi di modello sui quali è stata applicata una trasformazione di variabile nel caso base di una regressione semplice 1) Y = α + βx + u Utile in caso di ipotesi di non normalità degli errori 2) logy = α + βx + u 3) Y = α + βlog X + u Utile per la stabilizzazione della varianza degli errori Utile per linearizzare una relazione non lineare 4) log Y = logα + βx + logu Linearizzazione della relazione β X Y = αe u 9

10 1. Violazione dell ipotesi di linearità Un modello di regressione è lineare quando è lineare nei parametri. Quando la relazione non è lineare, i parametri del modello di regressione perdono di significato e le stime del valor medio e la previsione del singolo valore per un dato valore di X potrebbero risultare fortemente distorte Si può diagnosticare principalmente attraverso due tecniche: 1. l analisi del diagramma di dispersione realizzato sulla base dei punti campionari; tale strumento consente però di analizzare solo la relazione tra la variabile dipendente e una variabile esplicativa per volta (nel caso di analisi di regressione multivariata, non sarebbe possibile valutare la struttura globale dei dati) 2. osservando una certa struttura nel diagramma di dispersione dei residui (es. crescente o decrescente) Si può risolvere con opportune trasformazioni di variabili Per avvalorare l ipotesi che la relazione stimata sia lineare nella trasformata di una o più variabili originarie si esaminano i residui della nuova regressione e si verifica che non presentino nessuna particolare struttura 10

11 Un esempio di violazione dell ipotesi di linearità 1. I dati Si supponga che si desideri misurare le vendite di un nuovo prodotto in relazione allo svolgimento della relativa campagna pubblicitaria Dati campionari Diagramma di dispersione dei punti campionari Vendite * Giorni di campagna pubblicitaria Si può stimare un modello lineare Ma il diagramma scatter fa supporre una relazione non lineare presumibilmente esponenziale 11

12 Un esempio di violazione dell ipotesi di linearità 2. I residui Il diagramma dei residui - rappresentati rispetto ai valori stimati della variabile risposta con un modello lineare - mostra non una disposizione casuale intorno allo zero ma una particolare struttura curvilinea che indica una relazione effettivamente non lineare Diagramma di dispersione dei residui 2 1,5 1 Residui stud. 0, , ,5-2 Vendite (valori stimati) 12

13 Un esempio di violazione dell ipotesi di linearità 3. Linearizzazione Si ipotizza una relazione esponenziale del tipo β* gg _ pubblicità vendite = αe u L applicazione del logaritmo naturale ad ambo i membri dell equazione di regressione conduce ad un modello linearizzato come segue log(vendite) = logα + β * gg_pubblicità + log u vendite = α + β* gg_pubblicità + u dove vendite = log(vendite) ; α = logα; u = log u. La stima del modello linearizzato si esegue semplicemente effettuando la regressione del logaritmo naturale delle vendite sulla variabile esplicativa 13

14 Un esempio di violazione dell ipotesi di linearità 3. Linearizzazione Si ipotizza una relazione esponenziale del tipo β1 igg _ pubblicità vendite = β e u 0 L applicazione del logaritmo naturale ad ambo i membri dell equazione di regressione conduce ad un modello linearizzato come segue log(vendite) = logβ + β igg_pubblicità + log u ' vendite = β + β1igg_pubblicità + u dove vendite = log(vendite) ; α = logα; u = log u. La stima del modello linearizzato si esegue semplicemente effettuando la regressione del logaritmo naturale delle vendite sulla variabile esplicativa 14

15 Un esempio di violazione dell ipotesi di linearità 4. Stime Stima del modello linearizzato vendite = 2,55 + 0,21* gg _ pubblicità STIMA Stima del modello esponenziale nella forma originaria venditestima = 12,84 e 0,21* gg _ pubblicità Diagrammi di dispersione dei punti campionari e dei residui 15

16 2. Violazione dell ipotesi di omoschedasticità Può essere facilmente diagnosticata attraverso l analisi del diagramma di dispersione dei residui, dove i residui standardizzati (ovvero studentizzati) sono riportati in ordinata contro le variabili esplicative alternativamente in ascissa. Si diagnostica una violazione dell assunzione di omoschedasticità quando la varianza degli errori tende a crescere o a decrescere al crescere della variabile esplicativa rappresentata. Residui studentizzati 2,5 2 1,5 1 0,5 0-0,5-1 -1,5-2 -2,5-3 presenza di eteroschedasticità relazione crescente Variabile X Residui studentizzati 2 1,5 1 0,5 0-0,5-1 -1,5-2 presenza di eteroschedasticità relazione decrescente Variabile X Se la banda in cui giacciono i punti tende ad allargarsi o a restringersi si può ipotizzare una situazione di eteroschedasticità; Se invece i punti giacciono tra due parallele non si riscontra evidenza di violazione dell assunzione. 16

17 OMOSCHEDASTICITA E(u X=x) = 0 (u soddisfa la prima assunzione dei Minimi Quadrati) La varianza di u non cambia con x (non dipende da x)

18 ETEROSCHEDASTICITA E(u X=x) = 0 (u soddisfa la prima assunzione dei Minimi Quadrati) La varianza di u dipende da x. Quindi siamo in presenza di Eteroschedasticità

19 Implicazioni della presenza di eteroschedasticità Problemi La presenza di eteroschedasticità comporta conseguenze rilevanti sulle stime dei parametri. In particolare: le stime dei minimi quadrati sono ancora corrette, ma non sono più efficienti (a varianza minima); la stima della varianza (e quindi dell errore standard) è distorta, il che tende a invalidare i test di significatività. Diagnostica Numerosi test: Kendall e Stuart; Breusch-Pagan; Goldfeld e Quandt; Glesjer; White. Soluzioni Trasformazione logaritmica della variabile risposta Metodo dei minimi quadrati pesati 19

20 3. Violazione dell ipotesi di incorrelazione degli errori L ipotesi di non correlazione degli errori stabilisce che i termini di errore ui e u j associati alle i-esima e j-esima osservazione siano incorrelati. La presenza di correlazione tra questi due termini suggerisce che c è un informazione esplicativa addizionale contenuta nei dati che non è stata adeguatamente sfruttata nel modello. La correlazione tra i termini di disturbo è comunemente denominata autocorrelazione. Può verificarsi in diverse situazioni: I residui adiacenti tendono ad essere simili nelle dimensioni sia spaziali (dati provenienti da indagini cross-section) sia temporali (dati provenienti da serie storiche), in questo caso sono di solito correlati positivamente; autocorrelazione pura I sintomi dell autocorrelazione possono anche presentarsi quando una variabile esplicativa è stata omessa e, se la variabile è in seguito inclusa nel modello, il problema dell autocorrelazione è completamente risolto: in questo caso la violazione è denominata autocorrelazione apparente. 20

21 3. Violazione dell ipotesi di incorrelazione degli errori residui 1 0,8 0,6 0,4 0,2 0-0,2-0,4-0,6-0,8-1 -1,2 0 0,5 1 1,5 2 2,5 Y stimata Dal grafico dei residui si evince un andamento ciclico dei residui segnalando pertanto la violazione dell ipotesi di incorrelazione degli errori 21

22 3. Violazione dell ipotesi di incorrelazione degli errori Effetti sui risultati dell analisi di regressione: Le stime dei minimi quadrati continuano ad essere non distorte ma non sono più efficienti; 2 σ Le stime di e di conseguenza, dell errore standard dei coefficienti di regressione possono risultare erroneamente ridotte, producendo un impressione falsata di accuratezza ed un R 2 esagerato; pertanto gli intervalli di confidenza ed i diversi test di significatività utilizzati comunemente non sono più esattamente validi. Per la diagnostica dell autocorrelazione pura il test più comunemente utilizzato è quello di Durbin-Watson 22

23 4. Violazione dell ipotesi di Normalità degli errori Si considerano i residui standardizzati, se gli errori sono normali, i residui standardizzati hanno approssimativamente una distribuzione normale con media zero e varianza 1: Il grafico invece evidenzia 60% di valori negativi, 84% di valori compresi tra [-1,1], quindi si può supporre una violazione dell ipotesi di normalità 23

24 4. Violazione dell ipotesi di Normalità degli errori Grafico di normalità P-P Si mettono a confronto la proporzione cumulata del residuo standardizzato (in ascissa) e la proporzione cumulata attesa nel caso in cui sia verificata l ipotesi di normalità (in ordinata). Se l ipotesi di normalità non è violata i punti tendono ad allinearsi lungo la bisettrice 24

25 5. Violazione dell ipotesi di assenza di collinearità perfetta COLLINEARITA PERFETTA. Sorge quando una delle variabili esplicative è una combinazione lineare esatta (perfetta) delle altre variabili. In questo caso non è possibile procedere alla stima della regressione (lo stimatore OLS non è definito univocamente.) Esempi di collinearità (o multicollinearità) perfetta Errore sull introduzione di una variabile che semplicemente ripete una variabile già presente nel modello (ad esempio una espressa in frazione e un altra espressa in termini percentuali) Introduzione di una variabile dummy per la quale le osservazioni presentano tutte valore 1 (ad esempio la dummy prevede valore 1 se le osservazioni presentano un valore superiore ad un dato limite ma tutte le osservazioni hanno valori superiori) Trappola delle variabili dummy. Si presenta quando si introducono tutte le categorie di una variabile qualitativa come dummy. In generale con G variabili binarie (dummy) dobbiamo includere nel modello solo G-1 variabili (una dummy deve essere esclusa e rappresenterà la categoria di riferimento)

26 5. Violazione dell ipotesi di assenza di collinearità perfetta COLLINEARITA IMPERFETTA. Se la correlazione tra variabili è troppo alta è possibile che insorga qualche problema. La presenza di multicollinearità imperfetta non impedisce la stima della regressione ma le stime ottenute saranno inaffidabili con standard error elevati, con un segno o un valore inattesi. In generale, si usa il termine multicollinearità per descrivere il problema posto dall esistenza di una relazione lineare approssimata fra le variabili esplicative che genera stime inaffidabili. Questa relazione può coinvolgere più di due regressori, persino tutti.

27 Misure per la collinearità imperfetta o quasi multicollinearità La diagnostica della quasi multicollinearità costituisce un processo più articolato. Un primo passo è osservare i valori della matrice di correlazione computata sull insieme delle variabili esplicative. Per diagnosticare la quasi multicollinerità si possono effettuare delle regressioni ausiliarie tra ogni variabile esplicativa e tutte le altre: se in alcune di tali regressioni si osserva un valore di R 2 molto elevato (es. superiore a 0,7) si diagnostica una quasi multicollinearità. Sulla base di tali regressioni ausiliarie può anche essere computato il VIF (Variance Inflation Factor), basato sul coefficiente di determinazione multiplo R 2 j relativo alla regressione della j-sima variabile esplicativa sulle altre k-1 VIF = 1 1 R j 2 Al variare di R 2 j il VIF assume di conseguenza i valori riportati nello schema seguente: Si sospetta una Q.M. per valori del VIF superiori a 3,5 27

28 6. Presenza di valori anomali (outliers) Gli outliers sono osservazioni campionarie che presentano residui molto grandi rispetto al resto delle osservazioni Sul grafico dei residui la presenza di outliers è segnalata da punti isolati e molto distanti dagli altri La presenza di valori anomali può avere effetti rilevanti sulle stime di regressione È necessario indagare su tali valori per capire se essi siano imputabili a errori di rilevazione oppure siano osservazioni causate da eventi straordinari come scioperi, calamità naturali, 28

29 Esempio: valori anomali 2,00 residui standardizzati 1,50 1,00 0,50 0,00-0,500,00 5,00 10,00 15,00 20,00 25,00-1,00-1,50-2,00 Y stimati Possibili valori anomali 29

30 Esempio n.1 tratto dal testo Borra- Di Ciaccio La Quantità di precipitazioni e le Temperature medie registrate in 10 stazioni meteorologiche sono state le seguenti: Stazione Meteorologica PRECIPITAZIONI TEMPERATURA a) Determinare con il metodo dei minimi quadrati la retta di regressione relativa alla Quantità di Precipitazioni (y) in funzione della Temperatura media (x) b) Commentare i risultati ottenuti 30

31 Grafico di dispersione e retta stimata 31

32 Risultati- Output Excel Coefficienti Errore standard Stat t p-value Intercetta 289,91 26,44 10,96 0,00 Temperatur a -14,56 1,73-8,42 0,00 ANALISI VARIANZA gdl SQ MQ F P-value Regressione , ,17 70,95 0,00 Errore ,83 361,10 Totale ,00 Statistica della regressione R al quadrato 0,90 Errore standard 19,00 Osservazioni 10 Il modello ha un buon adattamento Dal valore dei p- value entrambi i coefficienti sono significativamente diversi da zero Anche con il test F il coefficiente della variabile esplicativa è significativamente diverso da zero 32

33 OUTPUT RESIDUI Osservazione Y prevista Residui Residui standard 1 27,87 1,13 0, ,99-21,99-1, ,10 0,90 0, ,31 18,69 1, ,77-17,77-0,99 6-1,24 15,24 0, ,43-16,43-0, ,22 4,78 0, ,89 31,11 1, ,66-15,66-0,87 33

34 Grafico dei residui I residui sembrano disposti casualmente intorno allo zero 34

35 Grafico dei residui standardizzati 35

36 ESEMPIO N.2 Punti vendita Costi Ricavi Supponiamo di voler stimare sulla base delle seguenti osservazioni campionarie la relazione di dipendenza lineare dei ricavi dai costi 36

37 Errore Coefficienti standard Stat t p-value Intercetta -3,75 16,70-0,22 0,82 Variabile X 1,70 0,09 18,20 0,00 OUTPUT RIEPILOGO Risultati della regressione- Statistica della regressione R al quadrato 0,95 Errore standard 29,91 Osservazioni 20 Output Excel Dal valore del p- value l intercetta non è significativamente diversa da zero ANALISI VARIANZA gdl SQ MQ F p-value Regressione , ,59 331,07 0,00 Errore ,16 894,40 Totale ,75 37

38 Grafico dei residui I residui sembrano disposti casualmente intorno allo zero 38

39 Grafico dei residui standardizzati I residui standardizzati potrebbero suggerire una violazione dell ipotesi di normalità 39

40 Osservando il P-P plot la violazione dell ipotesi di normalità è più evidente 40

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Statistica per le ricerche di mercato. 11. La regressione lineare multipla

Statistica per le ricerche di mercato. 11. La regressione lineare multipla Statistica per le ricerche di mercato A.A. 2012/13 Dr. L.Secondi 11. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla estende il modello di regressione

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

lezione 8 AA Paolo Brunori

lezione 8 AA Paolo Brunori AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Esercitazione 5 Sta/s/ca Aziendale

Esercitazione 5 Sta/s/ca Aziendale Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di

Dettagli

Statistica per le ricerche di mercato. 14. La regressione lineare multipla

Statistica per le ricerche di mercato. 14. La regressione lineare multipla Statistica per le ricerche di mercato A.A. 2011/12 Prof.ssa Tiziana Laureti Dott. Luca Secondi 14. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Università di Pavia. Test diagnostici. Eduardo Rossi

Università di Pavia. Test diagnostici. Eduardo Rossi Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

ANALISI DELLE SERIE STORICHE

ANALISI DELLE SERIE STORICHE ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Regressione lineare multipla

Regressione lineare multipla Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Assunzioni (Parte I)

Assunzioni (Parte I) Assunzioni (Parte I) A M D Marcello Gallucci marcello.gallucci@unimib.it Lezione 10 Modello Lineare Generale La regressione semplice e multipla e l'anova sono sottocasi del modello lineare generale (GLM)

Dettagli

Statistica a lungo termine: calcolo dell onda di progetto

Statistica a lungo termine: calcolo dell onda di progetto Esercitazione Statistica a lungo termine: calcolo dell onda di progetto Sulla base delle misure ondametriche effettuate dalla boa di Ponza si calcoli, utilizzando la distribuzione di probabilità di Gumbel,

Dettagli

lezione 10 AA Paolo Brunori

lezione 10 AA Paolo Brunori AA 2016-2017 Paolo Brunori Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

CURVE DI DURATA: Introduzione e Rappresentazione analitica

CURVE DI DURATA: Introduzione e Rappresentazione analitica CURVE DI DURATA: Introduzione e Rappresentazione analitica Premesse Si definisce durata di una portata Q riferita ad una sezione di misura, l'intervallo di tempo in cui le portate naturali del corso d

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

Giorno n. clienti di attesa

Giorno n. clienti di attesa Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Regressione lineare con un solo regressore

Regressione lineare con un solo regressore Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β) Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n

Dettagli

Settimana 3. G. M. Marchetti. Marzo 2017

Settimana 3. G. M. Marchetti. Marzo 2017 Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla

Dettagli

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y ) Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni

Dettagli

Descrizione per la costruzione del modello di regressione

Descrizione per la costruzione del modello di regressione Descrizione per la costruzione del modello di regressione Formulazione delle Ipotesi Ricerca delle variabili esplicative Dati Modello Stima dei parametri Verifica Modello IL MODELLO DI REGRESSIONE LINEARE

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa

Dettagli

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno

Dettagli

Validazione ediagnostica

Validazione ediagnostica Validazione ediagnostica Il processo di identificazione di un modello di regressione consiste nell iterazione delle seguenti fasi: 1. formulazione di un modello provvisorio 2. stima dei parametri 3. critica

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Il Modello di Scomposizione

Il Modello di Scomposizione Approccio Classico: Metodi di Scomposizione Il Modello di Scomposizione Il modello matematico ipotizzato nel metodo classico di scomposizione è: y t =f(s t, T t, E t ) dove y t è il dato riferito al periodo

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla

Dettagli

Regressioni Non Lineari

Regressioni Non Lineari Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Metodi Statistici e Probabilistici per l Ingegneria MODELLI EMPIRICI. Corso di Laurea in Ingegneria Civile

Metodi Statistici e Probabilistici per l Ingegneria MODELLI EMPIRICI. Corso di Laurea in Ingegneria Civile Metodi Statistici e Probabilistici per l Ingegneria Corso di Laurea in Ingegneria Civile Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain E-mail: livio.corain@unipd.it Home page: www.gest.unipd.it/~livio/corso_civile.html

Dettagli

Capitolo 6. La distribuzione normale

Capitolo 6. La distribuzione normale Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti

GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti A cura di: Ing. Giovanna

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

Capitolo 6 La distribuzione normale

Capitolo 6 La distribuzione normale Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Analisi delle componenti principali

Analisi delle componenti principali Analisi delle componenti principali Serve a rappresentare un fenomeno k-dimensionale tramite un numero inferiore o uguale a k di variabili incorrelate, ottenute trasformando le variabili osservate Consiste

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli