mercato A.A. 2014/15 modello di regressione lineare

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "mercato A.A. 2014/15 modello di regressione lineare"

Transcript

1 Statistica per le ricerche di mercato A.A. 2014/ Violazione delle ipotesi nel modello di regressione lineare

2 La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per il modello di regressione sono sempre state considerate valide. Quali conseguenze possono verificarsi in caso contrario? In generale il metodo di stima dei minimi quadrati risulta piuttosto robusto, ossia piccole violazioni delle ipotesi del modello non invalidano l inferenza o le conclusioni a cui esso conduce. Violazioni più consistenti per almeno una delle ipotesi possono comportare serie difficoltà nel processo di stima dei parametri o condurre a conclusioni i gravemente fuorvianti. 2

3 Richiami alle ipotesi del modello 1. Linearità del modello 2. Assenza di multicollinearità esatta 3. Outlier estremi sono improbabili bili 4. le caratteristiche dell errore errore u i disturbi sono assunti normali ed indipendentemente distribuiti, con media 0 e varianza costante: Var ( u X ) i omoschedasticità i 2 = σ u E( uu ) = 0 i j Incorrelazione degli errori i j 3

4 Diagnostica: analisi dei residui Con il termine diagnostica, nell ambito della regressione, ci si riferisce a un insieme di tecniche volte all individuazione di eventuali problemi rispetto al modello o rispetto ai dati. Il metodo più semplice ed efficace per diagnosticare la maggior parte delle violazioni di ipotesi è l analisi dei residui. L analisi dei residui permette di: stabilire se le ipotesi formulate sul termine d errore del modello di regressione sono valide rispetto al fenomeno analizzato; identificare l eventuale presenza di punti di leverage, osservazioni anomale rispetto alle x outlier, ossia osservazioni anomale rispetto alla variabile dipendente y osservazioni influenti, ossia osservazioni la cui esclusione modifica le stime dei minimi quadrati.

5 Analisi dei residui standardizzazione dei residui In genere i residui e i hanno media nulla ma non varianza costante: ciò può rappresentare un inconveniente nell analisi diagnostica. Si può rimediare attraverso la standardizzazione dei residui che si effettua dividendo il residuo per la stima dell errore standard e is = ei stima dell ' errore standard d die i La varianza dell i-esimo residuo è espressa da: ( ) = σ 2 ( 1 h ) V e i ii Che essendo una quantità non nota deve essere stimata. NB. Con il simbolo e i vengono indicati i residui stimati. In modo equivalente si può utilizzare il simbolo u i

6 RESIDUI STANDARDIZZATI E RESIDUI STUDENTIZZATI La stima dell errore standard del residuo può essere effettuata in due modi: 1) ( ) = 2 ( 1 ) SDerror e s h i ii Residuo standardizzato ei eis = s 1 h ( ) ii 2 2) SDerror ( e ) = s( ) ( h ) s h ii 2 () 1 i 1 1 ii Residuo studentizzato È la stima ottenuta eliminando l i-esima osservazione e is = s e i () i ( 1 hii ) Si chiama valore di leverage. È una misura della distanza dell ascissa dell unità i-esima dal baricentro della x Stata stima i residui standardizzati e quelli studentizzati predict r, rstandard predict r1, rstudent

7 Analisi dei residui standardizzazione dei residui I grafici più comunemente utilizzati consistono in diagrammi di dispersione che riportano i residui e is in ordinata mentre in ascissa possono essere rappresentate alternativamente le seguenti quantità: i valori stimati della variabile dipendente Ŷ i i valori osservati di una delle variabili indipendenti X j Se le assunzioni sono verificate tali diagrammi di dispersione danno luogo ad una nuvola di punti che non presenta particolari strutture. In particolare i punti del diagramma tendono a disporsi tra i valori 2 e 2 e risultano distribuiti casualmente intorno allo 0. 7

8 Esempio di diagramma di dispersione dei residui 25 2,5 2 1,5 1 0,5 e s i 0-0, , Yˆi Ŷ i Questo diagramma corrisponde al caso base in cui non si riscontrano violazioni delle assunzioni Un esame accurato dei residui, attraverso l osservazione dei relativi diagrammi di dispersione, costituisce una parte integrante dell analisi di regressione. 8

9 Osservazioni influenti Se un valore di yi è particolarmente inusuale rispetto a tutti gli altri allora la stima del modello di regressione può essere notevolmente t influenzata da tale osservazione. Per valutare la presenza di un valore influente si elimina l osservazione i, si stima nuovamente il modello e si indica con β ii) la stima OLS di β ottenuta escludendo tale osservazione. Si calcola una misura di distanza tra le due stime che viene denominata distanza di Cook. Tale procedimento viene ripetuto per una osservazione alla volta e tutte le volte si stima nuovamente il modello. Quelle osservazioni che producono variazioni rilevanti nella stima dei parametri del modello sono dette influenti. La distanza di Cook Di è quindi composta da una componente che misura l adattamento (in quanto funzione dei residui) e da una componente che misura la distanza delle x dal baricentro (essendo una misura del livello di leverage dell i-esima osservazione). Le unità per cui Di > 4/n-k-1 sono potenziali osservazioni influenti.

10 Le più comuni violazioni delle ipotesi del modello di regressione riguardano: 1. Linearità (relazione non lineare); 2. Omoschedasticità (presenza di eteroschedasticità); 3. Incorrelazione degli errori (errori correlati); 4. Normalità della distribuzione (errori non normali) 5. Assenza di collinearità perfetta (collinearità perfetta e imperfetta) 6. I valori anomali sono improbabili (Presenza di valori anomali-outlier) 10

11 La trasformazione di variabili Costituisce uno dei rimedi più efficaci in diversi casi di violazione delle assunzioni. i Può consentire di raggiungere diversi scopi tra cui: a. assicurare la linearità della relazione b. conseguire la normalità c. stabilizzare la varianza dei termini di disturbo Nella pratica è molto comune la stima di un modello su variabili trasformate piuttosto che su quelle originali 11

12 Alcuni esempi di trasformazione delle variabili La trasformazione delle variabili può essere applicata alternativamente alla variabile risposta, alla variabile esplicativa (o - nel caso di più variabili indipendenti - ad alcune di esse) oppure ad entrambe. Lo schema seguente riporta alcuni dei più comuni tipi di modello sui quali è stata applicata una trasformazione di variabile nel caso base di una regressione semplice 1) Y = α + βx + u Utile in caso di ipotesi di non normalità degli errori 2) logy = α + βx + u Utile per la stabilizzazione della varianza degli errori 3) Y = α + β log X + u Utile per linearizzare una relazione non lineare 4) log Y = log α + β X + log u Linearizzazione della relazione X β Y = αe u 12

13 1. Violazione dell ipotesi di linearità Un modello di regressione è lineare quando è lineare nei parametri. Quando la relazione non è lineare, i parametri del modello di regressione perdono di significato e le stime del valor medio e la previsione del singolo valore per un dato valore di X potrebbero risultare fortemente distorte Si può diagnosticare principalmente attraverso due tecniche: 1. l analisi del diagramma di dispersione realizzato sulla base dei punti campionari; tale strumento consente però di analizzare solo la relazione tra la variabile dipendente e una variabile esplicativa per volta (nel caso di analisi di regressione multivariata, non sarebbe possibile valutare la struttura globale dei dati) 2. osservando una certa struttura nel diagramma di dispersione dei residui (es. crescente o decrescente) Si può risolvere con opportune trasformazioni di variabili Per avvalorare l ipotesi che la relazione stimata sia lineare nella trasformata di una o più variabili originarie si esaminano i residui della nuova regressione e si verifica che non presentino nessuna particolare struttura 13

14 Un esempio di violazione dell ipotesi di linearità 1. I dati Si supponga che si desideri misurare le vendite di un nuovo prodotto in relazione allo svolgimento della relativa campagna pubblicitaria Dati campionari Diagramma di dispersione dei punti campionari Vendite * Giorni di campagna pubblicitaria Si può stimare un modello lineare Ma il diagramma amma scatter fa supporre una relazione non lineare presumibilmente esponenziale 14

15 Un esempio di violazione dell ipotesi di linearità 2. I residui Il diagramma dei residui - rappresentati rispetto ai valori stimati della variabile risposta con un modello lineare - mostra non una disposizione casuale intorno allo zero ma una particolare struttura curvilinea che indica una relazione effettivamente non lineare Diagramma di dispersione dei residui 2 1,5 1 Res sidui stud. 0, , ,5-2 Vendite (valori stimati) 15

16 Un esempio di violazione dell ipotesi di linearità 3. Linearizzazionei i Si ipotizza una relazione esponenziale del tipo β1 i gg _ pubblicità vendite = β e u 0 L applicazione del logaritmo naturale ad ambo i membri dell equazione di regressione conduce ad un modello linearizzato come segue log(vendite) = logβ + β igg_pubblicità + log u 0 1 ' vendite = β + β 0 1igg_pubblicità + u dove vendite = log(vendite) ; α = log α ; u = log u. La stima del modello linearizzatoi si esegue semplicemente effettuando la regressione del logaritmo naturale delle vendite sulla variabile esplicativa 16

17 Un esempio di violazione dell ipotesi di linearità 4. Stime Stima del modello linearizzato vendite = 2,55 + 0,21* gg _ pubblicità STIMA Stima del modello esponenziale nella forma originaria venditestima = 12,84 e 0,21* gg _ pubblicità Diagrammi di dispersione dei punti campionari e dei residui 17

18 2. Violazione dell ipotesi di omoschedasticità. Possibili cause dell eteroschedasticità: E E spesso presente nei dati cross-section section in cui si aggregano dati con diversa natura e quindi potenzialmente diversa variabilità Le unità campionarie provengono da sottopopolazioni p diverse ovvero da aree diverse. Ad esempio, nelle imprese di minori dimensioni la variabilità del fatturato può essere inferiore a quella registrata nelle imprese di maggiori dimensioni. Uno o più regressori importanti sono stati omessi (in questo caso vi è un errore di specificazione) ovvero non compaiono nella forma più adatta (non sono stati trasformati) Att t f i l iti i d ll i bil i ò Attraverso una trasformazione logaritimica della variabile si può eliminare l eteroschedasticità.

19 2. OMOSCHEDASTICITA E(u X=x) = 0 (u soddisfa la prima assunzione dei Minimi Quadrati) La varianza di u non cambia con x (non dipende da x)

20 3. ETEROSCHEDASTICITA E(u X=x) = 0 (u soddisfa la prima assunzione dei Minimi Quadrati) La varianza di u dipende da x. Quindi siamo in presenza di Eteroschedasticità

21 2. Violazione dell ipotesi di omoschedasticità. Accertamento grafico Può essere facilmente diagnosticata attraverso l analisi del diagramma di dispersione dei residui, dove i residui standardizzati (ovvero studentizzati) sono riportati in ordinata contro le variabili esplicative alternativamente in ascissa. Si diagnostica una violazione dell assunzione di omoschedasticità quando la varianza degli erroritende a crescere o a decrescere al crescere della variabileesplicativaesplicativa rappresentata. Residui studentizzati 2,5 2 1,5 1 0,5 0-0,5-1 -1, ,5-3 presenza di eteroschedasticità relazione crescente Variabile X Re esidui studentizzati 2 1,5 1 0,5 0-0,5-1 -1,5-2 presenza di eteroschedasticità relazione decrescente Variabile X Se la banda in cui giacciono i punti tende ad allargarsi o a restringersi si può ipotizzare una situazione di eteroschedasticità; Se invece i punti giacciono tra due parallele non si riscontra evidenza di violazione dell assunzione. 21

22 Implicazioni della presenza di eteroschedasticità Problemi/ conseguenze sugli stimatori OLS La presenza di eteroschedasticità comporta conseguenze rilevanti sulle stime dei parametri. In particolare: le stime dei minimi quadrati sono ancora corrette, ma non sono più efficienti (a varianza minima); Gli stimatori non sono più BLUE. La stima della varianza (e quindi dell errore standard) è distorta, il che tende a invalidare i test di significatività. Le diagnostiche basate sui t-student, sulla F-Fisher e su R2 sono più alte (o più basse) di quanto non dovrebbero per cui c è un elevato rischio di errore nel giudizio sulla bontà del modello. Soluzioni Trasformazione logaritmica della variabile risposta Adozione di errori standard robusti rispetto alla violazione della omoschedasticità Metodo dei minimi quadrati pesati

23 Diagnostica Numerosi test:breusch-pagan; Goldfeld e Quandt; Glesjer; White. Kendall e Stuart Test Breusch-Pagan Il test implica la specificazione di un ipotesi alternativa sulla forma dell eteroschedasticità. Ipotizzando una forma esponenziale si ha: H 0 = σ1 = σ2 =... = σn 2 2 ' H = σ = σ exp( α x ) 0 i i La statistica test ha una distribuzione chi-quadrato con gdl uguali al numero delle variabili nel verrore xi. Esempio stata. estat hettest dist, iid Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: dist chi2(1) = 0.33 Prob > chi2 =

24 3. Violazione dell ipotesi di incorrelazione degli errori L ipotesidinoncorrelazionedeglierroristabiliscecheiterminidierroreui e u j associati alle i-esima e j-esima osservazione siano incorrelati. La presenza di correlazione tra questi due termini suggerisce che c è un informazione esplicativa addizionale contenuta nei dati che non è stata adeguatamente sfruttata nel modello. La correlazione tra i termini di disturbo è comunemente denominata autocorrelazione. Può verificarsi in diverse situazioni: I residui adiacenti tendono ad essere simili nelle dimensioni sia spaziali (dati provenienti da indagini cross-section) sia temporali (dati provenienti da serie storiche), in questo caso sono di solito correlati positivamente; autocorrelazione pura I sintomi dell autocorrelazione possono anche presentarsi quando una variabile esplicativa è stata omessa e, se la variabile è in seguito inclusa nel modello, il problema dell autocorrelazione è completamente risolto: in questo caso la violazione i è denominata autocorrelazione apparente. 24

25 3. Violazione dell ipotesi di incorrelazione degli errori re esidui 1 Dal grafico dei residui si evince un andamento ciclico dei residui 0 0,5 1 1,5 2 2,5 segnalando pertanto la violazione dell ipotesi i di Y stimata incorrelazione degli errori 0,8 0,6 04 0,4 0,2 0-0,2-0,4-0,6-0,8-1 -1,2 25

26 3. Violazione dell ipotesi di incorrelazione degli errori Effetti sui risultati dell analisi di regressione: Le stime dei minimi quadrati continuano ad essere non distorte ma non sono più efficienti; 2 σ Le stime di e di conseguenza, dell errore standard dei coefficienti di regressione possono risultare erroneamente ridotte, producendo un impressione falsata di accuratezza ed un R 2 esagerato; pertanto gli intervalli di confidenza ed i diversi test di significatività utilizzati comunemente nonsonopiù esattamente t validi. Per la diagnostica dell autocorrelazione pura il test più comunemente utilizzato è quello di Durbin-Watson 26

27 4. Violazione dell ipotesi di Normalità degli errori Si considerano i residui standardizzati, se gli errori sono normali, i residui standardizzati hanno approssimativamente una distribuzione normale con media zero e varianza 1: Il grafico invece evidenzia 60% di valori negativi, 84% di valori compresi tra [-1,1], quindi si può supporre una violazione dell ipotesi di normalità 27

28 4. Violazione dell ipotesi di Normalità degli errori Grafico di normalità P-P Si mettono a confronto la proporzione cumulata del residuo standardizzato (in ascissa) e la proporzione cumulata attesa nel caso in cui sia verificata l ipotesi di normalità (in ordinata). Se l ipotesi di normalità non è violata i punti tendono ad allinearsi lungo la bisettrice 28

29 5. Violazione dell ipotesi di assenza di collinearità perfetta COLLINEARITA PERFETTA. Sorge quando una delle variabili esplicative è una combinazione i lineare esatta (perfetta) delle altre variabili. In questo caso non è possibile procedere alla stima della regressione (lo stimatore OLS non è definito univocamente.) Esempi di collinearità (o multicollinearità) perfetta Errore sull introduzione di una variabile che semplicemente ripete una variabile già presente nel modello (ad esempio una espressa in frazione e un altra espressa in termini percentuali) Introduzione di una variabile dummy per la quale le osservazioni presentano tutte valore 1 (ad esempio la dummy prevede valore 1 se le osservazioni presentano un valore superiore ad un dato limite ma tutte le osservazioni hanno valori superiori) Trappola delle variabili dummy. Si presenta quando si introducono tutte le categorie di una variabile qualitativa come dummy. In generale con G variabili binarie (dummy) dobbiamo includere nel modello solo G-1 variabili (una dummy deve essere esclusa e rappresenterà la categoria di riferimento)

30 5. Violazione dell ipotesi di assenza di collinearità perfetta COLLINEARITA IMPERFETTA. Se la correlazione tra variabili è troppo alta è possibile che insorga qualche problema. La presenza di multicollinearità imperfetta non impedisce la stima della regressione ma le stime ottenute saranno inaffidabili con standard error elevati, con un segno o un valore inattesi. i In generale, si usa il termine multicollinearità per descrivere il problema posto dall esistenza di una relazione lineare approssimata fra le variabili esplicative che genera stime inaffidabili. Questa relazione può coinvolgere più di due regressori, persino tutti.

31 Misure per la collinearità imperfetta o quasi multicollinearità La diagnostica della quasi multicollinearità costituisce un processo più articolato. Un primo passo è osservare i valori della matrice di correlazione computata sull insieme delle variabili esplicative. Per diagnosticare la quasi multicollinerità si possono effettuare delle regressioni ausiliarie tra ogni variabile esplicativa e tutte le altre: se in alcune di tali regressioni si osserva un valore di R 2 molto elevato (es. superiore a 0,7) si diagnostica una quasi multicollinearità. Sulla base di tali regressioni ausiliarie può anche essere computato il VIF (Variance Inflation Factor), basato sul coefficiente di determinazione multiplo R 2 j relativo alla regressione della j-sima variabile bl esplicativa sulle altre k-1 VIF 1 = R 2 1 j Al variare di R 2 j il VIF assume di conseguenza i valori riportati nello schema seguente: Si sospetta una Q.M. per valori del VIF superiori a 3,5 comando in stata: estat vif 31

32 6. Presenza di valori anomali (outliers) Gli outliers sono osservazioni campionarie che presentano residui molto grandi rispetto al resto delle osservazioni Sul grafico dei residui la presenza di outliers è segnalata da punti isolati e molto distanti dagli altri La presenza di valori anomali può avere effetti rilevanti sulle stime di regressione È necessario indagare su tali valori per capire se essi siano imputabili a errori di rilevazione i oppure siano osservazioni i causate da eventi straordinari come scioperi, calamità naturali, 32

33 Esempio: valori anomali 2,00 re esidui stand dardizzati 150 1,50 1,00 0,50 0,00-0,500,00 5,00 10,00 15,00 20,00 25,00-1,00-1,50-2,00 Y stimati Possibili valori anomali 33

34 Esempio n.1 tratto dal testo Borra- Di Ciaccio La Quantità di precipitazioni e le Temperature medie registrate in 10 stazioni meteorologiche sono state le seguenti: Stazione Meteorologica PRECIPITAZIONI TEMPERATURA a) Determinare con il metodo dei minimi quadrati la retta di regressione relativa alla Quantità di Precipitazioni (y) in funzione della Temperatura media (x) b) Commentare i risultati ottenuti 34

35 Grafico di dispersione e retta stimata precip pitazioni temperatura 35

36 Risultati- Output Excel Errore Coefficienti standard Stat t p-value Intercetta 289,91 26,44 10,96 0,00 Temperatura -14,56 1,73-8,42 0,00 Dal valore dei p- value entrambi i coefficienti sono significativamente diversi da zero ANALISI VARIANZA gdl SQ MQ F P-value Regressione , , , ,00 Errore ,83 361,10 Totale ,00 Anche con il test t F il coefficiente Statistica della regressione della variabile R al quadrato 090 0,90 esplicativa è Errore standard 19,00 Il modello ha significativamente Osservazioni 10 un buon diverso da zero adattamento 36

37 OUTPUT RESIDUI Y Residui Osservazione prevista Residui standard 1 27,87 1,13 0, ,99-21,99-1, ,10 0,90 0, ,31 18,69 1, ,77-17, , ,24 15,24 0, ,43-16,43-0, , , , ,89 31,11 1, ,66-15,66-0,87 37

38 Grafico dei residui resid dui y stimata I residui sembrano disposti casualmente intorno allo zero 38

39 Grafico dei residui standardizzati ndar. res sidui sta y stimata 39

40 ESEMPIO N.2 Punti vendita Costi Ricavi Supponiamo di voler stimare sulla base delle seguenti osservazioni campionarie la relazione di dipendenza lineare dei ricavi i dai costi cavi ric costi 40

41 Risultati della regressione- Output Excel Errore Coefficienti standard Stat t p-value Intercetta -3,75 16,70-0,22 0,82 Variabile X 1,70 0,09 18,20 0,00 OUTPUT RIEPILOGO Statistica della regressione R al quadrato 0,95 Errore standard 29,91 Osservazioni 20 Dal valore del p- value l intercetta non è significativamente ifi i diversa da zero ANALISI VARIANZA gdl SQ MQ F p-value Regressione , ,59 331,07 0,00 Errore ,16 894,40 Totale ,75 41

42 Grafico dei residui 60 I residui sembrano 40 disposti casualmente intorno allo zero 20 res sidui y prevista 42

43 Grafico dei residui standardizzati residu ui I residui i standardizzati potrebbero suggerire una violazione dell ipotesi di normalità y stimata 43

44 Osservando il P-P P plot la violazione dell ipotesi di normalità è più evidente 44

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per

Dettagli

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

Analisi di Regressione Multipla

Analisi di Regressione Multipla Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi di Firenze

Dettagli

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

lezione 13 AA Paolo Brunori

lezione 13 AA Paolo Brunori AA 2016-2017 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Statistica per le ricerche di mercato. 11. La regressione lineare multipla

Statistica per le ricerche di mercato. 11. La regressione lineare multipla Statistica per le ricerche di mercato A.A. 2012/13 Dr. L.Secondi 11. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla estende il modello di regressione

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

ECONOMETRIA: Laboratorio III

ECONOMETRIA: Laboratorio III ECONOMETRIA: Laboratorio III Luca De Angelis CLASS - Università di Bologna Programma Laboratorio III Analisi della specificazione del modello e test diagnostici: Test per la forma funzionale del modello

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Statistica economica

Statistica economica Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati

Dettagli

Regressione semplice: come applicarla come interpretare i risultati

Regressione semplice: come applicarla come interpretare i risultati Regressione semplice: come applicarla come interpretare i risultati Questo materiale è utile ai fini dell esecuzione della regressione con software statistico. Questo materiale non è in alcun modo utile

Dettagli

Esercitazione 5 Sta/s/ca Aziendale

Esercitazione 5 Sta/s/ca Aziendale Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di

Dettagli

OLS multivariato: effetti parziali, multicollinearità

OLS multivariato: effetti parziali, multicollinearità OLS multivariato: effetti parziali, multicollinearità CONCETTI DA RECUPERARE Per stimare questo modello utilizziamo le seguenti variabili esplicative educ, exper e tenure Primo passo da compiere sarà quello

Dettagli

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte) Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Il modello di regressione lineare multipla

Il modello di regressione lineare multipla Il modello di regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi MRLM Econometria - 2014 1 / 31 Outline 1 Notazione 2 3 Collinearità Rossi MRLM Econometria - 2014

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Statistica per le ricerche di mercato. 14. La regressione lineare multipla

Statistica per le ricerche di mercato. 14. La regressione lineare multipla Statistica per le ricerche di mercato A.A. 2011/12 Prof.ssa Tiziana Laureti Dott. Luca Secondi 14. La regressione lineare multipla 1 Modello di regressione lineare multipla Il modello di regressione multipla

Dettagli

lezione 8 AA Paolo Brunori

lezione 8 AA Paolo Brunori AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Regressione lineare multipla

Regressione lineare multipla Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure

Dettagli

La regressione lineare semplice

La regressione lineare semplice La regressione lineare semplice Il modello di regressione lineare semplice - 1 y = β 0 + βx + ε 10 8 Una retta nel piano Variabile Y 6 4 2 0 0 1 2 3 4 Variabile X 1 Il modello di regressione lineare semplice

Dettagli

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare

Dettagli

Università di Pavia. Test diagnostici. Eduardo Rossi

Università di Pavia. Test diagnostici. Eduardo Rossi Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Correlazione 1 Come posso determinare il legame tra due o più variabili? Correlazione COEFFICIENTE DI CORRELAZIONE (r di Pearson) massimo consumo di ossigeno e prestazione nelle

Dettagli

ANALISI DELLE SERIE STORICHE

ANALISI DELLE SERIE STORICHE ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa

Dettagli

5. Per determinare il miglior grado del polinomio di una regressione polimoniale

5. Per determinare il miglior grado del polinomio di una regressione polimoniale Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Relazioni tra variabili (fenomeni) aziendali

Relazioni tra variabili (fenomeni) aziendali Relazioni tra variabili (fenomeni) aziendali - giornate di assenza dal lavoro è collegato a qualifica professionale, anzianità, sesso, dei dipendenti? - incidenti sul lavoro sono collegati a orario di

Dettagli

MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI

MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI ANALISI DELLA CORRELAZIONE MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI VINCOLI CHE SI IMPONGONO ALLA SUA UTILIZZAZIONE: LA RELAZIONE

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Rappresentazioni grafiche di distribuzioni doppie

Rappresentazioni grafiche di distribuzioni doppie Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

2. SPECIFICAZIONE DI UN MODELLO DI REGRESSIONE MULTIPLA

2. SPECIFICAZIONE DI UN MODELLO DI REGRESSIONE MULTIPLA CAPITOLO QUARTO IL MODELLO DI REGRESSIONE MULTIPLA SOMMARIO:. Introduzione. -. Specificazione di un modello di regressione multipla. - 3. Stima con il metodo dei minimi quadrati ordinari (OLS). - 4. Proprietà

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c. Stima dei parametri Sia il carattere X rappresentato da una variabile casuale (v.c.) che si distribuisce secondo la funzione di probabilità f(x). Per investigare su tale carattere si estrae un campione

Dettagli

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate Introduzione Notazione Modello additivo Verifica d ipotesi Sia X una variabile q-dimensionale, a valori reali, non degenere, osservata in k tempi diversi (τ 1, τ 2,..., τ k ), sulle stesse n unità statistiche

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Fare sempre il grafico! Fig. 5.12 pg 178, Statistica di S. Iacus Fare sempre il grafico! y 0 2 4 6 8 10 =-1 =+0.79 outlier o dato influente 0 2 4 6 8 10 x Inferenza Il modello

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2015 Rossi MRLM Econometria - 2015 1 / 39 Outline 1 Notazione 2 il MRLM - Assunzioni 3 OLS 4 Proprietà

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

Metodi Quantitativi per Economia, Finanza e Management

Metodi Quantitativi per Economia, Finanza e Management Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Lezione 3 1) Grafico a dispersione 2) La correlazione lineare -la covarianza funzione di excel: covarianza()

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Introduzione all'econometria (2) Introdurre la diagnostica necessaria per testare le ipotesi del modello lineare;

Introduzione all'econometria (2) Introdurre la diagnostica necessaria per testare le ipotesi del modello lineare; Introduzione all'econometria (2) Obiettivi di questo laboratorio: Introdurre la diagnostica necessaria per testare le ipotesi del modello lineare; Adattare il modello alle varie tipologie di dati (timeseries,

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII Indice XI XI XIII XV XVII L Editore ringrazia Ringraziamenti Autori Prefazione Obiettivi formativi XIX Istruzioni per gli studenti XIX Un po di storia XX Cosa è la Statistica XXI Come usare questo libro

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Destagionalizzazione, detrendizzazione delle serie storiche

Destagionalizzazione, detrendizzazione delle serie storiche DATA MINING PER IL MARKETING (63 ore) Marco Riani mriani@unipr.it Sito web del corso http://www.riani.it/dmm Destagionalizzazione, detrendizzazione delle serie storiche 1 Serie storica della vendita di

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana Presentazione dell edizione italiana Prefazione xiii xvii 1 Introduzione 1 1.1 Statistica e medicina.......................... 1 1.2 Statistica e matematica........................ 2 1.3 Statistica ed

Dettagli

Indipendenza, Dipendenza e interdipendenza

Indipendenza, Dipendenza e interdipendenza Indipendenza, Dipendenza e interdipendenza In analisi bivariata la tabella di contingenza consente di esaminare congiuntamente due variabili consente di rilevare le relazioni esistenti tra le variabili

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

ECONOMETRIA APPLICATA PER L IMPRESA. Eteroschedasticità nel modello di regressione

ECONOMETRIA APPLICATA PER L IMPRESA. Eteroschedasticità nel modello di regressione Omoschedasticità ed Eteroschedasticità 1 ECONOMETRIA APPLICATA PER L IMPRESA Eteroschedasticità nel modello di regressione Davide Raggi davide.raggi@unibo.it 24 febbraio 2010 Omoschedasticità ed Eteroschedasticità

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli