IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti"

Transcript

1 IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all econometria, Pearson, 2009

2 La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per il modello di regressione sono sempre state considerate valide. Quali conseguenze possono verificarsi in caso contrario? In generale il metodo di stima dei minimi quadrati risulta piuttosto robusto, ossia piccole violazioni delle ipotesi del modello non invalidano l inferenza o le conclusioni a cui esso conduce. Violazioni più consistenti per almeno una delle ipotesi possono comportare serie difficoltà nel processo di stima dei parametri o condurre a conclusioni gravemente fuorvianti. 2

3 Richiami alle ipotesi del modello 1. la linearità del modello 2. Assenza di multicollinearità esatta 3. Outlier estremi sono improbabili 4. le caratteristiche dell errore errore u i disturbi sono assunti normali ed indipendentemente distribuiti, con media 0 e varianza costante: Var( u X ) i 2 = σ u Euu ( ) = 0 i j i j i omoschedasticità Incorrelazione degli errori 3

4 Analisi dei residui standardizzazione dei residui Il metodo più semplice ed efficace per diagnosticare la maggior parte delle violazioni di ipotesi è l analisi dei residui In genere i residui e i hanno media nulla ma non varianza costante: ciò può rappresentare un inconveniente nell analisi diagnostica. Si può rimediare attraverso la standardizzazione (o «studentizzazione») dei residui. e is = ei stima dell ' errore standard di e i NB. Con il simbolo e i vengono indicati i residui stimati. In modo equivalente si può utilizzare il simbolo u i 4

5 Analisi dei residui standardizzazione dei residui I grafici più comunemente utilizzati consistono in diagrammi di dispersione che riportano i residui e is in ordinata mentre in ascissa possono essere rappresentate alternativamente le seguenti quantità: i valori stimati della variabile dipendente Ŷ i i valori osservati di una delle variabili indipendenti X j Se le assunzioni sono verificate tali diagrammi di dispersione danno luogo ad una nuvola di punti che non presenta particolari strutture. In particolare i punti del diagramma tendono a disporsi tra i valori 2 e 2 e risultano distribuiti casualmente intorno allo 0. 5

6 Esempio di diagramma di dispersione dei residui 2,5 2 1,5 1 0,5 e s i 0-0, ,5-2 Ŷ i Questo diagramma corrisponde al caso base in cui non si riscontrano violazioni delle assunzioni Un esame accurato dei residui, attraverso l osservazione dei relativi diagrammi di dispersione, costituisce una parte integrante dell analisi di regressione. 6

7 Le più comuni violazioni delle ipotesi del modello di regressione riguardano: 1. Linearità (relazione non lineare); 2. Omoschedasticità (presenza di eteroschedasticità); 3. Incorrelazione degli errori (errori correlati); 4. Normalità della distribuzione (errori non normali) 5. Assenza di collinearità perfetta (collinearità perfetta e imperfetta) 6. I valori anomali sono improbabili (Presenza di valori anomali-outlier) 7

8 La trasformazione di variabili Costituisce uno dei rimedi più efficaci in diversi casi di violazione delle assunzioni. Può consentire di raggiungere diversi scopi tra cui: a. assicurare la linearità della relazione b. conseguire la normalità c. stabilizzare la varianza dei termini di disturbo Nella pratica è molto comune la stima di un modello su variabili trasformate piuttosto che su quelle originali 8

9 Alcuni esempi di trasformazione delle variabili La trasformazione delle variabili può essere applicata alternativamente alla variabile risposta, alla variabile esplicativa (o - nel caso di più variabili indipendenti - ad alcune di esse) oppure ad entrambe. Lo schema seguente riporta alcuni dei più comuni tipi di modello sui quali è stata applicata una trasformazione di variabile nel caso base di una regressione semplice 1) Y = α + βx + u Utile in caso di ipotesi di non normalità degli errori 2) logy = α + βx + u 3) Y = α + βlog X + u Utile per la stabilizzazione della varianza degli errori Utile per linearizzare una relazione non lineare 4) log Y = logα + βx + logu Linearizzazione della relazione β X Y = αe u 9

10 1. Violazione dell ipotesi di linearità Un modello di regressione è lineare quando è lineare nei parametri. Quando la relazione non è lineare, i parametri del modello di regressione perdono di significato e le stime del valor medio e la previsione del singolo valore per un dato valore di X potrebbero risultare fortemente distorte Si può diagnosticare principalmente attraverso due tecniche: 1. l analisi del diagramma di dispersione realizzato sulla base dei punti campionari; tale strumento consente però di analizzare solo la relazione tra la variabile dipendente e una variabile esplicativa per volta (nel caso di analisi di regressione multivariata, non sarebbe possibile valutare la struttura globale dei dati) 2. osservando una certa struttura nel diagramma di dispersione dei residui (es. crescente o decrescente) Si può risolvere con opportune trasformazioni di variabili Per avvalorare l ipotesi che la relazione stimata sia lineare nella trasformata di una o più variabili originarie si esaminano i residui della nuova regressione e si verifica che non presentino nessuna particolare struttura 10

11 Un esempio di violazione dell ipotesi di linearità 1. I dati Si supponga che si desideri misurare le vendite di un nuovo prodotto in relazione allo svolgimento della relativa campagna pubblicitaria Dati campionari Diagramma di dispersione dei punti campionari Vendite * Giorni di campagna pubblicitaria Si può stimare un modello lineare Ma il diagramma scatter fa supporre una relazione non lineare presumibilmente esponenziale 11

12 Un esempio di violazione dell ipotesi di linearità 2. I residui Il diagramma dei residui - rappresentati rispetto ai valori stimati della variabile risposta con un modello lineare - mostra non una disposizione casuale intorno allo zero ma una particolare struttura curvilinea che indica una relazione effettivamente non lineare Diagramma di dispersione dei residui 2 1,5 1 Residui stud. 0, , ,5-2 Vendite (valori stimati) 12

13 Un esempio di violazione dell ipotesi di linearità 3. Linearizzazione Si ipotizza una relazione esponenziale del tipo β* gg _ pubblicità vendite = αe u L applicazione del logaritmo naturale ad ambo i membri dell equazione di regressione conduce ad un modello linearizzato come segue log(vendite) = logα + β * gg_pubblicità + log u vendite = α + β* gg_pubblicità + u dove vendite = log(vendite) ; α = logα; u = log u. La stima del modello linearizzato si esegue semplicemente effettuando la regressione del logaritmo naturale delle vendite sulla variabile esplicativa 13

14 Un esempio di violazione dell ipotesi di linearità 3. Linearizzazione Si ipotizza una relazione esponenziale del tipo β1 i gg _ pubblicità vendite = β e u 0 L applicazione del logaritmo naturale ad ambo i membri dell equazione di regressione conduce ad un modello linearizzato come segue log(vendite) = logβ + β igg_pubblicità + log u ' vendite = β + β1igg_pubblicità + u dove vendite = log(vendite) ; α = logα; u = log u. La stima del modello linearizzato si esegue semplicemente effettuando la regressione del logaritmo naturale delle vendite sulla variabile esplicativa 14

15 Un esempio di violazione dell ipotesi di linearità 4. Stime Stima del modello linearizzato vendite = 2,55 + 0,21* gg _ pubblicità STIMA Stima del modello esponenziale nella forma originaria venditestima = 12,84 e 0,21* gg _ pubblicità Diagrammi di dispersione dei punti campionari e dei residui 15

16 2. Violazione dell ipotesi di omoschedasticità Può essere facilmente diagnosticata attraverso l analisi del diagramma di dispersione dei residui, dove i residui standardizzati (ovvero studentizzati) sono riportati in ordinata contro le variabili esplicative alternativamente in ascissa. Si diagnostica una violazione dell assunzione di omoschedasticità quando la varianza degli errori tende a crescere o a decrescere al crescere della variabile esplicativa rappresentata. Residui studentizzati 2,5 2 1,5 1 0,5 0-0,5-1 -1,5-2 -2,5-3 presenza di eteroschedasticità relazione crescente Variabile X Residui studentizzati 2 1,5 1 0,5 0-0,5-1 -1,5-2 presenza di eteroschedasticità relazione decrescente Variabile X Se la banda in cui giacciono i punti tende ad allargarsi o a restringersi si può ipotizzare una situazione di eteroschedasticità; Se invece i punti giacciono tra due parallele non si riscontra evidenza di violazione dell assunzione. 16

17 OMOSCHEDASTICITA E(u X=x) = 0 (u soddisfa la prima assunzione dei Minimi Quadrati) La varianza di u non cambia con x (non dipende da x)

18 ETEROSCHEDASTICITA E(u X=x) = 0 (u soddisfa la prima assunzione dei Minimi Quadrati) La varianza di u dipende da x. Quindi siamo in presenza di Eteroschedasticità

19 Implicazioni della presenza di eteroschedasticità L omoschedasticità e l eteroschedasticità riguardano la varianza degli errori var(u X=x) e quindi la stima dell errore standard dei coefficienti. La formula utilizzata per SE(b1) vale nel caso di errori omoschedastici ( ) SE b 1 = n i= 1 s 2 ( x x) i 2 NB. Nel libro di testo viene utilizzata una formula più generale (Eicker-Huber- White) che nel caso di eteroschedasticità produce stime robuste. Questa formula non è però implementata in Excel. Il testo chiama la formula precedente formula per l omoschedasticità pura In presenza di eteroschedasticità utilizzando la formula precedente che vale nel caso di errori omoschedastici si ottengono errori standand errati (e quindi errati statistica t e intervalli di confidenza)

20 Implicazioni della presenza di eteroschedasticità Problemi La presenza di eteroschedasticità comporta conseguenze rilevanti sulle stime dei parametri. In particolare: le stime dei minimi quadrati sono ancora corrette, ma non sono più efficienti (a varianza minima); la stima della varianza (e quindi dell errore standard) è distorta, il che tende a invalidare i test di significatività. Diagnostica Numerosi test: Kendall e Stuart; Breusch-Pagan; Goldfeld e Quandt; Glesjer; White. Soluzioni Trasformazione logaritmica della variabile risposta Metodo dei minimi quadrati pesati 20

21 3. Violazione dell ipotesi di incorrelazione degli errori L ipotesi di non correlazione degli errori stabilisce che i termini di errore ui e u j associati alle i-esima e j-esima osservazione siano incorrelati. La presenza di correlazione tra questi due termini suggerisce che c è un informazione esplicativa addizionale contenuta nei dati che non è stata adeguatamente sfruttata nel modello. La correlazione tra i termini di disturbo è comunemente denominata autocorrelazione. Può verificarsi in diverse situazioni: I residui adiacenti tendono ad essere simili nelle dimensioni sia spaziali (dati provenienti da indagini cross-section) sia temporali (dati provenienti da serie storiche), in questo caso sono di solito correlati positivamente; autocorrelazione pura I sintomi dell autocorrelazione possono anche presentarsi quando una variabile esplicativa è stata omessa e, se la variabile è in seguito inclusa nel modello, il problema dell autocorrelazione è completamente risolto: in questo caso la violazione è denominata autocorrelazione apparente. 21

22 3. Violazione dell ipotesi di incorrelazione degli errori residui 1 0,8 0,6 0,4 0,2 0-0,2-0,4-0,6-0,8-1 -1,2 0 0,5 1 1,5 2 2,5 Y stimata Dal grafico dei residui si evince un andamento ciclico dei residui segnalando pertanto la violazione dell ipotesi di incorrelazione degli errori 22

23 3. Violazione dell ipotesi di incorrelazione degli errori Effetti sui risultati dell analisi di regressione: Le stime dei minimi quadrati continuano ad essere non distorte ma non sono più efficienti; 2 σ Le stime di e di conseguenza, dell errore standard dei coefficienti di regressione possono risultare erroneamente ridotte, producendo un impressione falsata di accuratezza ed un R 2 esagerato; pertanto gli intervalli di confidenza ed i diversi test di significatività utilizzati comunemente non sono più esattamente validi. Per la diagnostica dell autocorrelazione pura il test più comunemente utilizzato è quello di Durbin-Watson 23

24 4. Violazione dell ipotesi di Normalità degli errori Si considerano i residui standardizzati, se gli errori sono normali, i residui standardizzati hanno approssimativamente una distribuzione normale con media zero e varianza 1: Il grafico invece evidenzia 60% di valori negativi, 84% di valori compresi tra [-1,1], quindi si può supporre una violazione dell ipotesi di normalità 24

25 4. Violazione dell ipotesi di Normalità degli errori Grafico di normalità P-P Si mettono a confronto la proporzione cumulata del residuo standardizzato (in ascissa) e la proporzione cumulata attesa nel caso in cui sia verificata l ipotesi di normalità (in ordinata). Se l ipotesi di normalità non è violata i punti tendono ad allinearsi lungo la bisettrice 25

26 5. Violazione dell ipotesi di assenza di collinearità perfetta COLLINEARITA PERFETTA. Sorge quando una delle variabili esplicative è una combinazione lineare esatta (perfetta) delle altre variabili. In questo caso non è possibile procedere alla stima della regressione (lo stimatore OLS non è definito univocamente.) Esempi di collinearità (o multicollinearità) perfetta Errore sull introduzione di una variabile che semplicemente ripete una variabile già presente nel modello (ad esempio una espressa in frazione e un altra espressa in termini percentuali) Introduzione di una variabile dummy per la quale le osservazioni presentano tutte valore 1 (ad esempio la dummy prevede valore 1 se le osservazioni presentano un valore superiore ad un dato limite ma tutte le osservazioni hanno valori superiori) Trappola delle variabili dummy. Si presenta quando si introducono tutte le categorie di una variabile qualitativa come dummy. In generale con G variabili binarie (dummy) dobbiamo includere nel modello solo G-1 variabili (una dummy deve essere esclusa e rappresenterà la categoria di riferimento)

27 5. Violazione dell ipotesi di assenza di collinearità perfetta COLLINEARITA IMPERFETTA. Se la correlazione tra variabili è troppo alta è possibile che insorga qualche problema. La presenza di multicollinearità imperfetta non impedisce la stima della regressione ma le stime ottenute saranno inaffidabili con standard error elevati, con un segno o un valore inattesi. In generale, si usa il termine multicollinearità per descrivere il problema posto dall esistenza di una relazione lineare approssimata fra le variabili esplicative che genera stime inaffidabili. Questa relazione può coinvolgere più di due regressori, persino tutti.

28 6. Presenza di valori anomali (outliers) Gli outliers sono osservazioni campionarie che presentano residui molto grandi rispetto al resto delle osservazioni Sul grafico dei residui la presenza di outliers è segnalata da punti isolati e molto distanti dagli altri La presenza di valori anomali può avere effetti rilevanti sulle stime di regressione È necessario indagare su tali valori per capire se essi siano imputabili a errori di rilevazione oppure siano osservazioni causate da eventi straordinari come scioperi, calamità naturali, 28

29 Esempio: valori anomali 2,00 residui standardizzati 1,50 1,00 0,50 0,00-0,500,00 5,00 10,00 15,00 20,00 25,00-1,00-1,50-2,00 Y stimati Possibili valori anomali 29

30 Esempio n.1 tratto dal testo Borra- Di Ciaccio La Quantità di precipitazioni e le Temperature medie registrate in 10 stazioni meteorologiche sono state le seguenti: Stazione Meteorologica PRECIPITAZIONI TEMPERATURA a) Determinare con il metodo dei minimi quadrati la retta di regressione relativa alla Quantità di Precipitazioni (y) in funzione della Temperatura media (x) b) Commentare i risultati ottenuti 30

31 Grafico di dispersione e retta stimata 31

32 Risultati- Output Excel Coefficienti Errore standard Stat t p-value Intercetta 289,91 26,44 10,96 0,00 Temperatur a -14,56 1,73-8,42 0,00 ANALISI VARIANZA gdl SQ MQ F P-value Regressione , ,17 70,95 0,00 Errore ,83 361,10 Totale ,00 Statistica della regressione R al quadrato 0,90 Errore standard 19,00 Osservazioni 10 Il modello ha un buon adattamento Dal valore dei p- value entrambi i coefficienti sono significativamente diversi da zero Anche con il test F il coefficiente della variabile esplicativa è significativamente diverso da zero 32

33 OUTPUT RESIDUI Osservazione Y prevista Residui Residui standard 1 27,87 1,13 0, ,99-21,99-1, ,10 0,90 0, ,31 18,69 1, ,77-17,77-0,99 6-1,24 15,24 0, ,43-16,43-0, ,22 4,78 0, ,89 31,11 1, ,66-15,66-0,87 33

34 Grafico dei residui I residui sembrano disposti casualmente intorno allo zero 34

35 Grafico dei residui standardizzati 35

36 ESEMPIO N.2 Punti Costi Ricavi vendita Supponiamo di voler stimare sulla base delle seguenti osservazioni campionarie la relazione di dipendenza lineare dei ricavi dai costi 36

37 Errore Coefficienti standard Stat t p-value Intercetta -3,75 16,70-0,22 0,82 Variabile X 1,70 0,09 18,20 0,00 OUTPUT RIEPILOGO Risultati della regressione- Output Excel Statistica della regressione R al quadrato 0,95 Errore standard 29,91 Osservazioni 20 Dal valore del p- value l intercetta non è significativamente diversa da zero ANALISI VARIANZA gdl SQ MQ F p-value Regressione , ,59 331,07 0,00 Errore ,16 894,40 Totale ,75 37

38 Grafico dei residui I residui sembrano disposti casualmente intorno allo zero 38

39 Grafico dei residui standardizzati I residui standardizzati potrebbero suggerire una violazione dell ipotesi di normalità 39

40 Osservando il P-P plot la violazione dell ipotesi di normalità è più evidente 40

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica Regressione Lineare e Correlazione Argomenti della lezione Determinismo e variabilità Correlazione Regressione Lineare

Dettagli

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

Università di Pavia. Test diagnostici. Eduardo Rossi

Università di Pavia. Test diagnostici. Eduardo Rossi Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento Capitolo Suggerimenti agli esercizi a cura di Elena Siletti Esercizio.: Suggerimento Per verificare se due fenomeni sono dipendenti in media sarebbe necessario confrontare le medie condizionate, in questo

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati: Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Giorno n. clienti di attesa

Giorno n. clienti di attesa Esercizio 1 Un aspetto cruciale per la qualità del servizio ai clienti in un supermercato è il cosiddetto checkout (ovvero il tempo che il cliente impiega dal momento in cui si mette in fila alla cassa

Dettagli

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Regressione lineare semplice: inferenza

Regressione lineare semplice: inferenza Regressione lineare semplice: inferenza Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Regressione lineare semplice Econometria - 2014 1 / 60 Outline 1 Introduzione 2 Verifica di ipotesi

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice

Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Corso di laurea in Statistica Statistica I Esercizi sulla regressione lineare semplice Esercizio 1 Efficacia di un disinfettante I dati della Tabella 1 mostrano i conteggi relativi alla presenza o meno

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Capitolo 6 La distribuzione normale

Capitolo 6 La distribuzione normale Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA PROCEDURA/TECNICA DI ANALISI DEI DATI SPECIFICAMENTE DESTINATA A STUDIARE LA RELAZIONE TRA UNA VARIABILE NOMINALE (ASSUNTA

Dettagli

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Capitolo 6. La distribuzione normale

Capitolo 6. La distribuzione normale Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Funzioni di regressione non lineari

Funzioni di regressione non lineari Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Distribuzioni campionarie

Distribuzioni campionarie 1 Inferenza Statistica Descrittiva Distribuzioni campionarie Statistica Inferenziale: affronta problemi di decisione in condizioni di incertezza basandosi sia su informazioni a priori sia sui dati campionari

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo UIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECOOMIA Corso di laurea in Economia Aziendale anno accademico 2012/2013 Lezioni di Statistica del 15 e 18 aprile 2013 Docente: Massimo Cristallo LA RELAZIOE

Dettagli

Statistica descrittiva: misure di associazione

Statistica descrittiva: misure di associazione Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

REGRESSIONE E CORRELAZIONE

REGRESSIONE E CORRELAZIONE REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016 Esercitazione 12 maggio 2016 ESERCIZIO 1 Si supponga che in un sondaggio di opinione su un campione di clienti, che utilizzano una carta di credito di tipo standard (Std) o di tipo business (Bsn), si siano

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) LA DISTRIBUZIONE NORMALE (Vittorio Colagrande) Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densità), si può far ricorso nell analisi statistica alla

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

Il Modello di Scomposizione

Il Modello di Scomposizione Approccio Classico: Metodi di Scomposizione Il Modello di Scomposizione Il modello matematico ipotizzato nel metodo classico di scomposizione è: y t =f(s t, T t, E t ) dove y t è il dato riferito al periodo

Dettagli

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente TEST DI AUTOVALUTAZIONE - SETTIMANA 6 I diritti d autore sono riservati. Ogni sfruttamento commerciale non autorizzato sarà perseguito. Metodi statistici per la biologia Parte A. La retta di regressione.2

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 007/008 ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti A cura di: Ing.

Dettagli

Analisi dei Dati Tabelle e Grafici

Analisi dei Dati Tabelle e Grafici Analisi dei Dati Tabelle e Grafici Spesso una misurazione consiste nello studio di una grandezza,y i in funzione di un altra, x i. Esempi: o lo spazio percorso da un oggetto in funzione di un intervallo

Dettagli

Validazione ediagnostica

Validazione ediagnostica Validazione ediagnostica Il processo di identificazione di un modello di regressione consiste nell iterazione delle seguenti fasi: 1. formulazione di un modello provvisorio 2. stima dei parametri 3. critica

Dettagli

GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti

GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE a.a. 2007/2008 GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti A cura di: Ing. Giovanna

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, ) Università degli Studi di Milano Bicocca Scuola di Economia e Statistica Corso di Laurea in Economia e Amministrazione delle Imprese (ECOAMM) Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE

Dettagli

La regressione logistica

La regressione logistica La regressione logistica Supponiamo che la variabile di interesse y sia una variabile dicotoma, che assuma solo i valori 0 ovvero 1, corrispondenti a successo o insuccesso. Sia p = P (S) = P (Y = 1) la

Dettagli

Indagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica

Indagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica Indagine sulle forze di lavoro nel Comune di Firenze. Nota metodologica 1. Procedimento di stima La maggior parte dei caratteri che si rilevano nell indagine sulle Forze di Lavoro sono di tipo qualitativo.

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Regressione e Correlazione (cap. 11) Importazione dati da file di testo

Regressione e Correlazione (cap. 11) Importazione dati da file di testo Regressione e Correlazione (cap. 11) Importazione dati da file di testo Introduzione Nella statistica applicata si osserva la relazione (dipendenza) tra due o più grandezze. Esigenza: determinare una funzione

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1 Modelli lineari Come motivazione di ciò che stiamo per fare, pensiamo ai dati indicatori_benessere.txt. Quando li abbiamo esaminati nella lezione 1 tramite la rappresentazione nel piano delle componenti

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

Caratterizzazione dei consumi energetici (parte 3)

Caratterizzazione dei consumi energetici (parte 3) ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale

Dettagli

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2010/2011 Statistica Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza

Dettagli

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57

Dettagli

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica 13. Regressione lineare parametrica Esistono numerose occasioni nelle quali quello che interessa è ricostruire la relazione di funzione che lega due variabili, la variabile y (variabile dipendente, in

Dettagli

Modelli per variabili dipendenti limitate. Amedeo Argentiero.

Modelli per variabili dipendenti limitate. Amedeo Argentiero. Modelli per variabili dipendenti limitate Amedeo Argentiero amedeo.argentiero@unipg.it Problema 1. Si desidera stimare la probabilità di accadimento di un evento (essere disoccupato, probabilità di sposarsi,

Dettagli

Strumenti di indagine per la valutazione psicologica

Strumenti di indagine per la valutazione psicologica Strumenti di indagine per la valutazione psicologica 1.5 Correlazione e causazione Davide Massidda davide.massidda@gmail.com Metodi simmetrici vs asimmetrici Relazioni tra variabili Nei metodi di studio

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

8. ANALISI DELLA COVARIANZA (ANCOVA)

8. ANALISI DELLA COVARIANZA (ANCOVA) 8. ANALISI DELLA COVARIANZA (ANCOVA) L analisi della covarianza è un metodo statistico che risulta dalla combinazione dell analisi di regressione con l analisi della varianza. È utile quando all analisi

Dettagli

Trasformazioni Logaritmiche

Trasformazioni Logaritmiche Trasformazioni Logaritmiche Una funzione y = f(x) può essere rappresentata in scala logaritmica ponendo Si noti che y = f(x) diventa ossia Quando mi conviene? X = log α x, Y = log α y. log α (x) = log

Dettagli

lezione 6 AA Paolo Brunori

lezione 6 AA Paolo Brunori AA 2016-2017 Paolo Brunori consumo di tabacco in Turchia 1960-1988 fonte: Tansel, 1993, pubblicato su Applied Economics consumo di tabacco in Turchia fra il 1960 al 1988 year = anno Q = quantità pro capite

Dettagli

Esercizi riassuntivi di Inferenza

Esercizi riassuntivi di Inferenza Esercizi riassuntivi di Inferenza Esercizio 1 Un economista vuole stimare il reddito medio degli abitanti di una cittadina mediante un intervallo al livello di confidenza del 95%. La distribuzione del

Dettagli

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012 Prova scritta di Complementi di Probabilità e Statistica 7 Dicembre. Un ingegnere vuole investigare se le caratteristiche di una superficie metallica sono influenzate dal tipo di pittura usata e dal tempo

Dettagli

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl 1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per

Dettagli

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta): ESERCIZIO 1 Una grande banca vuole stimare l ammontare medio di denaro che deve essere corrisposto dai correntisti che hanno il conto scoperto. Si seleziona un campione di 100 clienti su cui si osserva

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

La regressione Generalità sulla regressione

La regressione Generalità sulla regressione Capitolo VIII La regressione 8.1. Generalità sulla regressione L analisi di regressione è una tecnica statistica semplice e potente che esamina la relazione esistente tra una variabile dipendente ed una

Dettagli

Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16

Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16 Scale Logaritmiche Scala Logaritmica: sull asse prescelto (ad esempio, l asse x) si rappresenta il punto di ascissa = 0 0 nella direzione positiva si rappresentano, a distanze uguali fra di loro, i punti

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni

MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni Attendibilità Misurazione I problemi di misurazione degli oggetti di studio sono comuni a tutte le discipline scientifiche. In psicologia il problema è solo più evidente, non più grave. I costrutti che

Dettagli

ESERCITAZIONE IV - Soluzioni

ESERCITAZIONE IV - Soluzioni umero di omicidi ESERCITAZIOE IV - Soluzioni Esercizio I. a),00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 0 5 10 15 20 25 Popolazione povera (%) b) Poiché i due caratteri in analisi sono quantitativi per calcolare

Dettagli

Università degli Studi di Padova Facoltà di Scienze Politiche

Università degli Studi di Padova Facoltà di Scienze Politiche Università degli Studi di Padova Facoltà di Scienze Politiche STATISTICA Nuovo ordinamento Scienze Sociologiche Prof.ssa A. Dalla Valle Vecchio ordinamento Prova del 27/6/2007 (A) Cognome e nome: N. matricola:

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Intervalli di confidenza Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 10 Dicembre 2014 Stefania Spina Esercitazioni di statistica 1/43 Stefania Spina

Dettagli

Microeconomia (C.L. Economia e Legislazione di Impresa); A.A. 2010/2011 Prof. C. Perugini

Microeconomia (C.L. Economia e Legislazione di Impresa); A.A. 2010/2011 Prof. C. Perugini Microeconomia (C.L. Economia e Legislazione di Impresa); A.A. 010/011 Prof. C. Perugini Esercitazione n.1 1 Obiettivi dell esercitazione Ripasso di matematica Non è una lezione di matematica! Ha lo scopo

Dettagli

Una stima aggregata dell effetto Brunetta Risultati molto preliminari

Una stima aggregata dell effetto Brunetta Risultati molto preliminari Una stima aggregata dell effetto Brunetta Risultati molto preliminari Leonello Tronti (Consigliere economico del Ministro) Seminario Assenteismo: i lavori della commissione 22 giugno 2009 Ipotesi di lavoro

Dettagli

Modelli Multilineari e Misure di adeguatezza del modello

Modelli Multilineari e Misure di adeguatezza del modello Metodi di Analisi dei Dati Sperimentali AA /2010 Pier Luca Maffettone Modelli Multilineari e Misure di adeguatezza del modello Sommario Regressione multilineare Coefficiente di determinazione (modelli

Dettagli

La regressione fuzzy. Capitolo I limiti della regressione classica. a cura di Fabrizio Maturo

La regressione fuzzy. Capitolo I limiti della regressione classica. a cura di Fabrizio Maturo Capitolo 14 La regressione fuzzy a cura di Fabrizio Maturo 14.1 I limiti della regressione classica L analisi di regressione offre una possibile soluzione per studiare l effetto di una o più variabili

Dettagli