STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "STATISTICA. Regressione-3 L inferenza per il modello lineare semplice"

Transcript

1 STATISTICA Regressione-3 L inferenza per il modello lineare semplice

2 La bontà della regressione Per fare un buon modello lineare serve: una correlazione alta, che dice che i dati stanno vicini alla retta alcune ipotesi che dicano che il meccanismo che genera i dati è (ragionevolmente) lineare

3 Inferenza Il modello della regressione lineare semplice: = = + + ~(, ) = + + ~( +, )

4 Inferenza Il modello della regressione lineare semplice: = + ~(, ) Il valore medio di in corrispondenza a tutte le unità statistiche per cui = è + = + + = + ~( +, )

5 Inferenza Il modello della regressione lineare semplice: = + ~(, ) Il valore medio di in corrispondenza a tutte le unità statistiche per cui = è + = + + = ~( +, )

6 Inferenza Il modello della regressione lineare semplice: = = + + ~(, ) Il modello ha tre parametri incogniti:,, 1. Stimare, e = Verificare se il vero valore della pendenza nella popolazione è davvero diverso da zero ( previsione) oppure no: = 0, 0

7 Inferenza = + ~(, ) = + = + + = + = = 0 = = = ( )( ) ( )

8 Inferenza = + ~(, ) = + = + + = + = = 0 = 1 2 stima di varianza degli errori errori residui

9 Inferenza dalle stime agli stimatori: = ( )( ) ( ) = ~(0, ) ~( +, ) = 1 2 e v.c. gaussiane = 0 0 rifiutiamo se: (rifiutiamo la casualità di una pendenza 0) ( ) > ( )

10 Inferenza dalle stime agli stimatori: = ( )( ) ( ) = ~(0, ) ~( +, ) = 1 2 e v.c. gaussiane = rifiutiamo se: ( ) > ( )

11 Inferenza dalle stime agli stimatori: = ( )( ) ( ) = ~(0, ) ~( +, ) = 1 2 e v.c. gaussiane = rifiutiamo se: 1 + ( ) > ( )

12 Inferenza per la previsione ( 2) ( ) ( ) IC della risposta di un nuovo individuo con covariata pari a

13 Inferenza per la previsione ( 2) ( ) ( ) IC della risposta media di tutti gli individui con covariata pari a

14 Il modello di regressione lineare = + +, ~(, ) In questo modello, mi aspetto di osservare il valore (sulla retta), ma l incertezza del fenomeno può produrre un osservazione che non sta sulla retta. Questo errore, =, è supposto gaussiano, quindi non può essere troppo grande (" 3, 3"), e deve essere simmetrico, nel senso che l istogramma degli deve dare una «campana» simmetrica. w Y X

15 Il modello di regressione lineare = + +, ~(, ) GRAFICO DEI RESIDUI nell ordine dei dati = non sono «troppo grandi»: ( 3, +3 ); - sono in parte positivi e in parte negativi; - il loro grafico è sparpagliato.

16 Facciamo un salto in e in Francia! Voto per Macron (%) Disoccupazione (%)

17 Facciamo un salto in e in Francia! Voto per Macron (%) Disoccupazione (%)

18 Facciamo un salto in e in Francia! RESIDUI Index

19 Verifica della Gaussianità res

20 Verifica della Gaussianità res

21 Verifica della Gaussianità La varianza non è costante

22 Verifica della Gaussianità Quantili dei residui standardizzati Q-Q plot Quantili di una (0,1)

23 Verifica della Gaussianità Quantili dei residui standardizzati Q-Q plot Quantili di una (0,1) dato anomalo/ outlier Ci sono tecniche di diagnostica ad hoc

24 Verifica della Gaussianità

25 Facciamo un salto in e in Francia! Residui standardizzati Standardized Residuals Quantiles Normal Q-Q Plot Theoretical Quantiles

26 Facciamo un salto in e in Francia! Normal Q-Q Plot Standardized Residuals Quantiles Shapiro-Wilks (Madansky, p. 20) > shapiro.test(«residui») Shapiro-Wilk normality test (test di regressione, cfr. di varianze) Theoretical Quantiles

27 Facciamo un salto in e in Francia! RESIDUI Breusch-Pagan test (Madansky, p. 81) > library(car) > ncvtest(«lm») Non-constant Variance Score Test Durbin-Watson test (Madansky, p. 93) > library(car) > durbinwatsontest(«lm») Alternative hypothesis: rho!= 0 Index

28 Facciamo un salto in e in Francia! Voto per Macron IC della previsione del voto in un dipartimento con disoccupazione Voto per Macron IC della previsione del voto medio dei dipartimenti con disoccupazione Tasso di disoccupazione Tasso di disoccupazione

29 Facciamo un salto in Voto per Macron e in Francia! IC della previsione del voto in un dipartimento con disoccupazione I dati che cadano fuori dall IC sono sospetti! Voto per Macron IC della previsione del voto medio dei dipartimenti con disoccupazione Tasso di disoccupazione Tasso di disoccupazione

30 Esercizio di compito HDI L'indice di sviluppo umano (ISU) (in inglese: HDI-Human Development Index) è un indice comparativo dello sviluppo dei vari paesi calcolato tenendo conto dei diversi tassi di aspettativa di vita, istruzione e reddito nazionale lordo procapite. dati: gdp-hdi-2105.txt (si ringrazia la studentessa M. Lintner)

31 Esercizio residui Index Residuals

32 Esercizio Normal Q-Q Plot Standardized Residuals Quantiles HDI Theoretical Quantiles Log(GDP) morale della favola:

33 Outlier e dati influenti

34 Outlier e dati influenti PIL-Human Development Index HDI log(pil) 10xHDI log(pil) dati: gdp-hdi-2105.txt

35 Outlier e dati influenti PIL-Human Development Index HDI log(pil) 10xHDI log(pil) dati: gdp-hdi-2105.txt

36 Outlier e dati influenti Y X

37 Outlier e dati influenti Y E un outlier rispetto a X? Lo è rispetto a Y? Che effetto ha sulla retta dei minimi quadrati? X

38 Outlier e dati influenti Y E un outlier rispetto a X? Lo è rispetto a Y? Che effetto ha sulla retta dei minimi quadrati? dato influente (leverage) X

39 Outlier e dati influenti Y E un outlier rispetto a X? Lo è rispetto a Y? Che effetto ha sulla retta dei minimi quadrati? X

40 Outlier e dati influenti PIL-Human Development Index > influence.measures Regression Deletion Diagnostics Description This suite of functions can be used to compute some of the regression (leave-one-out deletion) diagnostics for linear and generalized linear models discussed in Belsley, Kuh and Welsch (1980), Cook and Weisberg (1982), etc. HDI log(pil) dati: gdp-hdi-2105.txt

41 Facciamo un salto in e in Francia! Stipendio medio orario 2013

42 Facciamo un salto in Voto per Macron (%) = Stipendio medio/h 2013

43 Facciamo un salto in Voto per Macron (%) =. influenti? outlier? Stipendio medio/h 2013

44 Facciamo un salto in Voto per Macron (%) = Stipendio medio/h 2013

45 Facciamo CI VOGLIAMO PROPRIO un salto FAR PASSARE in R IN MEZZO UNA RETTA? UNA PARABOLA, UN IPERBOLE, UNA FUNZIONE SINUSOIDALE?! =. Voto per Macron (%) Stipendio medio/h 2013

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Fare sempre il grafico! Fig. 5.12 pg 178, Statistica di S. Iacus Fare sempre il grafico! y 0 2 4 6 8 10 =-1 =+0.79 outlier o dato influente 0 2 4 6 8 10 x Inferenza Il modello

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

STATISTICA. Regressione-2

STATISTICA. Regressione-2 STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante

Dettagli

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Regressione-4 ovvero Macron! STATISTICA Regressione-4 ovvero Macron! Eravamo partiti da qui Stipendio medio orario 2013 Voto per Le Pen Stipendio medio orario (2013) [11,12) [12,13) [13,14) [14,15) [15,23] Eravamo partiti da qui Stipendio

Dettagli

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

lezione 8 AA Paolo Brunori

lezione 8 AA Paolo Brunori AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2018/2019 prof. Federico Plazzi 28 Giugno 2019 Nome: Cognome: Matricola: Alcune indicazioni: La prova è costituita da cinque esercizi; dopo

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

STATISTICA. Esercitazione 5

STATISTICA. Esercitazione 5 STATISTICA Esercitazione 5 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale due compiti diversi con i seguenti risultati: Compito A Compito B Numero studenti 102 105 Media dei

Dettagli

STATISTICA. Regressione-1

STATISTICA. Regressione-1 STATISTICA Regressione-1 Associazione Voto per Macron e tasso di disoccupazione Appartenenza etnica e preferenze politiche Esposizione ad una data sostanza e insorgenza di malattie Livello sociale della

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 27 Febbraio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da cinque esercizi;

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI

PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI 1 PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI In merito al programma del corso B di statistica già pubblicato con i relativi riferimenti

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Popolazione e prodotto pro capite dal 1950 al 2003

Popolazione e prodotto pro capite dal 1950 al 2003 Prodotto pro capite Human Development Index Popolazione e prodotto pro capite dal 1950 al 2003 (a) Stati Uniti (b) Cina (c) Italia Fonte: Maddison project, 2010. Prodotto pro capite 1980-2009 Prodotto

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione LM 88 SOCIOLOGIA E RICERCA SOCIALE Metodi Statistici per la Ricerca Sociale Regressione lineare e correlazione 1. Su un campione di individui sono rilevati i caratteri X (peso in Kg) e Y (altezza in cm),

Dettagli

LEZIONE N.8 (a cura di Teresa Fanelli) Questa forma risulta importante nel modello di regressione con più variabili.

LEZIONE N.8 (a cura di Teresa Fanelli) Questa forma risulta importante nel modello di regressione con più variabili. LEZIONE N.8 (a cura di Teresa Fanelli) Forma matriciale del Modello di Regressione Semplice L assunzione di base del modello è: Y i =β 0 +x i β 1 +ε i i=1,2,..n. Lo stesso modello può essere scritto attraverso

Dettagli

STATISTICA. Esercizi

STATISTICA. Esercizi STATISTICA Esercizi Esercizio 188 In vista di un referendum sulle energie rinnovabili si monitorano le opinioni in un campione casuale di 1600 soggetti nel mese di Agosto e in quelle di Ottobre, con i

Dettagli

DIAGNOSTICA DEI RESIDUI

DIAGNOSTICA DEI RESIDUI DIAGNOSTICA DEI RESIDUI Per valutare la bontà dei residui in un modello di regressione lineare esistono diverse possibilità, alcune di tipo esplorativo basate sulla costruzione di opportuni grafici ed

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Esercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta.

Esercizio Dire quale variabile debba essere usata come regressore e quale sia la variabile risposta. Esercizio 1 Il file elettr.txt contiene dei dati sui consumi in miliardi di kilowatt/ora (eleccons) e sul prodotto interno lordo in miliardi di dollari (gdp) su 30 paesi in un determinato anno. Il prodotto

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

mercato A.A. 2014/15 modello di regressione lineare

mercato A.A. 2014/15 modello di regressione lineare Statistica per le ricerche di mercato A.A. 2014/15 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per il modello di regressione

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte) Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

STATISTICA. Regressione-1

STATISTICA. Regressione-1 STATISTICA Regressione-1 Obiettivo generale Y x Obiettivo generale Y previsione di y da x è possibile () x Obiettivo generale previsione di y da x non è possibile Y x Obiettivo generale Y Un modello per

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

Computazione per l interazione naturale: Regressione probabilistica

Computazione per l interazione naturale: Regressione probabilistica Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2016.html

Dettagli

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII Indice XI XI XIII XV XVII L Editore ringrazia Ringraziamenti Autori Prefazione Obiettivi formativi XIX Istruzioni per gli studenti XIX Un po di storia XX Cosa è la Statistica XXI Come usare questo libro

Dettagli

Esercitazioni di Statistica Dott.ssa Cristina Mollica

Esercitazioni di Statistica Dott.ssa Cristina Mollica Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma.it Regressione Esercizio. Siano dati i seguenti valori per le due variabili X ed Y: 4 5 3 5 3 3 Con riferimento al modello

Dettagli

OLS multivariato: effetti parziali, multicollinearità

OLS multivariato: effetti parziali, multicollinearità OLS multivariato: effetti parziali, multicollinearità CONCETTI DA RECUPERARE Per stimare questo modello utilizziamo le seguenti variabili esplicative educ, exper e tenure Primo passo da compiere sarà quello

Dettagli

Esempio 1 (Regressione semplice, punti influenti, regressione multipla, multicollinearità)

Esempio 1 (Regressione semplice, punti influenti, regressione multipla, multicollinearità) Esempio (Regressione semplice, punti influenti, regressione multipla, multicollinearità) DATI Il data set cigarettes.sav (fonte http://www.amstat.org/publications/jse/jse_data_archive.html) contiene dati

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Settimana 3. G. M. Marchetti. Marzo 2017

Settimana 3. G. M. Marchetti. Marzo 2017 Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

II ESERCITAZIONE ESERCIZIO

II ESERCITAZIONE ESERCIZIO II ESERCITAZIONE ESERCIZIO 1 Quale percentuale di osservazioni sotto la curva normale standardizzata cade nell'intervallo compreso tra i valori z=-1 e z=+1? a) 66% circa b) 70,2% circa c) 68,2% circa d)

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 14 Giugno 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da cinque esercizi; dopo

Dettagli

STATISTICA. Esercizi vari

STATISTICA. Esercizi vari STATISTICA Esercizi vari Esercizio 5.6 p. 205 Variabile Coeff. Dev. std. Statistica t p-value Intercetta 23.384 1.592 14.691 0 Profondità -1.435 0.213-6.726 0 = 0.850 Esercizio 5.6 p. 205 Variabile Coeff.

Dettagli

Facoltà di SCIENZE Anno Accademico 2016/17 Registro lezioni del docente COLUMBU SILVIA

Facoltà di SCIENZE Anno Accademico 2016/17 Registro lezioni del docente COLUMBU SILVIA Facoltà di SCIENZE Anno Accademico 2016/17 Registro lezioni del docente COLUMBU SILVIA Attività didattica ELEMENTI DI PROBABILITA' E STATISTICA [60/65/264] Periodo di svolgimento: Primo Semestre Docente

Dettagli

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Restrizioni lineari nel MRLM: esempi

Restrizioni lineari nel MRLM: esempi Restrizioni lineari nel MRLM: esempi Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Restrizioni lineari: esempi Econometria - 2013 1 / 22 Funzione di produzione Cobb-Douglas Esempio GDP

Dettagli

Computazione per l interazione naturale: Regressione probabilistica

Computazione per l interazione naturale: Regressione probabilistica Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2017.html

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

Esercitazione del 16 maggio 2014

Esercitazione del 16 maggio 2014 Esercitazione del 16 maggio 2014 Conclusione dell esercizio sul consumo annuo di energia elettrica della lezione precedente. Avevamo un campione di n=101 abitazioni di metratura confrontabile e per ciascuna

Dettagli

STATISTICA. Inferenza: Stima & Intervalli di confidenza, 1

STATISTICA. Inferenza: Stima & Intervalli di confidenza, 1 STATISTICA Inferenza: Stima & Intervalli di confidenza, 1 Inferenza per la media Siano,,, variabili casuali i.i.d media campionaria: v.c. che predice il valore della media aritmetica dei dati nel campione

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Ringraziamenti dell Editore

Ringraziamenti dell Editore Indice Elenco dei simboli e delle abbreviazioni in ordine di apparizione Ringraziamenti dell Editore XI XVII 1 Introduzione FAQ e qualcos altro, da leggere prima 1 1.1 QuestoèunlibrodiStatistica....................

Dettagli

La curva di regressione è il luogo dei punti aventi come ordinate le medie condizionate

La curva di regressione è il luogo dei punti aventi come ordinate le medie condizionate Correlazione e regressione Correlazione: le due variabili casuali sono considerate in modo per così dire simmetrico. Regressione: una delle due variabili dipende dall'altra, che per così dire la precede

Dettagli

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1 Lezione 1 - Martedì 23 Settembre 2014 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

VIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul

VIII Indice 2.6 Esperimenti Dicotomici Ripetuti: Binomiale ed Ipergeometrica Processi Stocastici: Bernoul 1 Introduzione alla Teoria della Probabilità... 1 1.1 Introduzione........................................ 1 1.2 Spazio dei Campioni ed Eventi Aleatori................ 2 1.3 Misura di Probabilità... 5

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 19 Luglio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da quattro esercizi; dopo

Dettagli

STATISTICA. Esercitazione 6

STATISTICA. Esercitazione 6 STATISTICA Esercitazione 6 Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale tre compiti diversi con i seguenti risultati: Compito A Compito B Compito C Numero studenti 41 39 43

Dettagli

Statistica Applicata prof. Federico Plazzi

Statistica Applicata prof. Federico Plazzi Statistica Applicata prof. Federico Plazzi Corso di Laurea in Scienze Naturali a. a. 2015/2016 PROVA DEL 8 FEBBRAIO 2016 Nome: Cognome: ALCUNE INDICAZIONI: La prova consiste in quattro esercizi; dopo ogni

Dettagli

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0. Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli

Regressione & Correlazione

Regressione & Correlazione Regressione & Correlazione Monia Ranalli Ranalli M. Dipendenza Settimana # 4 1 / 20 Sommario Regressione Modello di regressione lineare senplice Stima dei parametri Adattamento del modello ai dati Correlazione

Dettagli

Metodologie Quantitative

Metodologie Quantitative Metodologie Quantitative Regressione Lineare Nozioni di base M Q Marco Perugini Milano-Bicocca 1 I COMUNICAZIONE MERCOLEDI 11 NOVEMBRE NON CI SARA LEZIONE DI MQ Concetti base Con l analisi di regressione

Dettagli

Maria Prandini Dipartimento di Elettronica e Informazione Politecnico di Milano

Maria Prandini Dipartimento di Elettronica e Informazione Politecnico di Milano Note relative a test di bianchezza rimozione delle componenti deterministiche da una serie temporale a supporto del Progetto di Identificazione dei Modelli e Analisi dei Dati Maria Prandini Dipartimento

Dettagli

Settimana 2. G. M. Marchetti. 4 Marzo 2017

Settimana 2. G. M. Marchetti. 4 Marzo 2017 Settimana 2 G. M. Marchetti 4 Marzo 2017 1 / 54 Mediana Un indice di posizione alternativo alla media e molto usato è la mediana È basato sull ordinamento dei dati La mediana è il valore Me tale che la

Dettagli

Psicometria con Laboratorio di SPSS 2

Psicometria con Laboratorio di SPSS 2 Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2016/2017 prof. Federico Plazzi 5 Luglio 2017 Nome: Cognome: Matricola: Alcune indicazioni: La prova è constituita da quattro esercizi; dopo

Dettagli

Validazione ediagnostica

Validazione ediagnostica Validazione ediagnostica Il processo di identificazione di un modello di regressione consiste nell iterazione delle seguenti fasi: 1. formulazione di un modello provvisorio 2. stima dei parametri 3. critica

Dettagli

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura INDICE GENERALE Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura XI XIV XV XVII XVIII 1 LA RILEVAZIONE DEI FENOMENI

Dettagli

Università di Pavia Econometria Esercizi 4 Soluzioni

Università di Pavia Econometria Esercizi 4 Soluzioni Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ

Dettagli

Analisi della Regressione Lineare

Analisi della Regressione Lineare Analisi della Regressione Lineare Master in Tecnologie Bioinformatiche 29/09/06 Adriano Decarli 1 29/09/06 Adriano Decarli 2 29/09/06 Adriano Decarli 3 29/09/06 Adriano Decarli 4 29/09/06 Adriano Decarli

Dettagli

Indice. Parte I. 2.4 Confrontare variabili numeriche tra gruppi 23 Confronto di istogrammi tra gruppi 23 Confronto delle frequenze cumulative 23

Indice. Parte I. 2.4 Confrontare variabili numeriche tra gruppi 23 Confronto di istogrammi tra gruppi 23 Confronto delle frequenze cumulative 23 Indice Parte I Capitolo 1 Statistica e campioni 1.1 Che cos è la statistica? 2 1.2 Campionare le popolazioni 3 Popolazioni e campioni 4 Proprietà dei buoni campioni 4 Il campionamento casuale 5 Come ottenere

Dettagli

Nota dell editore Presentazione

Nota dell editore Presentazione Autori Nota dell editore Presentazione XI XIII XV 1 Conoscenze preliminari per l osservazione biostatistica 1 Variabilità biologica e implicazioni statistiche 1 Variabili e costanti 2 Concetto di misura

Dettagli

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per

Dettagli

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare

Dettagli

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli

Test di normalità. Federico Plazzi. 24 Ottobre 2016

Test di normalità. Federico Plazzi. 24 Ottobre 2016 Federico Plazzi 24 Ottobre 2016 Test di Shapiro e Wilk Test di Shapiro e Wilk Ipotesi nulla (H 0 ): i nostri valori hanno una distribuzione normale. Test di Shapiro e Wilk Ipotesi nulla (H 0 ): i nostri

Dettagli

Indice. Parte I. 2.4 Confrontare variabili numeriche tra gruppi 23 Confronto di istogrammi tra gruppi 23 Confronto delle frequenze cumulative 23

Indice. Parte I. 2.4 Confrontare variabili numeriche tra gruppi 23 Confronto di istogrammi tra gruppi 23 Confronto delle frequenze cumulative 23 Indice Parte I Capitolo 1 Statistica e campioni 1.1 Che cos è la statistica? 2 1.2 Campionare le popolazioni 3 Popolazioni e campioni 4 Proprietà dei buoni campioni 4 Il campionamento casuale 5 Come ottenere

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

Metodi Quantitativi per Economia, Finanza e Management

Metodi Quantitativi per Economia, Finanza e Management Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di

Dettagli

Esercizio 5 (Scelta delle variabili)

Esercizio 5 (Scelta delle variabili) Esercizio (Scelta delle variabili) DATI Il data set macro.sav (o macro.xls) contiene dati relativi al e riferiti a stati, raccolti dall UNDP (United Nations Development Programme). Le variabili sono COUNTRY

Dettagli

Parametri statistici

Parametri statistici SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Parametri statistici 24/1/2005 Deviazione standard della media La variabilità di una distribuzione può quindi essere espressa da un indice

Dettagli

lezione 6 AA Paolo Brunori

lezione 6 AA Paolo Brunori AA 2016-2017 Paolo Brunori consumo di tabacco in Turchia 1960-1988 fonte: Tansel, 1993, pubblicato su Applied Economics consumo di tabacco in Turchia fra il 1960 al 1988 year = anno Q = quantità pro capite

Dettagli