STATISTICA. Regressione-2

Documenti analoghi
STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-1

STATISTICA. Regressione-2

Statistica multivariata Donata Rodi 17/10/2016

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

lezione 4 AA Paolo Brunori

STATISTICA. Esercitazione 5

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Esercitazione del

STATISTICA. Regressione-1

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Regressione lineare semplice

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

1.1 Obiettivi della statistica Struttura del testo 2

Stima dei parametri di modelli lineari

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Regressione Lineare Semplice e Correlazione

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Capitolo 12 La regressione lineare semplice

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Dispensa di Statistica

La regressione lineare semplice

Correlazione e regressione

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

PROBABILITÀ ELEMENTARE

Regressione & Correlazione

lezione 7 AA Paolo Brunori

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

lezione 5 AA Paolo Brunori

Indipendenza, Dipendenza e interdipendenza

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Statistica. Alfonso Iodice D Enza

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Rappresentazioni grafiche di distribuzioni doppie

Argomenti della lezione:

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Differenze tra metodi di estrazione

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

1. variabili dicotomiche: 2 sole categorie A e B

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Teoria e tecniche dei test. Concetti di base

Test delle Ipotesi Parte I

STATISTICA. Regressione-4 ovvero Macron!

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Metodologie Quantitative

Statistica. Alfonso Iodice D Enza

lezione 10 AA Paolo Brunori

STATISTICA A K (60 ore)

Psicometria con Laboratorio di SPSS 2

Statistica inferenziale

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

PROGRAMMA DI STATISTICA BITETTO-BOGLI aa. 2018/2019 CON DETTAGLIO ARGOMENTI DA STUDIARE E LEGGERE * SUI LIBRI ADOTTATI

Argomenti della lezione:

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato

Regressione e Correlazione (cap. 11) Importazione dati da file di testo

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

STATISTICA. Esercitazione 6

Assunzioni (Parte I)

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

Presentazione dell edizione italiana

Elementi di Psicometria con Laboratorio di SPSS 1

Esercizi su Regressione e Connessione

Statistica di base per l analisi socio-economica

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Presentazione dell edizione italiana

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Breve ripasso di statistica

Prova scritta di Complementi di Probabilità e Statistica 19 Luglio 2005 (consegnare solo il file word)

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Regressione. Monica Marabelli. 15 Gennaio 2016

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Corso di Laurea in Amministrazione Aziendale Complex Learning. Statistica per l azienda (T) SECS-S/01 a. a. 2017/2018

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

ESAME. 9 Gennaio 2017 COMPITO B

Esercitazioni di Statistica Dott.ssa Cristina Mollica

ECONOMETRIA: Laboratorio I

docente: J. Mortera/P. Vicard Nome

ESERCITAZIONE REGRESSIONE MULTIPLA

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

viii Indice generale

Excel: parte II. Davide Sardina

REGRESSIONE E CORRELAZIONE

b) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Esercitazione straordinaaaaariaaaaa. Statistica L-Z

Corso in Statistica Medica

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Transcript:

STATISTICA Regressione-2

Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante un opportuno grafico: le due variabili sono correlate? Come e quanto? 2. Determinare le stime dei minimi quadrati dei parametri della retta interpolatrice dei dati

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.5 2.0 2.5 3.0 3.5 Grafico di dispersione 1 2 3 4 5

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5,, 1.5 2.0 2.5 3.0 3.5 Grafico di dispersione 1 2 3 4 5

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 x i y i 1.5 5 9 10 17.5 = 3, =2.6 =11 3 =2, =7.2 2.6 =0.44 = 1 = 1 5 = 43 5 3 2.6 =0.8 = = 0.8 2 0.44 =.

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5,, =. Correlazione lineare positiva 1.5 2.0 2.5 3.0 3.5 Grafico di dispersione 1 2 3 4 5

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 x i y i 1.5 5 9 10 17.5 = 3, =2.6 =11 3 =2, =7.2 2.6 =0.44 = 1 = 1 5 = 43 5 3 2.6=. = =0.8 2 =. = =2.6 0.4 3=.

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 =, =. =0.4 =1.4 =.+. =, =.+. =. 1.5 2.0 2.5 3.0 3.5 Grafico di dispersione 1 2 3 4 5

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 = 3, =2.6 =0.4 =1.4 =.+. Previsione: Grafico di dispersione 1.5 2.0 2.5 3.0 3.5 =., =.+.. =. 4.5 1 2 3 4 5

Esempio x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 = 3, =2.6 La previsione è =0.4 attendibile? =1.4 solo se il modello =1.4+0.4 si adatta bene ai dati Previsione: 1.5 2.0 2.5 3.0 3.5 =., =.+.. =. Grafico di dispersione 4.5 1 2 3 4 5

Regressione lineare =+ A. Valutazione preliminare se una retta possa essere una buona approssimazione ρ B. Stima dei parametri della retta. C. Valutazione della bontà di adattamento del modello ai dati

Esempio = 3, =2.6 x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 COME LO VERIFICO? Grafico di dispersione CONFRONTANDO LE OSSERVAZIONI La previsione =0.4 è CON attendibile? LE PREVISIONI =1.4 solo se il modello =1.4+0.4 si adatta bene ai dati Previsione: 1.5 2.0 2.5 3.0 3.5 CHE IL MODELLO FA PER QUELLE OSSERVAZIONI =., =.+.. =. 4.5 1 2 3 4 5

La varianza spiegata dalla retta =+ 1 = 1 (+ ) = =+ = ( )+ = la media delle previsioni coincide con la media delle osservazioni

La varianza spiegata dalla retta = + 1 = 1 (+ ) = =+ = ( )+ = la media delle previsioni coincide con la media delle osservazioni se le previsioni sono molto vicine alle osservazioni anche le varianze saranno vicine! = ( ) = ( )

La varianza spiegata dalla retta = + 1 = 1 (+ ) = =+ = ( )+ = la media delle previsioni coincide con la media delle osservazioni se le previsioni non sono molto vicine alle osservazioni, la varianza dei dati sarà maggiore di quella delle previsioni

2000-2016 2010-2016 Spesa per consumi individuali Italia 960000 980000 1000000 1020000 1040000 La varianza spiegata dalla retta 1300000 1400000 1500000 1600000 85 90 95 100 105 110 PIL Italia Clima di fiducia in quale grafico le previsioni e le osservazioni sono più vicine? Spesa per consumi individuali Italia 800000 850000 900000 950000 1000000

La varianza spiegata dalla retta 1 = 2000-2016 Spesa per consumi individuali Italia 800000 850000 900000 950000 1000000 1300000 1400000 1500000 1600000 ( ) ( ) = PIL Italia = ( ) = ( )

La varianza spiegata dalla retta 1 = 2010-2016 1 ( ) ( ) = Spesa per consumi individuali Italia 960000 980000 1000000 1020000 1040000 85 90 95 100 105 110 Clima di fiducia = ( ) = ( )

Analisi della Varianza Fonte di variabilità Gradi di libertà (gl) SS (Sum of Squares) Mean Square (SS/gl) Retta di regressione Attorno alla retta 1 ( ) 2 Totale 1 ( ) num. di parametri stimati ( e ) 1 2 varianza spiegata varianza totale

2000-2016 2010-2016 Spesa per consumi individuali Italia 960000 980000 1000000 1020000 1040000 La varianza spiegata dalla retta =. =. 1300000 1400000 1500000 1600000 85 90 95 100 105 110 PIL Italia Clima di fiducia in quale grafico le previsioni e le osservazioni sono più vicine? Spesa per consumi individuali Italia 800000 850000 900000 950000 1000000

La bontà della regressione ( ) ( ) = coeff. di determinazione 0 1 = BUON ADATTAMENTO :.. o. (per tendenze crescenti) (per tendenze decrescenti)

Esempio, Cont. x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.8 2.2 2.6 3.0 3.4 Grafico di dispersione =.+. =. = () = = =. =. 1.5 2.0 2.5 3.0 3.5 1 2 3 4 5

L indice non basta! 5 4 =. =. 3 2 5 1 4 20 40 60 80 100 3 2 1 20 40 60 80 100

Regressione lineare: sunto GRAFICO DI DISPERSIONE & = = = A. Valutazione preliminare se una retta possa essere una buona approssimazione B. Stima dei parametri della retta. C. Valutazione della bontà di adattamento del modello ai dati NON BASTA!

Per fare un buon modello lineare serve: una correlazione alta 5 4 3 alcune ipotesi che garantiscono la linearità del modello 2 1 20 40 60 80 100

Inferenza Il modello della regressione lineare semplice: = = + ~(, ) =+ + ~(+, )

Il modello di regressione lineare =+ +, ~(, ) ~(+, ) In questo modello, mi aspetto di osservare il valore = + (sulla retta), ma l incertezza del fenomeno può produrre un osservazione che non sta sulla retta. Questo errore, =,è supposto gaussiano, quindi non può essere troppo grande (" 3,3"), e deve essere simmetrico, nel senso che l istogramma degli deve dare una «campana» simmetrica. w 140 150 160 170 180 Y 66 68 70 72 X

Il modello di regressione lineare =+ +, ~(, ) ~(+, ) =, - non sono «troppo grandi»: ( 3,+3); - sono in parte positivi e in parte negativi; - il loro grafico è sparpagliato. w 140 150 160 170 180 Y X 66 68 70 72

Verifica della Gaussianità -5 0 5 10 0 10 20 30 40

Verifica della Gaussianità -60-40 -20 0 20 40 60 80 La varianza non è costante ~(, ) 0 20 40 60 80 100

Esempio, Cont. x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 = 3, =2.6 =0.4 =1.4 =.+. =. 1.5 2.0 2.5 3.0 3.5 Grafico di dispersione 1 2 3 4 5

Esempio, Cont. x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.8 2.2 2.6 3.0 3.4 =.+. =. = =. 1.5 2.0 2.5 3.0 3.5 Grafico di dispersione 1 2 3 4 5

Esempio, Cont. =.+. =. = =. = x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.8 2.2 2.6 3.0 3.4-0.3 0.3 0.4-0.5 0.1 1.5 2.0 2.5 3.0 3.5 1 2 3 4 5

Esempio, Cont. x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.8 2.2 2.6 3.0 3.4-0.3 0.3 0.4-0.5 0.1 = 1.4+0.4 =0.85 = =. =

Esempio, Cont. Sparpagliati attorno alla retta tratteggiata; =.+. abbastanza =0.85 simmetrici = =. = x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.8 2.2 2.6 3.0 3.4-0.3 0.3 0.4-0.5 0.1

Regressione lineare: GRAFICO DI DISPERSIONE & = = = & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione B. Stima dei parametri della retta. C. Valutazione della bontà di adattamento del modello ai dati

Esempio, Cont. I DATI SONO TROPPO =.+. POCHI PER =0.85 FARE UN ANALISI = =. SERIA DEI = RESIDUI! x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1.8 2.2 2.6 3.0 3.4-0.3 0.3 0.4-0.5 0.1

Regressione lineare: GRAFICO DI DISPERSIONE & = = = & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione B. Stima dei parametri della retta. C. Valutazione della bontà di adattamento del modello ai dati D. Significatività della regressione

Inferenza Il modello della regressione lineare semplice: =+ ~(0, ) indipendenti =+ + Verificare se il vero valore della pendenza nella popolazione di riferimento è davvero diverso da zero ( previsioni!) oppure no: =,