Quale retta? La retta migliore è quella che più si avvicina all insieme dei 115

Documenti analoghi
LA REGRESSIONE LINEARE SEMPLICE

MEDIA DI Y (ALTEZZA):

LA REGRESSIONE LINEARE SEMPLICE

Caso studio 12. Regressione. Esempio

Il termine regressione fu introdotto da Francis Galton ( ), antropologo (promotore dell eugenetica).

y = α + βx + ε Qui ci soffermeremo su un unica classe di modelli, detti modelli statistici lineari. Si veda la seguente figura:

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2011/2012. Statistica. Lezione IV

Variabilità = Informazione

Università di Cassino. Esercitazioni di Statistica 1 del 26 Febbraio Dott. Mirko Bevilacqua

Dott.ssa Marta Di Nicola

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 9: Covarianza e correlazione

12/11/2015 STATISTICA 1. Esercitazione 4. Dott.ssa Vera Gurtovaya

Istogrammi e confronto con la distribuzione normale

Gli indici sintetici Forma. Gli indici sintetici. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

ρ XY risponde alla domanda esiste un associazione lineare tra le variabili X e Y?

Contenuti. Facoltà di Economia. Scatterplot o diagramma a dispersione Analisi grafica della relazione tra due. francesco mola.

Regressione e Correlazione

La Regressione. Y = f ( X ) Le motivazioni che ci spingono alla ricerca di f essenzialmente due: la Previsione ed il Controllo.

Lezione 4. La Variabilità. Lezione 4 1

Gli indici sintetici Forma. Un caso studio. Gli indici sintetici. Qualche considerazione. Qualche considerazione. Tendenza centrale Forma

Università di Cassino Esercitazioni di Statistica 1 del 5 Febbraio Dott. Mirko Bevilacqua

Esercitazione 6 del corso di Statistica (parte 1)

Analisi dei Dati. La statistica è facile!!! Correlazione

LA FUNZIONE DI VEROSIMIGLIANZA

LEZIONI DI STATISTICA MEDICA

Caso studio 10. Dipendenza in media. Esempio

Statistica per le ricerche di mercato. 13. La regressione lineare semplice

ANALISI DELLA REGRESSIONE ANALISI BIVARIATA DELLA REGRESSIONE

SECONDA PROVA INTERMEDIA DI STATISTICA CLEA gennaio 2005 COMPITO C2

DATA MINING PER IL MARKETING (63 ore)

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

pè via che, lì, la media è sempre eguale risurta che te tocca un pollo all'anno: Me spiego: da li conti che se fanno seconno le statistiche d'adesso

Due distribuzioni, stessa media ma in quale delle due la media rappresenta, sintetizza meglio la situazione?

Compito A1- Soluzioni

6. LA CONCENTRAZIONE

6. LA CONCENTRAZIONE

Le misure di variabilità

Associazione tra due variabili quantitative

Capitolo 17. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 17.1: Suggerimento

( ) ( ) ( ) ( ) Mutua variabilità. n n 1. n n 1. n n 1. n n 1

Indipendenza in distribuzione

b) Relativamente alla variabile PREZZO, fornire una misura della variabilità della distribuzione attraverso

Facoltà di Economia - STATISTICA - Corso di Recupero a.a Prof.ssa G. Balsamo CONCETTI di BASE Carattere X [o A ] i = 1

Statistica per le ricerche di mercato. 10. La regressione lineare semplice

I percentili e i quartili

Indici di asimmetria. Elementi di Statistica descrittiva Parte IV. Simmetria di una distribuzione di frequenze. Primo indice di asimmetria (1/3)

Analisi di regressione con SAS. Ci interessa. Matrice di covarianza. Esempio: due test su 31 individui PROC CORR PROC GPLOT PROC REG

INDICI DI VARIABILITA

Seconda Prova Parziale di STATISTICA Modalità A

Capitolo 6 Gli indici di variabilità

UNIVERSITA DEGLI STUDI MEDITERRANEA DI REGGIO CALABRIA

Generalmente sia l ampiezza che il valore medio della sollecitazione sono variabili nel tempo.

IL CALCOLO DELLA DOMANDA DI TRASPORTO (Capitolo 4)

La regressione lineare. Rappresentazione analitica delle distribuzioni

Classi di reddito % famiglie Fino a Oltre Totale 100

valido se i dati E dato da max(x i )-min(x i )

Analisi della Dipendenza

Regressione. Modelli statistici. Esempio: le automobili si vendono a peso? Esempio: le automobili si vendono a peso? prezzo=a+b*(peso-500)+errore

La media aritmetica. La sua individuazione si basa sulla logica della trasferibilità di un carattere. Se la funzione f( ) corrisponde alla somma:

Il modello di regressione lineare semplice (1) Studio della dipendenza riepilogo

DI IDROLOGIA TECNICA PARTE II

IL MODELLO DI REGRESSIONE

Analisi delle distribuzioni doppie: dipendenza

Correlazione. Obiettivo: studiare la dipendenza fra due fenomeni quantitativi

Stima puntuale Quando un parametro della popolazione incognito è valutato (stimato) da una sola statistica (parametro) tratto da un campione

Modelli di accumulo del danno dovuto a carichi ciclici

PROVA SCRITTA DI STATISTICA (COD ) 4 Febbraio 2004 MODALITÀ A APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

Elementi di Statistica descrittiva Parte III

Funzioni di più variabili Massimi e Minimi una funzione definita in un insieme E. Un punto ( x0, y0)

Il modello di regressione multipla

IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

Interpolazione. Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l andamento di un insieme di punti.

exp("# (al posto di n) var Ca Coefficiente di asimmetria, indipendente dal valore dei parametri. f X DISTRIBUZIONE EV1 o DI GUMBEL.

Anche le rette raccontano

Unità 11. Studio di più variabili. Interpolazione. Regressione. Correlazione. Notazione matriciale

Capitolo 13 Il modello di regressione lineare

Dai dati osservati mediante scelta campionaria si giunge ad affermazioni i che riguardano la popolazione da cui essi sono stati prescelti

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

Il campionamento e l inferenza

Statistica descrittiva per l Estimo

3 Variabilità. variabilità. Senza deviazione dalla norma il progresso non è possibile. (Frank Zappa) Statistica - 9CFU

Caso studio 2. Le medie. Esercizio. La media aritmetica. Esempio

L analisi bivariata. L analisi bivariata. L analisi bivariata. Tabelle di contingenza. Corso di. docente: Cristina Davino. a.a.

Soluzione degli esercizi sulla statistica descrittiva e gli intervalli di confidenza

TRATTAMENTO STATISTICO DEI DATI ANALITICI

= = stimatori degli indici statistici di variabilità. Definizione della varianza campionaria. Definizione dello scarto quadratico medio.

Prof. Massimiliano Giacalone

Elementi di statistica descrittiva Parte III

Daniela Tondini

LE MEDIE. Le Medie. Medie razionali. Medie di posizione

Matematica elementare art.1 di Raimondo Valeri

MISURE DI TENDENZA CENTRALE. Psicometria 1 - Lezione 2 Lucidi presentati a lezione AA 2000/2001 dott. Corrado Caudek

Esercizi 12/10/2007. oppure B 0. In modo del tutto analogo AB 0 se e solo se. oppure B 0 B 0. Studio del segno di una disequazione polinomiale.

STATISTICA A K (63 ore) Richiami sulla regressione RETTA DI REGRESSIONE MODELLO DI REGRESSIONE. Marco Riani, Univ. di Parma 1

STATISTICA DESCRITTIVA modulo 1 Corso di Laurea SMID Elda Guala e Ivano Repetto Dipartimento di Matematica - Università degli Studi di Genova

La media aritmetica. Le medie. Esempio. Esempio. Media aritmetica Mediana. Medie analitiche Medie di posizione. x 1

Marco Riani - Analisi delle statistiche di vendita 1

Transcript:

Quale retta? Quale retta? Questa? Oppure questa? Questa certamete o! 0 1 0 1 La retta mglore è quella che pù s avvca all seme de 115 put corrspodet alle coppe d valor (x, y ). Per la stma de parametr s mpega abtualmete l metodo

Metodo de mm quadrat Retta stmata: Ŷ = a+ bx!" ordata teorca corrspodete ad u dato valore d X coeffcete a - tercetta è l ordata all orge della retta coeffcete d regressoe b è l coeffcete agolare della retta retta d regressoe stmata è tato pù adatta a descrvere la relazoe studata quato pù put osservat (Y ) s trovao prossmtà d essa S defscoo resdu campoar: e = Y - Yˆ = Y -a-bx Crtero de mm quadrat (OLS): a e b soo scelt modo da mmzzare la somma de quadrat de resdu campoar 2 = 1 = 1 ( ) 2 = å = å - - f ( a, b) e Y a bx 116

Stma de parametr co metodo de mm quadrat 2 = 1 = 1 ( ) 2 å å = mmo f ( a, b) = e = Y -a -bx f( a, b) f( a, b) = = a b 0 Rsolvedo le due dervate rspetto ad a e b, s ottee: å Y = a + b X = 1 = 1 å a = Y - bx 2 XY = a X+ b X = 1 = 1 = 1 å å å 2 = 1 = 1 b x y x = å å x e y dcao gl scart delle osservazo campoare dal relatvo valore medo 117

Propretà de mm quadrat La somma de valor teorc è uguale alla somma de valor osservat: yˆ y Da cò cosegue che ache la meda de valor teorc e la meda de valor osservat soo ugual e, oltre, che la somma de resdu de mm quadrat è detcamete ulla: 1 1 1 re ( 1 y yˆ ) 0 118

Stma retta d regressoe esempo supermercat V o l u m e 250 200 150 v e d t e 100 50 0 0 50 100 150 200 250 300 350 Spazo espostvo Yˆ = - 10,19 + 0,67 Che dre del valore dell tercetta? X coeffcete d regressoe: ad og cremeto utaro della varable X la varable Y subsce ach essa u cremeto, d testà 0,67 ovvero ad og cremeto d u m 2 ella superfce del supermercato l volume delle vedte settmaal aumeta d 67 euro (0,67 x 100) 119

Botà d adattameto La retta (modello) stmata descrve bee dat osservat? La verfca della valdtà o botà d adattameto della retta d regressoe è dretta a cotrollare che la retta d regressoe sa realmete grado d spegare l adameto delle osservazo 120

Scomposzoe dello scostameto dalla meda d Y e y Retta stmata e x x 121

Scomposzoe della devaza d Y e ) DEV ( Y( Y) ) DEV ( Y( ˆ) Y) DEV ( E( DEV ( Y ) 1 ( y y) 2 devaza totale de valor della varable dpedete Msura la varazoe de valor d Y toro alla loro meda DEV ( Yˆ) 1 ( yˆ y) 2 devaza de valor stmat: devaza d regressoe Varazoe spegata attrbuble alla relazoe fra la X e Y DEV ( E) 1 ( y yˆ 2 ) 1 r 22 e devaza de resdu: devaza resdua Varazoe attrbuble a fattor estrae alla relazoe fra la X e Y 122

Msura della botà d adattameto Ua msura relatva (e ormalzzata) è l dce d determazoe leare che s dca co R 2 (Rsquared) ed è l rapporto tra la devaza d regressoe e la devaza totale: R 2 DEV ( Yˆ) DEV ( Y ) 1 DEV ( E) DEV ( Y ) frazoe d varaza della varable rsposta spegata dal modello L dce R 2, essedo u rapporto d ua parte al tutto, può assumere valor compres tra 0 ed 1: se R 2 = 0 l adattameto è pessmo se R 2 = 1 l adattameto è perfetto 123

Possbl stuazo Esemp d R Y R 2 = 1 Y R 2 = 1 X Relazoe leare perfetta fra X e Y: Il 100% della varabltà d Y è spegata dalla varabltà d X X Y Y X R 2 =0,28 R 2 =0,73 Solo ua parte della varabltà d Y è spegata dalla varabltà d X X 124

Possbl stuazo Y R 2 = 0 Nessua relazoe leare fra X e Y: R 2 = 0 X Il valore d Y o dpede da X. (Nessua varazoe d Y è spegata da X) se la stuazoe è quella dcata dal grafco! 125

Osservazo su R 2 /1 1. R 2 =0 e R 2 =1 rappresetao de cas lmte che pratca o s presetao ma 2. L dce R 2 o msura se c è ua relazoe tra le 2 varabl, ma solo quato dat osservat possao essere approssmat da ua retta: se l dce d determazoe leare s rvela prossmo ad 1, s può dre che la varabltà d Y è spegata msura otevole dalla retta d regressoe. Y Fra X e Y sussste ua relazoe, ma o è d tpo leare: R 2 prossmo allo 0 X 3. No s utlzza l term causata poché u valore d R 2 prossmo ad 1 o mplca ecessaramete u esso causale tra le due varabl. 126

Osservazo su R 2 /2 R 2 : dcazoe globale su botà d adattameto 127

Possbl stuazo stuazoe deale! stuazoe smle ma relazoe pù debole: resdu pù dspers 128 Fote: Chambers et al., 1983

relazoe curvlea: curvatura acora pù evdete de resdu (alto, basso, alto o vceversa) *" u puto preseta u valore x molto dstate dagl altr ma cosstete ( term d y) rspetto alla cofgurazoe leare del resto de put (x = leverage pot) 129 Fote: Chambers et al., 1983

Varabltà de put o è costate al varare d x, acora pù evdete e resdu. Possble alteratva: trasformare le varabl 130 Fote: Chambers et al., 1983

Relazo learzzabl Relazo o lear ma learzzabl medate trasformazo d varabl (a seguto dell spezoe del dagramma d dspersoe): Trasformazo pù comu per teer coto d u adameto curvleo co y che cresce pù velocemete d x 1. Y = α + βx 2 2. Log(Y) = α + βx 3. Log(Y) = α + βlog(x) (Metodo mm quadrat può essere applcato a modell geeral g(y) = α + βh(x)+(errore) co g(y) e h(x) approprate fuzo. Importate è che l modello sa leare e parametr 131