REGRESSIONE LINEARE E POLINOMIALE

Размер: px
Начинать показ со страницы:

Download "REGRESSIONE LINEARE E POLINOMIALE"

Транскрипт

1 REGRESSIONE LINEARE E POLINOMIALE Nota ua tabella di dati relativi alle osservazioi di due gradezze X e Y, è aturale formulare ipotesi su quale possa essere ua ragioevole fuzioe che rappreseti o che approssimi la relazioe tra X e Y. Il metodo dei miimi quadrati è ua risposta largamete codivisa a tale problema. Di seguito si preseta iizialmete il modello più semplice di regressioe, quello lieare, per trattare poi casi più complessi i cui il modello di regressioe è di tipo polioomiale. Il modello classico di regressioe lieare semplice Il modello di regressioe lieare semplice suppoe ua relazioe lieare tra x e y, ovvero y = + x + e (1) dove ß 1 e ß soo i parametri della cosiddetta retta di regressioe, i quali devoo essere opportuamete valutati sulla base delle osservazioi ed e rappreseta u termie d errore. Le ipotesi del modello classico di regressioe lieare semplice implicao che la y i sia costituita dalla somma di ua compoete determiistica ß 1 + ß x i e ua termie di scarto e i y i = + x i + e i () ifatti i valori x i della variabile esplicativa soo fissati e ß 1 e ß soo parametri e quidi costati. Per stimare i parametri ß 1 e ß del modello di regressioe si cosidera u campioe costituito da coppie di valori (x 1, y 1 ), (x, y ),..., (x, y ), dove x 1, x,..., x soo i valori degli igressi e y 1, y,..., y soo i valori delle osservazioi. Le osservazioi possoo essere rappresetate i u grafico a dispersioe come esemplificato ella Figura 1. Figura 1. Osservazioi sul modello di regressioe

2 Le stime soo costituite dai valori dei parametri cui corrispode la retta che approssima al meglio i dati. A tal fie si cosiderao le distaze dei puti (x i, y i ) dalla retta di regressioe, ovvero gli scarti e i = y i ( + x i ) per i = 1,,, (3) e i valori di ß 1 e ß soo scelti i modo tale da miimizzare le distaze dei puti (x i, y i ) dalla retta di regressioe stimata. Poiché alcue distaze soo positive e altre egative, si cosidera la somma delle distaze al quadrato Q(, ) = (y i x i ) (4) Figura. Distaza del puto (x i, y i ) dalla retta di regressioe Le stime del metodo dei miimi quadrati soo quei valori ß i che miimizzao la somma dei quadrati delle distaze, per le quali cioè si ha Q(, 1 ) = mi 1, Q(, ) (5) Derivado si ottiee Q(, ) = (y i x i ) 1 Q(, ) = (y i x i )x i 1 (6) Poedo le derivate uguali a zero e dividedo etrambi i membri per - si ottegoo le equazioi: (y i x i ) = 0

3 (y i x i )x i = 0 (7) Distribuedo la sommatoria ella prima equazioe si ha y i 1 x i = y x = 0 (8) 1 dove x e y soo le medie aritmetiche dei valori degli igressi e delle osservazioi. Dividedo per e risolvedo rispetto a 1 si ottiee la stima dell itercetta: 1 = y x (9) e quidi = (y i y )x i (x i x ) x i (10) La retta di regressioe stimata ha la seguete equazioe ŷ i = 1 + x i (11) Essa passa per il puto di coordiate (x,y ) ; ifatti dalla formula della stima dell'itercetta si ha y = ß 1 + ß x Figura 3. La retta stimata passa per il puto di coordiate (x, y) Notazioe vettoriale della soluzioe dei miimi quadrati Si cosideri la somma delle distaze al quadrato: ε = [ y ( 1 + x)] (1)

4 dove: y corrispode al vettore dei dati misurati; 1 + x rappreseta la retta di regressioe; e rappresetao i parametri di regressioe lieare (vettori coloa); N è la lughezza del vettore; La (1) diveta: ε =[ y - ( 1 + x) ] T [y - ( 1 + x)] = y T y - y T x - y T 1 + x T x - x T y + x T 1 1 T y + 1 T x + 1 T 1= y T y - y T x - y T 1 + x T x ( x T y ) T + x T 1 ( 1 T y ) T + + (1 T x ) T + 1 T 1 = y T y - y T 1 - y T x + x T x + N + x T 1 I coefficieti e si determiao i modo da miimizzare ε, poedo a zero le derivate parziali di ε rispetto ad e rispetto a : ε = y T x + x T x + x T 1 = 0 ε = y T 1 + x T 1 + N = 0 x T x + x T 1 = y T x x T 1 + N = y T 1 = y T x x T 1 y T 1 N x T x x T 1 x T 1 N = N yt x ( x T 1)( y T 1) Nx T x x T 1 = N k x k y k k x k k y k N N k=1 x k ( x i )

5 = x T x y T x x T 1 y T 1 x T x x T 1 x T 1 N = ( xt x)( y T 1) ( y T x)( x T 1) Nx T x x T 1 = k x k k y k k x k y k k x k N N k=1 x k ( x i ) oppure si ricava i fuzioe di : = yt 1 x T 1 N Le espressioi simboliche sembrao iguardabili, ma si possoo riscrivere i ua forma più leggibile. Se si idica co - X la media aritmetica di x = {x i,, x } cioè 1 x i - Y la media aritmetica di y = {y i,, y } cioè 1 y i - X la media aritmetica di x = {x i,, x } cioè 1 x i - XY la media aritmetica di xy = {x i y i,, x y } cioè 1 allora dividedo per il sistema diveta X + 1 X = XY x i y i X + = Y (13) La secoda equazioe mette i luce che il baricetro (X, Y ) cioè il puto le cui coordiate soo la media delle ascisse e la media delle ordiate, appartiee alla retta di regressioe, perché soddisfa l equazioe y = + x. Si può ora scrivere la soluzioe mediate u espressioe simbolica più semplice: = XY X Y (14) X X = Y X (15) Regressioe lieare multipla Nel modello di regressioe semplice le variazioi delle osservazioi soo spiegate mediate ua sola variabile d igresso. Si ottiee così u modello molto semplice che tuttavia o è sempre i grado di spiegare i feomei di iteresse i maiera adeguata.

6 U modello di regressioe multipla spiega la variabile dipedete y i fuzioe di k variabili esplicative o regressori, co k >, y = + x + 3 x k x k + ε (16) Per covezioe la prima variabile esplicativa e costate x 1 = 1. Il primo coefficiete di regressioe rappreseta quidi l itercetta del modello. Il modello di regressioe multipla può essere rappresetato i termii matriciali: Si cosideri u campioe di umerosità sul modello di regressioe lieare multipla y = + x i + 3 x 3i + + k x ki + ε i per i = 1,,. (17) Sia Y u vettore le cui compoeti soo costituite dalle variabili y 1, y,..., y e X ua matrice di dimesioi k co i valori delle variabili esplicative, y 1 1 x 1 x k1 Y = y, X = 1 x x k (18) [ y ] [ 1 x x k ] Nella matrice X ogi coloa corrispode ad u regressore: la prima coloa ha tutti elemeti uitari, la secoda cotiee i valori osservati di x e così via fio all ultima coloa che cotiee i valori di x k. Si defiisce quidi il vettore, di dimesioe, co i parametri del modello di regressioe e il vettore, di dimesioi, co gli scarti ε 1 = ε = ε (19) [ ] [ ε ] I forma matriciale il problema è rappresetato da Y = Xβ + ε (0) che corrispode a

7 y 1 = β 1 + β x 1 + β 3 x 31 + β k x k1 + ε 1 y = β 1 + β x + β 3 x 3 + β k x k + ε (1) y = β 1 + β x + β 3 x 3 + β k x k + ε Regressioe poliomiale Si propoe di descrivere alcue curve di adattameto co il metodo dei miimi quadrati e di forire u metodo iterativo per geeralizzare tali fuzioi a poliomi di grado M. Spesso si può esprimere ua variabile, y, come poliomiale di ua secoda variabile x : y = A + Bx + C x Z x M + ε () Si suppoga per esempio di avere ua poliomiale di forma quadratica, y = A + Bx + C x + ε (3) ota ua serie di valori (xi, yi ), i = 1,..,N per ogi xi il valore yi si ottiee dalla (3) dove A,B,C soo acora icogite. La miglior stima per A,B,C è data da quei valori per cui la sommatoria degli scarti quadratici (i otazioe vettoriale) è miima. Si differezi quidi rispetto a A,B,C : ε N A = (A y i + Bx i + Cx i ) N ε B = 1 σ (Bx i x i y i + Ax i + Cx 3 i ) y ε N = 1 C σ (C 4 y x y i x i i + A x i + Bx 3 i ) (4) poedo uguale a zero, omettedo gli estremi di sommatoria: y i = AN + B x i + C x i y i x i = A x i + B x 3 i + C x i y i x i = A x i + B x i 3 + C x i 4 (5) si tratta si u sistema 3x3 che i forma matriciale diveta

8 N x i x i A y i x i x i x i 3 B = y i x i (6) 3 [ x i x i x 4 i ] [ C] [ y i x i ] che è del tipo A X = B (7) e si può risolvere i diversi modi tra cui: X = A 1 B (8) Trovati i valori di A,B,C si sostituiscoo ella (3). I geerale voledo ricavare ua poliomiale di grado M si avrao M+1 equazioi i M+1 icogite, la matrice A sarà di dimesiioi (M+1)x(M+1), i vettori B e X avrao lughezza (M+1). I coefficieti della matrice da ivertire e i termii oti del problema risultao quelli del sistema: N x i x i x i A y i x i x i x i +1 B y i x i x i x i 3 x i + C = y i x i (9) +1 [ x i x i x i ] [ Z] [ y i x i ] Risolvedo tale sistema si ottegoo i valori A,B,C,...,Z da sostituire ella (), questa equazioe rappreseta la regressioe poliomiale di adattameto ai dati (x i,y i ).

La correlazione e la regressione. Antonello Maruotti

La correlazione e la regressione. Antonello Maruotti La correlazioe e la regressioe Atoello Maruotti Outlie 1 Correlazioe 2 Associazioe tra caratteri quatitativi Date due distribuzioi uitarie secodo caratteri quatitativi X e Y x 1 x 2 x y 1 y 2 y associate

Подробнее

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni A Alcui cocetti di statistica: medie, variaze, covariaze e regressioi Esistoo svariati modi per presetare gradi quatità di dati. Ua possibilità è presetare la cosiddetta distribuzioe, raggruppare cioè

Подробнее

Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi:

Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi: Isiemi umerici Soo oti l isieme dei umeri aturali: N {1,, 3,, l isieme dei umeri iteri relativi: Z {0, ±1, ±, ±3, N {0 ( N e, l isieme dei umeri razioali: Q {p/q : p Z, q N. Si ottiee questo ultimo isieme,

Подробнее

Regressione e correlazione

Regressione e correlazione Regressioe e correlazioe Regressioe e correlazioe I molti casi si osservao gradezze che tedoo a covariare, ma () Se c è ua relazioe di dipedeza fra due variabili, ovvero se il valore di ua variabile (dipedete)

Подробнее

La dinamica dei sistemi - intro

La dinamica dei sistemi - intro La diamica dei sistemi - itro Il puto materiale rappreseta ua schematizzazioe utile o solo per descrivere situazioi di iteresse diretto ma è ache il ecessario presupposto alla meccaica dei sistemi materiali

Подробнее

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie Approfodimeto 2.1 Scalig degli stimoli mediate il metodo del cofroto a coppie Il metodo del cofroto a coppie di Thurstoe (Thurstoe, 1927) si basa sull assuzioe che la valutazioe di u oggetto o di uo stimolo

Подробнее

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli Esercitazioi di Statistica Dott. Dailo Alui Fegatelli [email protected] Esercizio. Su 0 idividui soo stati rilevati la variabile X (geere) e (umero di auto possedute) X F F M F M F F M F M

Подробнее

STATISTICA 1 ESERCITAZIONE 5

STATISTICA 1 ESERCITAZIONE 5 STATISTICA ESERCITAZIONE 5 Dott. Giuseppe Padolfo 28 Ottobre 203 VARIABILITA IN TERMINI DI DISPERSIONE DA UN CENTRO Cetro Me o μ La dispersioe viee misurata come sitesi delle distaze tra le uità statistiche

Подробнее

Principio di induzione: esempi ed esercizi

Principio di induzione: esempi ed esercizi Pricipio di iduzioe: esempi ed esercizi Pricipio di iduzioe: Se ua proprietà P dipedete da ua variabile itera vale per e se, per ogi vale P P + allora P vale su tutto Variate del pricipio di iduzioe: Se

Подробнее

Esercitazioni di Statistica Dott.ssa Cristina Mollica [email protected]

Esercitazioni di Statistica Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Esercitazioi di Statistica Dott.ssa Cristia Mollica [email protected] Cocetrazioe Esercizio 1. Nell'ultima settimaa ua baca ha erogato i segueti importi (i migliaia di euro) per prestiti a imprese:

Подробнее

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Doatella Siepi [email protected] tel: 075 5853525 05 dicembre 2014 6 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazioe dei

Подробнее

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice Esercitazioe 12 Alfoso Iodice D Eza [email protected] Uiversità degli studi di Cassio () 1 / 15 Outlie 1 () 2 / 15 Outlie 1 2 () 2 / 15 Outlie 1 2 3 () 2 / 15 Outlie 1 2 3 4 () 2 / 15 Outlie 1 2 3 4 5

Подробнее

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea i Ecoomia e Fiaza Statistica 1 A.A. 2015/2016 (8 CFU, corrispodeti a 48 ore di lezioe frotale e 24 ore di esercitazioe) Prof. Luigi Augugliaro 1 / 21 Misura della dipedeza di u carattere

Подробнее

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C Quartili Primo quartile Q 1 : modalità che ella graduatoria (crescete o decrescete) bipartisce il 50% delle osservazioi co modalità più piccole o al più uguali alla Me Terzo quartile Q 3 : modalità che

Подробнее

Maturità scientifica Sessione ordinaria 1986/1987

Maturità scientifica Sessione ordinaria 1986/1987 Maturità scietifica Sessioe ordiaria 986/987 I u sistea di assi cartesiai ortogoali è assegata la faiglia di liee di equazioe a a. Si idividuio i tale faiglia la retta r e le due parabole C e C che co

Подробнее

Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati

Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati Esercitazioe parte Medie e medie per dati raggruppati el file dati0.xls soo coteute alcue distribuzioi di dati. Calcolare di ogua. Media aritmetica o Mostrare, co u calcolo automatico, che la somma degli

Подробнее

Stima della media di una variabile X definita su una popolazione finita

Stima della media di una variabile X definita su una popolazione finita Stima della media di ua variabile X defiita su ua popolazioe fiita otazioi: popolazioe, campioe e strati Popolazioe. umerosità popolazioe; Ω {ω,..., ω } popolazioe X variabile aleatoria defiita sulla popolazioe

Подробнее

Preparazione al corso di statistica Prof.ssa Cerbara

Preparazione al corso di statistica Prof.ssa Cerbara Preparazioe al corso di statistica Prof.ssa Cerbara Esistoo molti isiemi umerici, ciascuo co caratteristiche be precise. Alcui importatissimi isiemi umerici soo: N: isieme dei umeri aturali, cioè tutti

Подробнее

ESAME DI STATO DI LICEO SCIENTIFICO 2005 CORSO DI ORDINAMENTO Sessione ordinaria Tema di MATEMATICA - 23 giugno 2005

ESAME DI STATO DI LICEO SCIENTIFICO 2005 CORSO DI ORDINAMENTO Sessione ordinaria Tema di MATEMATICA - 23 giugno 2005 ESAME DI STATO DI LICEO SCIENTIFICO 005 CORSO DI ORDINAMENTO Sessioe ordiaria Tema di MATEMATICA - 3 giugo 005 Svolgimeto a cura del prof. Luigi Tomasi ([email protected]) RISPOSTE AI QUESITI DEL

Подробнее