REGRESSIONE LINEARE E POLINOMIALE
|
|
|
- Gabriele Rizzi
- 7 anni fa
- Просмотров:
Транскрипт
1 REGRESSIONE LINEARE E POLINOMIALE Nota ua tabella di dati relativi alle osservazioi di due gradezze X e Y, è aturale formulare ipotesi su quale possa essere ua ragioevole fuzioe che rappreseti o che approssimi la relazioe tra X e Y. Il metodo dei miimi quadrati è ua risposta largamete codivisa a tale problema. Di seguito si preseta iizialmete il modello più semplice di regressioe, quello lieare, per trattare poi casi più complessi i cui il modello di regressioe è di tipo polioomiale. Il modello classico di regressioe lieare semplice Il modello di regressioe lieare semplice suppoe ua relazioe lieare tra x e y, ovvero y = + x + e (1) dove ß 1 e ß soo i parametri della cosiddetta retta di regressioe, i quali devoo essere opportuamete valutati sulla base delle osservazioi ed e rappreseta u termie d errore. Le ipotesi del modello classico di regressioe lieare semplice implicao che la y i sia costituita dalla somma di ua compoete determiistica ß 1 + ß x i e ua termie di scarto e i y i = + x i + e i () ifatti i valori x i della variabile esplicativa soo fissati e ß 1 e ß soo parametri e quidi costati. Per stimare i parametri ß 1 e ß del modello di regressioe si cosidera u campioe costituito da coppie di valori (x 1, y 1 ), (x, y ),..., (x, y ), dove x 1, x,..., x soo i valori degli igressi e y 1, y,..., y soo i valori delle osservazioi. Le osservazioi possoo essere rappresetate i u grafico a dispersioe come esemplificato ella Figura 1. Figura 1. Osservazioi sul modello di regressioe
2 Le stime soo costituite dai valori dei parametri cui corrispode la retta che approssima al meglio i dati. A tal fie si cosiderao le distaze dei puti (x i, y i ) dalla retta di regressioe, ovvero gli scarti e i = y i ( + x i ) per i = 1,,, (3) e i valori di ß 1 e ß soo scelti i modo tale da miimizzare le distaze dei puti (x i, y i ) dalla retta di regressioe stimata. Poiché alcue distaze soo positive e altre egative, si cosidera la somma delle distaze al quadrato Q(, ) = (y i x i ) (4) Figura. Distaza del puto (x i, y i ) dalla retta di regressioe Le stime del metodo dei miimi quadrati soo quei valori ß i che miimizzao la somma dei quadrati delle distaze, per le quali cioè si ha Q(, 1 ) = mi 1, Q(, ) (5) Derivado si ottiee Q(, ) = (y i x i ) 1 Q(, ) = (y i x i )x i 1 (6) Poedo le derivate uguali a zero e dividedo etrambi i membri per - si ottegoo le equazioi: (y i x i ) = 0
3 (y i x i )x i = 0 (7) Distribuedo la sommatoria ella prima equazioe si ha y i 1 x i = y x = 0 (8) 1 dove x e y soo le medie aritmetiche dei valori degli igressi e delle osservazioi. Dividedo per e risolvedo rispetto a 1 si ottiee la stima dell itercetta: 1 = y x (9) e quidi = (y i y )x i (x i x ) x i (10) La retta di regressioe stimata ha la seguete equazioe ŷ i = 1 + x i (11) Essa passa per il puto di coordiate (x,y ) ; ifatti dalla formula della stima dell'itercetta si ha y = ß 1 + ß x Figura 3. La retta stimata passa per il puto di coordiate (x, y) Notazioe vettoriale della soluzioe dei miimi quadrati Si cosideri la somma delle distaze al quadrato: ε = [ y ( 1 + x)] (1)
4 dove: y corrispode al vettore dei dati misurati; 1 + x rappreseta la retta di regressioe; e rappresetao i parametri di regressioe lieare (vettori coloa); N è la lughezza del vettore; La (1) diveta: ε =[ y - ( 1 + x) ] T [y - ( 1 + x)] = y T y - y T x - y T 1 + x T x - x T y + x T 1 1 T y + 1 T x + 1 T 1= y T y - y T x - y T 1 + x T x ( x T y ) T + x T 1 ( 1 T y ) T + + (1 T x ) T + 1 T 1 = y T y - y T 1 - y T x + x T x + N + x T 1 I coefficieti e si determiao i modo da miimizzare ε, poedo a zero le derivate parziali di ε rispetto ad e rispetto a : ε = y T x + x T x + x T 1 = 0 ε = y T 1 + x T 1 + N = 0 x T x + x T 1 = y T x x T 1 + N = y T 1 = y T x x T 1 y T 1 N x T x x T 1 x T 1 N = N yt x ( x T 1)( y T 1) Nx T x x T 1 = N k x k y k k x k k y k N N k=1 x k ( x i )
5 = x T x y T x x T 1 y T 1 x T x x T 1 x T 1 N = ( xt x)( y T 1) ( y T x)( x T 1) Nx T x x T 1 = k x k k y k k x k y k k x k N N k=1 x k ( x i ) oppure si ricava i fuzioe di : = yt 1 x T 1 N Le espressioi simboliche sembrao iguardabili, ma si possoo riscrivere i ua forma più leggibile. Se si idica co - X la media aritmetica di x = {x i,, x } cioè 1 x i - Y la media aritmetica di y = {y i,, y } cioè 1 y i - X la media aritmetica di x = {x i,, x } cioè 1 x i - XY la media aritmetica di xy = {x i y i,, x y } cioè 1 allora dividedo per il sistema diveta X + 1 X = XY x i y i X + = Y (13) La secoda equazioe mette i luce che il baricetro (X, Y ) cioè il puto le cui coordiate soo la media delle ascisse e la media delle ordiate, appartiee alla retta di regressioe, perché soddisfa l equazioe y = + x. Si può ora scrivere la soluzioe mediate u espressioe simbolica più semplice: = XY X Y (14) X X = Y X (15) Regressioe lieare multipla Nel modello di regressioe semplice le variazioi delle osservazioi soo spiegate mediate ua sola variabile d igresso. Si ottiee così u modello molto semplice che tuttavia o è sempre i grado di spiegare i feomei di iteresse i maiera adeguata.
6 U modello di regressioe multipla spiega la variabile dipedete y i fuzioe di k variabili esplicative o regressori, co k >, y = + x + 3 x k x k + ε (16) Per covezioe la prima variabile esplicativa e costate x 1 = 1. Il primo coefficiete di regressioe rappreseta quidi l itercetta del modello. Il modello di regressioe multipla può essere rappresetato i termii matriciali: Si cosideri u campioe di umerosità sul modello di regressioe lieare multipla y = + x i + 3 x 3i + + k x ki + ε i per i = 1,,. (17) Sia Y u vettore le cui compoeti soo costituite dalle variabili y 1, y,..., y e X ua matrice di dimesioi k co i valori delle variabili esplicative, y 1 1 x 1 x k1 Y = y, X = 1 x x k (18) [ y ] [ 1 x x k ] Nella matrice X ogi coloa corrispode ad u regressore: la prima coloa ha tutti elemeti uitari, la secoda cotiee i valori osservati di x e così via fio all ultima coloa che cotiee i valori di x k. Si defiisce quidi il vettore, di dimesioe, co i parametri del modello di regressioe e il vettore, di dimesioi, co gli scarti ε 1 = ε = ε (19) [ ] [ ε ] I forma matriciale il problema è rappresetato da Y = Xβ + ε (0) che corrispode a
7 y 1 = β 1 + β x 1 + β 3 x 31 + β k x k1 + ε 1 y = β 1 + β x + β 3 x 3 + β k x k + ε (1) y = β 1 + β x + β 3 x 3 + β k x k + ε Regressioe poliomiale Si propoe di descrivere alcue curve di adattameto co il metodo dei miimi quadrati e di forire u metodo iterativo per geeralizzare tali fuzioi a poliomi di grado M. Spesso si può esprimere ua variabile, y, come poliomiale di ua secoda variabile x : y = A + Bx + C x Z x M + ε () Si suppoga per esempio di avere ua poliomiale di forma quadratica, y = A + Bx + C x + ε (3) ota ua serie di valori (xi, yi ), i = 1,..,N per ogi xi il valore yi si ottiee dalla (3) dove A,B,C soo acora icogite. La miglior stima per A,B,C è data da quei valori per cui la sommatoria degli scarti quadratici (i otazioe vettoriale) è miima. Si differezi quidi rispetto a A,B,C : ε N A = (A y i + Bx i + Cx i ) N ε B = 1 σ (Bx i x i y i + Ax i + Cx 3 i ) y ε N = 1 C σ (C 4 y x y i x i i + A x i + Bx 3 i ) (4) poedo uguale a zero, omettedo gli estremi di sommatoria: y i = AN + B x i + C x i y i x i = A x i + B x 3 i + C x i y i x i = A x i + B x i 3 + C x i 4 (5) si tratta si u sistema 3x3 che i forma matriciale diveta
8 N x i x i A y i x i x i x i 3 B = y i x i (6) 3 [ x i x i x 4 i ] [ C] [ y i x i ] che è del tipo A X = B (7) e si può risolvere i diversi modi tra cui: X = A 1 B (8) Trovati i valori di A,B,C si sostituiscoo ella (3). I geerale voledo ricavare ua poliomiale di grado M si avrao M+1 equazioi i M+1 icogite, la matrice A sarà di dimesiioi (M+1)x(M+1), i vettori B e X avrao lughezza (M+1). I coefficieti della matrice da ivertire e i termii oti del problema risultao quelli del sistema: N x i x i x i A y i x i x i x i +1 B y i x i x i x i 3 x i + C = y i x i (9) +1 [ x i x i x i ] [ Z] [ y i x i ] Risolvedo tale sistema si ottegoo i valori A,B,C,...,Z da sostituire ella (), questa equazioe rappreseta la regressioe poliomiale di adattameto ai dati (x i,y i ).
La correlazione e la regressione. Antonello Maruotti
La correlazioe e la regressioe Atoello Maruotti Outlie 1 Correlazioe 2 Associazioe tra caratteri quatitativi Date due distribuzioi uitarie secodo caratteri quatitativi X e Y x 1 x 2 x y 1 y 2 y associate
Alcuni concetti di statistica: medie, varianze, covarianze e regressioni
A Alcui cocetti di statistica: medie, variaze, covariaze e regressioi Esistoo svariati modi per presetare gradi quatità di dati. Ua possibilità è presetare la cosiddetta distribuzioe, raggruppare cioè
Insiemi numerici. Sono noti l insieme dei numeri naturali: N = {1, 2, 3, }, l insieme dei numeri interi relativi:
Isiemi umerici Soo oti l isieme dei umeri aturali: N {1,, 3,, l isieme dei umeri iteri relativi: Z {0, ±1, ±, ±3, N {0 ( N e, l isieme dei umeri razioali: Q {p/q : p Z, q N. Si ottiee questo ultimo isieme,
Regressione e correlazione
Regressioe e correlazioe Regressioe e correlazioe I molti casi si osservao gradezze che tedoo a covariare, ma () Se c è ua relazioe di dipedeza fra due variabili, ovvero se il valore di ua variabile (dipedete)
La dinamica dei sistemi - intro
La diamica dei sistemi - itro Il puto materiale rappreseta ua schematizzazioe utile o solo per descrivere situazioi di iteresse diretto ma è ache il ecessario presupposto alla meccaica dei sistemi materiali
Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie
Approfodimeto 2.1 Scalig degli stimoli mediate il metodo del cofroto a coppie Il metodo del cofroto a coppie di Thurstoe (Thurstoe, 1927) si basa sull assuzioe che la valutazioe di u oggetto o di uo stimolo
Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli
Esercitazioi di Statistica Dott. Dailo Alui Fegatelli [email protected] Esercizio. Su 0 idividui soo stati rilevati la variabile X (geere) e (umero di auto possedute) X F F M F M F F M F M
STATISTICA 1 ESERCITAZIONE 5
STATISTICA ESERCITAZIONE 5 Dott. Giuseppe Padolfo 28 Ottobre 203 VARIABILITA IN TERMINI DI DISPERSIONE DA UN CENTRO Cetro Me o μ La dispersioe viee misurata come sitesi delle distaze tra le uità statistiche
Principio di induzione: esempi ed esercizi
Pricipio di iduzioe: esempi ed esercizi Pricipio di iduzioe: Se ua proprietà P dipedete da ua variabile itera vale per e se, per ogi vale P P + allora P vale su tutto Variate del pricipio di iduzioe: Se
Esercitazioni di Statistica Dott.ssa Cristina Mollica [email protected]
Esercitazioi di Statistica Dott.ssa Cristia Mollica [email protected] Cocetrazioe Esercizio 1. Nell'ultima settimaa ua baca ha erogato i segueti importi (i migliaia di euro) per prestiti a imprese:
UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:
UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Doatella Siepi [email protected] tel: 075 5853525 05 dicembre 2014 6 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazioe dei
Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice
Esercitazioe 12 Alfoso Iodice D Eza [email protected] Uiversità degli studi di Cassio () 1 / 15 Outlie 1 () 2 / 15 Outlie 1 2 () 2 / 15 Outlie 1 2 3 () 2 / 15 Outlie 1 2 3 4 () 2 / 15 Outlie 1 2 3 4 5
Statistica 1 A.A. 2015/2016
Corso di Laurea i Ecoomia e Fiaza Statistica 1 A.A. 2015/2016 (8 CFU, corrispodeti a 48 ore di lezioe frotale e 24 ore di esercitazioe) Prof. Luigi Augugliaro 1 / 21 Misura della dipedeza di u carattere
Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C
Quartili Primo quartile Q 1 : modalità che ella graduatoria (crescete o decrescete) bipartisce il 50% delle osservazioi co modalità più piccole o al più uguali alla Me Terzo quartile Q 3 : modalità che
Maturità scientifica Sessione ordinaria 1986/1987
Maturità scietifica Sessioe ordiaria 986/987 I u sistea di assi cartesiai ortogoali è assegata la faiglia di liee di equazioe a a. Si idividuio i tale faiglia la retta r e le due parabole C e C che co
Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati
Esercitazioe parte Medie e medie per dati raggruppati el file dati0.xls soo coteute alcue distribuzioi di dati. Calcolare di ogua. Media aritmetica o Mostrare, co u calcolo automatico, che la somma degli
Stima della media di una variabile X definita su una popolazione finita
Stima della media di ua variabile X defiita su ua popolazioe fiita otazioi: popolazioe, campioe e strati Popolazioe. umerosità popolazioe; Ω {ω,..., ω } popolazioe X variabile aleatoria defiita sulla popolazioe
Preparazione al corso di statistica Prof.ssa Cerbara
Preparazioe al corso di statistica Prof.ssa Cerbara Esistoo molti isiemi umerici, ciascuo co caratteristiche be precise. Alcui importatissimi isiemi umerici soo: N: isieme dei umeri aturali, cioè tutti
ESAME DI STATO DI LICEO SCIENTIFICO 2005 CORSO DI ORDINAMENTO Sessione ordinaria Tema di MATEMATICA - 23 giugno 2005
ESAME DI STATO DI LICEO SCIENTIFICO 005 CORSO DI ORDINAMENTO Sessioe ordiaria Tema di MATEMATICA - 3 giugo 005 Svolgimeto a cura del prof. Luigi Tomasi ([email protected]) RISPOSTE AI QUESITI DEL
