Un accenno ai metodi di regressione lineare Il problema: Determinazione della miglior retta in grado di descrivere la relazione lineare che intercorre tra due variabili a partire dalle loro misura sperimentale (ammesso che una relazione lineare esista ) Consideriamo cioè: Ncoppiedimisure(x i,y i ) con i =1,...,N Supponiamo che tra x e y sussista una relazione lineare Assumiamo inoltre, per semplicità, che l errore sperimentale sulla variabile x sia trascurabile (y variabile risposta e x variabile esplicativa ) y i = ax i + b + ï i
Metodo dei minimi quadrati (1) o metodo di Gauss Definiamo quindi: ï i = y i à y t i con y t i = ax i + b Per cui si ha: ï i = y i à ax i à b Sia inoltre û 2 i l 0 errore sperimentale sull 0 i à esimo valore di y ï 2 i û 2 i Scarto quadratico in rapporto all errore di misura
N N (y i àax i àb) 2 Metodo dei minimi quadrati (2) z = P i=1 ï 2 i = P û 2 i i=1 û 2 i Il problema si riduce quindi a trovare i valori di a e b in grado di rendere minimo z. z = z(a, b) z = a N à2 P i=1 x i (y i àax i àb) =0 û 2 i z = b N à2 P i=1 (y i àax i àb) =0 û 2 i
Metodo dei minimi quadrati (3) Per cui, risolvendo il sistema di 2 equazioni in 2 incognite dopo aver posto: N S x = P i=1 N S xx = P i=1 N x 2 i S û 2 xy = P i i=1 N x i S y = P û 2 i i=1 x i y i û 2 i N y i û 2 S i 0 = P i=1 1 û 2 i
Metodo dei minimi quadrati (Soluzione) Si ricava: E con S y ás xx às x S xy S a = xy ás 0 às x S y Sxx b = ás 0 às 2 x SxxáS 0 às 2 x û 2 i = û2 = costante a xyàxöáyö = x2 àxö 2 b x = 2 àxöáxy x2 àxö 2
Ancora sulla regressione lineare semplice La miglior retta così determinata passa per il punto di coordinate: x ã = PN x i û 2 i=1 i PN i=1 1 û 2 i y ã = PN y i û 2 i=1 i PN i=1 1 û 2 i Baricentro dei dati sperimentali Errore sui parametri S xx û 2 S (a) = 0 S û 2 (b) = 0 S xx às 2 x S 0 S xxàs 2 x
La distribuzione di Gumbel Deriva da una distribuzione degli x i del campione di tipo esponenziale (ma anche altre distribuzioni a coda grassa sono buone candidate: Weibull, Gamma, Lognormale ) Convergono ad un esponenziale per valori elevati di X F X(k) (x)= P n ðñ n j [ F X (x) ] j [ 1àF X (x) ] nàj j=k Beta F XMAX (x)=[ F X (x) ] n =(1àe àõx ) n F XMAX (x)=[ F X (x) ] n (xàu) = e àeà ë
Ancora sulla distribuzione di Gumbel f XMAX (x)= 1 ë exp[à (xàu) ë àe à (xàu) ë ] con à <x<+ 6 ù á û XMAX n e 6 u = ö XMAX à ù û XMAX u = ö XMAX à0.5772 á ë
Carta di Gumbel La distribuzione di Gumbel F(x) = exp{-exp[-(x - u)/α ] } con la trasformazione lineare y = ( x - u )/α si riduce all espressione F(x) = exp{-exp(-y) } La carta probabilistica di Gumbel è una carta che ha sui due assi rispettivamente le variabili x e y. Sulla carta probabilistica ogni distribuzione di Gumbel è rappresentata da una retta.
Un esempio: distribuzione delle precipitazioni estreme a Chiavari (Genova)
Un po di bibliografia Curve di possibilità pluviometrica con à <x<+ Ugo Moisello (1999), Idrologia Tecnica, La Goliardica Pavese A.A.V.V.(1999), Sistemi di Fognatura: Manuale di progettazione, a cura del Centro Studi Idraulica Urbana, Hoepli Editore h(d, T)=a(T) á d b Relazione altezza-durata per assegnato T ð 1 R f =1à 1 à T costante Relazioni Altezza-Durata e Intensità-durata i ö (d, T)=a(T) á d bà1 ñ N Rischio di fallanza su un periodo di N anni Relazione intensità media-durata per assegnato T
Alcuni semplici passaggi per la costruzione delle curve di possibilità pluviometrica a partire da una legge probabilistica di gumbel per gli estremi annuali di precipitazione Supponiamo di voler valutare la massima altezza totale di pioggia h che si verifica con assegnato tempo di ritorno T ed in funzione della durata d. Come abbiamo già avuto occasione di osservare, una schematizzazione semplice della legge di dipendenza di h da T e d può essere: h(d, T)=a(T) á d b Supponiamo inoltre che la distribuzione di probabilità dei massimi annuali di precipitazione (per durata d assegnata) sia di tipo EV1 (Gumbel): F X (x)=e àeà (xàu) ë
F X (x)=e àeà (xàu) ë Alcuni semplici passaggi per la costruzione delle curve di possibilità pluviometrica (2) Data quindi la variabile ridotta y: n h ð ñio T h = c 1 à k ln ln Tà1 á d b xàu y = ë Che per assegnato T possiamo anche scrivere come: h ð T y T = àln ln Tà1 ñi 0.78ác k = vunico 1à0.45ácv unico Sotto l ipotesi di Gumbel si ricava quindi con un po di algebra: n h ð ñio T h(d, T)=c 1 àkln ln Tà1 á d b s D c 2 vd c vunico = D 1 P d=1
Alcuni semplici passaggi per la costruzione delle curve di possibilità pluviometrica (3) Se andiamo ora a calcolare il tempo di ritorno T corrispondente alla media delle altezze µ h (per una qualsiasi durata) si ha: Tà1 T = exp{à exp[àë(ö h à ö h +0.45û h )]} =0.57 1 T = (1à0.57) =2.32 E sostituendo nell espressione di a(t) per tutte le curve si ha: ð ñ 2.32 a = c á{1àkln[ln 2.32à1 ]} = = c á ( 1+0.577k)
Da cui si ottiene che se: a = c á ( 1+0.577k) Alcuni semplici passaggi per la costruzione delle curve di possibilità pluviometrica (4) ö h = c á ( 1+0.577k)á d b Ponendo quindi: ö hd y d = ( 1+0.577k) y d = c á d b E linearizzando: ln(y d ) = ln(c)+b á ln(d) Per cui c e b possono essere stimati, tramite una regressione lineare, dal diagramma sperimentale ln(y) in funzione di ln(d)
ln(y) Alcuni semplici passaggi per la costruzione delle curve di possibilità pluviometrica (5) ln(d)
Un esempio: le cpp di Chiavari
Ietogramma Chicago