Verfca e scelta del modello probablstco L elaborazoe statstca de dat comporta u certo umero d potes, qual ad esempo la forma della dstrbuzoe ed l metodo utlzzato per stmare parametr. Data ua qualsas potes statstca H 0, occorre msurare la valdtà d frote all potes alteratva H, ache se o esplctamete formulata. U test statstco è u procedmeto che cosete d decdere, sulla base delle osservazo a dsposzoe, se accettare l potes H 0 oppure rgettarla. S dce lvello d sgfcatvtà del test la probabltà! d rgettare l potes H 0 quado essa è vera (errore d tpo I), metre s defsce poteza del test la probabltà d rgettare H 0 quado essa è falsa. Questa probabltà vale -", dove " è la probabltà d commettere u errore d tpo II (accettare H 0 quado vale H ). S ot che, evtablmete, a partà d umero d osservazo la rduzoe del lvello d sgfcatvtà abbassa la poteza del test. Ovvamete esste ua varetà d test che rspeccha la varetà delle potes da provare. C occuperemo de test att a provare l potes che ua data varable casuale sa dstrbuta secodo ua assegata fuzoe d probabltà, ot ache come test d adattameto. Ess cosstoo el valutare l adattameto d ua legge probablstca F X (x) ad u seme d osservazo, ossa l potes H 0 che F X (x) sa la dstrbuzoe d probabltà da cu è stato estratto l campoe a dsposzoe. Il test d Pearso o del! Il test d Pearso rchede che l campo d essteza della varable x vega suddvso k tervall che s escludoo a vceda. Se l -esmo tervallo è defto dagl estrem x f ed x sup, s avrà che la probabltà che u osservazoe qualsas rcada ell -esmo tervallo, se l potes H 0 è vera, vale p = FX ( x sup )! FX ( x f ). Il umero atteso d elemet ell tervallo -esmo, sempre se H 0 è vera, vale pertato p. Il test d Pearso cosste el cofrotare tale umero co l umero d osservazo che effettvamete rcadoo ell tervallo,. Se s vogloo cofrotare tutt gl tervall cotemporaeamete, s può utlzzare la gradezza statstca (detta test statstc )
X = k! = ( " p ) p. Al crescere d la test statstc del test d Pearso è astotcamete dstrbuta come ua dstrbuzoe del ch-quadrato co k- grad d lbertà, quado parametr della dstrbuzoe potetca o soo stat stmat dalle osservazo. Il fatto che la dstrbuzoe astotca (del chquadrato) sa ota cosete d effettuare l test adado a cofrotare l valore della statstca emprca rscotrato per ua data dstrbuzoe ed u dato campoe co quello della dstrbuzoe teorca, otteuto prededo l quatle (-!) della dstrbuzoe del ch-quadrato co k- grad d lbertà, #!" ( k! ). Se X < #! " ( k! ) s è ella regoe d accettazoe del test, altrmet l potes H 0 vee rgettata al lvello d sgfcatvtà!. Due problem lmtao l applcazoe del test d Pearso: l prmo è legato alla soggettvtà ella scelta degl tervall d classe, ed l secodo al fatto che parametr soo stmat dalle stesse osservazo che vegoo sottoposte a test. Relatvamete al prmo puto, specfc stud hao mostrato che la poteza del test vee massmzzata quado s scelgoo class equprobabl, k p = p =... = pk =, co k! 0.4 =. No covee vece fssare l umero atteso d elemet og classe a 5, p = 5, come talvolta suggerto, perché tale scelta adrebbe a scapto della poteza del test. I lmt della classe -esma sarao allora quatl della dstrbuzoe F, x x sup f = F = F ' X ' X & # $! % k " & ' # $! % k " Ad esempo, per la dstrbuzoe d Gumbel s hao & & x sup = ) '( l$ ' l$ % % x f k ##!! "" & & ' # # = ) '( l$ ' l$!! % % k "" S ot che tal caso la statstca X assume la forma X = k k! = ' % ( & k $ " # proporzoale alla varaza della varable casuale.
Il secodo e pù mportate problema del test d Pearso rguarda l caso cu la dstrbuzoe F abba s parametr da stmare, e che quest sao stat stmat dalle osservazo, come quas sempre avvee ambto drologco. I tal caso la dstrbuzoe astotca della test statstc d Pearso o può essere defta co esattezza. Tutto quato s può dre è che, se s utlzza l metodo della massma verosmglaza, tale dstrbuzoe è compresa tra quella del ch-quadrato co k- grad d lbertà e quella del ch-quadrato co k-s- grad d lbertà. S ha qud ua eludble certezza el defre lmt d accettazoe del test. I partcolare s avrà che l test è scuramete passato se X < #! " ( k! s! ), metre l potes H 0 va rgettata se X > #! " ( k! ). Quado vece #!" ( k! s! ) < X < #! " ( k! ), s ha che l test o è grado d forre ua rsposta uvoca. Quado vece della massma verosmglaza s utlzzao altr metod d stma de parametr, qual l metodo de momet o degl L-momet, o s può eache pù affermare che la dstrbuzoe astotca è compresa tra quella del ch-quadrato co k- grad d lbertà e quella del ch-quadrato co k-s- grad d lbertà, e dveta qud assa complcato effettuare l test. Se a questo s agguge che l test d Pearso tede geerale ad essere molto meo potete d altr test a partà d dmesoe campoara, a causa del fatto che dat vegoo raggruppat per costrure la test statstc, s comprede che l utlzzo d tale test adrebbe evtato quado la dmesoe campoara è more d u cetao d elemet ed parametr stmat soo pù d due, ossa ella quas totaltà delle applcazo drologche. 3
Il test del massmo valore Per dmostrare che alcu cas la legge del valore estremo EV o è adeguata a descrvere le sce degl estrem drologc, s può far rcorso ad u test molto semplce, el quale la statstca d rfermeto è l valore massmo tra dat del campoe. L potes H 0 da sottoporre a verfca è: Il valore massmo X appartee alla dstrbuzoe de massm d ua varable d Gumbel? Per la statstca X è semplce rcavare per va dretta la dstrbuzoe. Ifatt, come rsulta dal procedmeto d costruzoe della dstrbuzoe del massmo d ua varable casuale, s ha: X ( x) [ F ( )] N ( ) X x F N = Se la varable F X (x) è ua Gumbel, la dstrbuzoe del massmo d u campoe d N dat estratt da ua Gumbel è pertato: F X ( N ) x $ ( ) = e "e " & % ( X "# ) # L espressoe precedete è acora ua legge d Gumbel. S vede fatt che: ' ) ( N e " Ne "! ( X "! ) " ( x"! ) l N! " e e = e * per cu, potzzado ua dstrbuzoe d Gumbel co u uovo valore modale!, questo rsulta dall equvaleza: e "e " ( ) # X "# * = e "e " ( X "# )+l N # per cu: " * ( X "# # ) = " ( x "# # ) + ln x "# * = x "# "# l N " * = " +" l N 4
La uova dstrbuzoe è qud acora ua Gumbel, ma co u parametro! cremetato: F X ( N ) x ( ) = e "e " X " # +# l N # ( [ ] ) I carta probablstca d Gumbel cò equvale a traslare della quattà. " l N la retta d Gumbel orgara. Nota qud la dstrbuzoe della statstca test se e deduce l tervallo d accettazoe, fuzoe del lvello d sgfcatvtà!. Se! = 5%, trattados d u cotrollo per estrem postv, s lasca l errore solo da u lato, per cu rsulta che l lmte d accettazoe postvo per X (N) X( F X ( N ) =0.95). D cosegueza, se l valore max campoato su N dat rsulta essere superore al valore lmte al 95% de massm su N dat estratt da ua Gumbel, tale dstrbuzoe mostra d essere adatta a rappresetare l campoe, almeo ella sua coda postva. S rede qud ecessaro far rcorso a dstrbuzo pù asmmetrche. è 0.999 " L N 000 0.995 GUMBEL 00 Probabltà cumulata 0.99 0.95 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.0 0.0 0.05 0.0 0.0 Q,0.95 0 500 000 500 000 500 300 Max auale delle portate al colmo d pea [mc/s] 00 0 0 5 [T] Regoe d accettazoe 5
I test basat sulla fuzoe d frequeza cumulata U altra categora d test d adattameto è basata sul cofroto tra la dstrbuzoe d probabltà corrspodete all potes H 0 e la fuzoe d frequeza cumulata, che è ua fuzoe a grad defta come F ( x) = 0, F ( x) =, F ( x) =, x < x() x()! x < x(+ ) x()! x dove x () dca l -esma order statstc, ossa l -esmo elemeto della sere campoara ordata orde crescete. Questa categora d test d adattameto è basata sulla valutazoe dello scostameto tra la dstrbuzoe potetca, F X (x) e la fuzoe d frequeza cumulata F (x) (vedere ad esempo la Fgura ). 0.9 0.85 0.8 F X (x) ; F (x) 0.75 0.7 0.65 0.6 D(x) 0.55 0.5 Fuzoe emprca F (x) Dstrbuzoe teorca F X (x) 0.45 0.4 0.6 0.8..4.6.8..4 x Fgura : Scostameto tra la dstrbuzoe d frequeza emprca cumulata e la dstrbuzoe teorca potzzata. Come msura dello scostameto s può utlzzare la dstaza massma tra le due fuzo valore assoluto, D = max F ( x) F ( x), el qual caso s ha l test d Smrov-Kolmogorov. Quado X! l potes H 0 è vera, la dstrbuzoe d D tede astotcamete ad ua forma ota, l che cosete d determare la regoe d accettazoe del test utlzzado opportue tabelle fuzoe del lvello d sgfcatvtà del test. Per esempo, per! = 0.05 ed > 50 s ha che la regoe d 8
accettazoe cocde co l seme de valor D per cu. 358 D!. Occorre però prestare molta attezoe all applcazoe del test d Smrov-Kolmogorov, dal mometo che lmt d accettazoe vst sopra valgoo solo el caso cu parametr d F X (x) o sao stmat utlzzado le osservazo. Nel caso opposto, che è l pù comue ambto drologco, s ha che la stma de parametr tede ad avvcare la fuzoe d frequeza cumulata alla dstrbuzoe potetca. A ttolo d esempo, s rporta ella Fgura l caso d ua dstrbuzoe emprca de massm au de colm d pea su qual è stata adattata ua dstrbuzoe a parametr ( questo caso ua Gumbel) ed ua a 3 parametr ( questo caso ua GEV, che corrspode ad ua geeralzzazoe della Gumbel). S ot come la dstrbuzoe GEV s adatt certamete meglo a dat, al prezzo però d u ulterore parametro da stmare. 0.95 0.9 0.85 0.8 F(x) 0.75 0.7 0.65 0.6 0.55 Fuzoe emprca Dstrbuzoe a 3 parametr Dstrbuzoe a parametr.5.5 3 3.5 x Fgura : Esempo d adattameto alla curva emprca d ua dstrbuzoe a parametr e d ua a 3 parametr, co parametr stmat dal campoe. Icremetado l umero d parametr della dstrbuzoe stmat drettamete dal campoe s ottegoo qud de valor d D molto feror rspetto a prma e o s possoo utlzzare le.358 tabelle otteute el caso o parametrco per effettuare l test: l valore lmte, che el caso o parametrco corrspode ad! = 0.05, el caso cu s stmao parametr vee vece a corrspodere ad u lvello d sgfcatvtà toro a 0.005. Questo sgfca che l potes H 0 verrebbe quas sempre accettata, rededo sostazalmete utle l test. Esstoo tabelle che 9
rportao lmt d accettazoe corrett da utlzzare el caso cu s stmo parametr dalle osservazo: l problema è che però lmt d accettazoe dpedoo questo caso ache dalla forma della dstrbuzoe potetca, e questo comporta la ecesstà d avere ua dversa tabella per og dstrbuzoe che s vuole sottoporre a test. I partcolare esstoo tabelle per la dstrbuzoe ormale e la dstrbuzoe d Gumbel (che cosetoo d sottoporre a test ache la log-ormale e la EV), metre per la Gamma a tre parametr e la GEV o esstoo tabelle altrettato semplc. 0
Ua secoda categora d statstche, sempre apparteet a questa famgla, s basa su ua msura dello scostameto medo quadratco tra la fuzoe d frequeza cumulata e la dstrbuzoe potetca (Test d Cramer Vo Mses), Q = " X X )! allx ( F ( x) F ( x) ) f ( x dx Se vece della meda semplce s utlzza ua fuzoe d peso atta ad attrbure maggore mportaza agl scostamet sulle code delle due dstrbuzo, s ottee l mportate test statstc d Aderso Darlg: A ( F x F x ) ( ) " X ( ) = f X ( x) dx! FX ( x) ( " FX ( x) ) allx La statstca d Aderso-Darlg vee calcolata utlzzado la seguete espressoe, che cosete d evtare d dover calcolare l tegrale vsto sopra og volta che s vuole fare l test: A = " "! { ( " ) l( F ) + ( + " ) ( " ) } X ( x( ) l FX ( x( ). =
Ache per l test d Aderso esstoo gl stess problem rscotrat per l test d Kolmogorov, ossa s deve fare rfermeto ad ua dversa tabella per og dstrbuzoe cosderata quado parametr soo stmat base alle osservazo. Nelle applcazo pratche covee trasformare la varable A tramte le relazo & " = 0.0403 + 0.6 A # $ ) p ( ' % + p *, p 0.85 se. " A p!,. % " = 0.0403+ 0.6 0.# ( p. ' & $ * p ) -. + p 0.85 / 0 A 0.# p # p se.! A p > dove! p,! p, ed! p soo coeffcet, dvers per og dstrbuzoe, tabulat Lao (004) e rportat pù sotto, dove " 3 = k, ovvero l parametro d forma della dstrbuzoe. Ua volta effettuata la trasformazoe d cu sopra, l potes può essere accettata se! è more d 0.347 (co! = 0.0), 0.46 (co! = 0.05) e 0.743 (co! = 0.0) Test basat sugl L-momet Questa categora d test s basa sul fatto che, per og dstrbuzoe co solo u parametro d L poszoe ed uo d scala, l coeffcete d L-asmmetra,! 3 3 =, è uvocamete defto, ossa L ha u valore uco dpedetemete da parametr. I partcolare, s ha per la dstrbuzoe 9 ormale! 3 = 0, e per la dstrbuzoe d Gumbel " 3 = log( ) / log()! 0. 699. Ioltre, la 8 dstrbuzoe de coeffcet d L-asmmetra campoar tede astotcamete ad ua dstrbuzoe ormale, e la botà dell approssmazoe ormale co pccol è molto mglore d quella che s ha per l coeffcete d asmmetra classco. Queste propretà possoo essere sfruttate
per costrure u test basato sulla dstaza tra l coeffcete d L-asmmetra campoaro! ˆ 3 e quello teorco, ota la varaza d! ˆ 3 per og dstrbuzoe d teresse, & 0.8 # var( ' ˆ3 ) = $ 0.866 +! % " & 0.7 # var( ' ˆ3 ) = $ 0.36 +! % " dstrbuzoe ormale dstrbuzoe d Gumbel Dato u campoe d dat, s determa! ˆ 3 e s defsce la test statstc come Z =! ˆ3 "! 3 var(! ˆ3) Z avrà ua dstrbuzoe ormale stadardzzata (ossa co meda zero e varaza utara) se l potes H 0 è vera. Per effettuare l test è qud suffcete cofrotare l valore d Z co quatl "! e +! d ua dstrbuzoe ormale stadardzzata (l test è a due code). Se z l potes H 0 è accettata co lvello d sgfcatvtà!, altrmet H 0 è rgettata. "! < Z < z+! I partcolare s hao 'ˆ3 Z orm = & 0. 8 # $ 0.866 +! % " ' Z = (ˆ3 0.699 gumb & 0. 7 # $ 0.36 +! % " che adrao cofrotat, ad esempo, co lmt.96 e +.96 quado l lvello d sgfcatvtà è 0.0. Ua cotroprova grafca della correttezza d applcazoe della procedure può vere dal dagramma degl L-momet: se l puto corrspodete ad L-skew ed L-kurt emprc è vco a put relatv alla Gumbel o alla ormale è probable che l test vega passato. Ache questa categora d test può essere utlzzata per testare le dstrbuzo log-ormale ed EV, logtrasformado prelmarmete dat a dsposzoe e rapplcado la procedura vsta sopra co l coeffcete d L-asmmetra de dat campoar trasformat logartmcamete. L estesoe a dstrbuzo a tre parametr è vece complcata, dal mometo che per tal dstrbuzo o s avrebbe u uco valore d! 3, ma ua sere d valor dvers al varare del coeffcete d forma della dstrbuzoe. 3
Test basat su probablty plot U ulterore categora d test d adattameto s basa sulla valutazoe dell alleameto de put carta probablstca. Il test utlzza l coeffcete d correlazoe r tra la sere ordata delle osservazo x () ed corrspodet quatl potetc w, deft come w = F! X ( p ) dove p è la plottg posto dell -esmo valore ella sere ordata. Il coeffcete d correlazoe è defto come ( r = = & $ $ ( ( ) $ % = ( x ' x)( w ' w) ( ) ( x ' x) ( w ' w) 0.5 #!!!" dove x e w soo valor med delle osservazo e de quatl. Pù elevato è l coeffcete d correlazoe, tato mglore è l alleameto de put carta probablstca. Il test è qud basato sul cofroto d r co opportu valor tabellat fuzoe d! e d per la ormale e la EV. Se r è ferore al valore lmte dcato, l alleameto è peggore d quello che c s aspetterebbe e l potes H 0 vee rgettata co sgfcatvtà!. S ot acora che le tabelle soo costrute per essere utlzzate co le seguet plottg postos: 4
! 3/8 p = dstrbuzoe Normale + / 4! 0.44 p = dstrbuzoe d Gumbel + 0. I quatl vao qud calcolat come & ' # = ˆ 3/8 w * + ) ˆ ( NORMINV $! dstrbuzoe Normale % + / 4 " & & ' ## = ˆ 0.44 w ) '( ˆ l$ ' l$!! dstrbuzoe d Gumbel % % + 0. "" Ache questo caso, possoo essere costrut opportu test per la log-ormale ed EV preva logtrasformazoe de dat. Esstoo vece sostazal ostacol per l estesoe del metodo alle dstrbuzo co tre parametr. Cosderazo fal Il problema della verfca e scelta del modello probablstco può essere affrotato maera approprata per le dstrbuzo a due parametr, per le qual s hao 4 test d adattameto affdabl: l test d Kolmogorov-Smrov, quello d Aderso-Darlg, quello basato sull Lskewess e quello basato sull alleameto de put carta probablstca. Per le dstrbuzo a tre parametr o esstoo vece test altrettato faclmete utlzzabl. Ua possble stratega a f della scelta della dstrbuzoe potrebbe pertato essere la seguete: sottoporre a 4 test suddett le dstrbuzo ormale, logormale, EV ed EV: se ua dstrbuzoe passa tutt test, adottarla come dstrbuzoe d probabltà el seguto dell aals; se essua dstrbuzoe passa quattro test, sceglere ua dstrbuzoe a tre parametr, evetualmete basado la scelta sul dagramma degl L-momet. Se pù d ua dstrbuzoe a due parametr passa test, sceglere tra esse base all adattameto vsuale su carta probablstca, oppure portare avat le successve elaborazo co pù d ua dstrbuzoe. Rfermet Bblografc D Agosto R.B. e M.A. Stephes (eds) Goodess of ft techques, Dekker, New York, 986. Lao F., Cramer-vo Mses ad Aderso-Darlg goodess of ft tests for extreme value dstrbutos wth ukow parameters. Water Resources Research, 40, W09308, do:0.09/004wr00304, 004 5
6