INDICI SEMPLICI DI DISSOMIGLIANZA FRA DISTRIBUZIONI SECONDO UN CARATTERE DI QUALSIAI NATURA - Due dstrbuzo A e B secodo uo stesso carattere, le cu modaltà soo ad u lvello d msurazoe scala omale, soo sml se hao uual le uzo d dstrbuzoe, coè se per o =, ossa se =, per cu le dereze - soo ulle. A B Se tutte le soo uual alle corrspodet, le due dstrbuzo hao uual ache tutte le loro caratterstche (moda, dc d omoeetà e d eteroeetà). Se dal coroto d due dstrbuzo rsulta che ache ua sola delle dereze - è dversa da zero, sca che le due dstrbuzo o soo sml. La dssomlaza sarà tato pù elevata quato maore sarà, per o, l valore d -. Nel caso cu due dstrbuzo messe a coroto o abbao tutte e due le "medesme modaltà s rducoo ad avere le stesse modaltà assocado alle modaltà o comu la requeza relatva zero" (Let). Secodo l'mpostazoe classca ua msura della dssomlaza per dstrbuzo semplc secodo u carattere d qualsas atura deve essere ua uzoe smmetrca e crescete de valor assolut delle dereze -. Ua uzoe d questo tpo è data da r Zr = [] che per o valore d r tero postvo orsce u dce assoluto d dssomlaza. Z r è ullo se, e solo se, le due dstrbuzo soo sml, essedo tutte le - uual a zero. Per r= e per r= s hao rspettvamete l'dce semplce [] e quadratco [3] d dssomlaza Z = r Z [] = ( ) Due dstrbuzo s cosderao massmamete dssml quado per o se >0 è =0 o vceversa. Nel caso d massma dssomlaza qud la [] rsulterà uuale a per cu l'dce semplce relatvo sarà z = a b [4] Per la determazoe del massmo d Z e eerale per qualsas altro valore d r dovrebbe r essere possble calcolare Z r per o valore d r, tale che = massmo, el caso che elle due dstrbuzo cosderate coutamete, coè come u'uca dstrbuzoe, sao preset tutte le modaltà co requeza relatva dversa da zero. Elmado quest'ultma codzoe, mpoedo coè ua codzoe meo restrttva, s avrebbe la massma dssomlaza quado " cascua dstrbuzoe tutte le utà presetao ua stessa modaltà, che però è dversa per le due dstrbuzo" (Let). Secodo questa codzoe, qualuque sa l valore d r, [3] r è uuale a. Fare rermeto però a ua tale codzoe per cosderare due dstrbuzo secodo u carattere qualsas massmamete dssml (che equvale a cosderare l carattere dstrbuto secodo due sole modaltà) comporta che metre per qualsas valore tero postvo d r maore d Z r assumerà valore se, e solo se, le due dstrbuzo presetao l massmo dell'omoeetà rermeto a due modaltà dverse, per r= sarà uuale a ache el caso cu per o se >0
è =0 o vceversa (Let). Cò comporta, come esemplcato ella Tab., che due dstrbuzo valutate massmamete dssml utlzzado Z, o possoo cosderars tal se s a rermeto al altr dc Z r co r> tero postvo. Tab. - Dssomlaza tra le potetche dstrbuzo A, B e C, D MODALITÀ DEL DISTRIBUZIONI CARATTERE A B C D x 0 0 0 x 0 0 x 3 3 0 0 0 x 4 0 4 0 - - - - - - - - - - - - - - - - - - - - x 0 0 0 Totale Z (A,B) = Z (C,D) = qualuque sao A e B valor d dvers da zero Z r(a,b) < Z r(c,d) = per qualsas valore d r> tero postvo Oltre all dce Z possoo essere utlzzat del dc basat su ua poderazoe delle dereze - Gl dc propost soo: D s = [5] ' D s = = a + ' ' ( ) ( ) A,B = A,B [6] dove è l umero delle modaltà, (A,B) = max (, ) e ' (A,B) è la more tra e. La [5] esprme ua msura lobale dell'eccedeza relatva tra e cosderata valore assoluto, metre la [6] msura la dstaza totale mma ra e, msurata medate rapport. No è stato assuto come operatore ', coè l mmo tra e, quato se ' (A,B) è l mmo (, ) = 0, l valore del rapporto tederebbe a 8, evetualtà questa che comporterebbe ua otevole lmtazoe ell'utlzzo d D s '. Nel caso d massma dssomlaza la [5] e la [6] assumoo valore uuale a, essedo l umero delle modaltà. I corrspodet dc relatv soo qud: ' D s d = s [7] e ' D s d = s [8] Essedo l deomatore della [5] maore o uuale (el caso cu o è uuale a zero) a quello della [6] sarà sempre D s = D s ' e qud ache d s = d s '. L'uualaza s ha oltre che el caso d Brzz per dstrbuzo secodo u carattere quattatvo, ha deto l'dce d dssomlaza D (A,B), che s basa su x corot medate rapport D = j= x rapporto tra le modaltà coraduate. j,a j, b, dove D (A,B) rappreseta "la meda eometrca delle dstaze per Per la [5] e la [6] soo state utlzzate uzo d tpo addtvo e o moltplcatvo quato e cas cu s dovesse aullare ache ua sola delle la produttora sarebbe uuale a zero.
mma e d massma dssomlaza, ache quado elle due dstrbuzo, per ua o pù modaltà, rermeto ovvamete alle stesse, è = >0 e per le restat se >0 è = 0 e vceversa. D s e D s ', e qud ache corrspodet dc relatv, devoo cosderars a tutt l eett del dc d dssomlaza secodo l'mpostazoe classca quato:. assumoo valore zero se, e solo se, le dstrbuzo soo sml;. l loro valore cresce al crescere della dssomlaza; 3. rspettao la codzoe d smmetra. I due dc relatv d s e d s ' o soo altro che la meda artmetca rspettvamete dell'eccedeza lobale relatva e della dstaza totale msurata medate rapport. Rspetto a z, d s e d s ' sembrao, lea eerale, caratterzzars per ua maore "capactà descrttva" della dssomlaza. Tuttava, almeo sulla base de valor de tre dc calcolat per le quattro potetche dstrbuzo secodo ua mutable statstca d cu alla Tab., o s evdezao sucet elemet tal da cosetre d ssare crter obettv per la scelta d d s o d d s ' luoo d z. L'uca cosderazoe che s rtee d poter are, acedo ache rermeto alla smulazoe rportata d seuto, è che ua utlzzazoe d d s e/o d s ' coutamete a z cosete d melo valutare le rsultaze a cu s pervee, soprattutto se elle due dstrbuzo (A e B) messe a coroto, sa A che B, alcue modaltà soo preset co valor d molto bass e altre co requeze elevate. Tab. - Frequeze relatve d 4 potetche dstrbuzo secodo u carattere qualsas MODALITÀ DEL DISTRIBUZIONI CARATTERE A B C D x 0,0 0,0 0,0 0,0 x 0,7 0,5 0,0 0, x 3 0,05 0,0 0,0 0,5 x 4 0,45 0,50 0,0 0,9 x 5 0,3 0,3 0,0 0,5 Totale,00,00,00,00 z (A,B) = 0,06; z (C,D) = 0,06 - d s(a,b) = 0,9; d s(c,d) = 0,06 - d s ' (A,B) = 0,; d s ' (C,D) = 0, Partedo dalle due dstrbuzo d cu alla Tab. s è operata ua smulazoe trasormado radualmete le due potetche dstrbuzo A e B (Tab. 3), prma due dstrbuzo sml (A - B ) e qud due dstrbuzo massmamete dssml (A - B ). Dalla Tab. 4 e dalla F., s può otare che z, a dereza d d s e d d s ', el prmo tratto, coè o alle dstrbuzo A - B, preseta varazo pressoché scat e qud cresce rapdamete el secodo tratto. I rermeto a tale smulazoe, l'adameto evdezato starebbe ad dcare che se c s allotaa proressvamete da ua stuazoe d somlaza, z, mostra ua scarsa doetà ad evdezare tempestvamete u tale processo. I altr term, se per potes A e B rappresetassero, rermeto a realtà (ad es. provce), le dstrbuzo d u dato eomeo che vee osservato, ad esempo ao per ao, per vercare tempestvamete l'avvars o meo d u processo d derezazoe, se à all'zo del perodo d osservazoe s esca ua damca che tede a ar dverere le due realtà da ua codzoe d somlaza verso ua d massma dssomlaza, valor d z, almeo per oltre metà del perodo d osservazoe, o evdezerebbero modo charamete percettble, come d s e d s ', l vercars d tale crcostaza. 3
Tab. 3 Procedura adottata per smulare corot tra le dstrbuzo A e B partedo da ua stuazoe d somlaza (A B ) o ad ua d massma dssomlaza (A B ) MODALITÀ DEL A CARATTERE B A B A B X 0,00 0,00... 0,00 0,00... 0,00 0,000 X 0,70 0,70... 0,70 0,50... 0,000 0,60 X 3 0,050 0,050... 0,050 0,00... 0,0 0,000 X 4 0,450 0,450... 0,450 0,500... 0,000 0,840 X 5 0,30 0,30... 0,30 0,30... 0,760 0,000 Totale,000,000...,000,000...,000,000 X : A costate o a A e costate o a A ; B cremetato d 0,00 o a B e decremetato d 0,00 o a B X : A costate o a A e decremetato d 0,07 o a A ; B cremetato d 0,00 o a B e cremetato d 0,00 o a B X 3 : A costate o a A e cremetato d 0,07 o a A ; B cremetato d 0,003 o a B e decremetato d 0,00 o a B X 4 : A costate o a A e decremetato d 0,045 o a A ; B decremetato d 0,005 o a B e cremetato d 0,034 o a B X 5 : A costate o a A e cremetato d 0,045 o a A ; B decremetato d 0,00 o a B e decremetato d 0,03 o a B Tab. 4 Valor del dc z, d s e d s ' e corot INDICI SEMPLICI RELATIVI DIFFERENZE CONFRONTI z d s d s ' d s - z d s ' - z A - B 0,000 0,000 0,000 0,000 0,000 A - B 0,006 0,04 0,07 + 0,008 + 0,0 A 3 - B 3 0,0 0,09 0,054 + 0,07 + 0,04 A 4 - B 4 0,08 0,044 0,08 + 0,06 + 0,063 A 5 - B 5 0,04 0,060 0,08 + 0,036 + 0,084 A 6 - B 6 0,030 0,077 0,35 + 0,047 + 0,05 A 7 - B 7 0,036 0,095 0,6 + 0,059 + 0,6 A 8 - B 8 0,04 0,4 0,89 + 0,07 + 0,47 A 9 - B 9 0,048 0,34 0,6 + 0,086 + 0,70 A 0 - B 0 0,054 0,56 0,43 + 0,0 + 0,89 A - B 0,060 0,79 0,70 + 0,9 + 0,90 A - B 0,9 0,4 0,345 + 0, + 0,6 A 3 - B 3 0,4 0,3 0,448 + 0,098 + 0,4 A 4 - B 4 0,3 0,40 0,54 + 0,008 + 0,0 A 5 - B 5 0,48 0,480 0,64 + 0,06 + 0,06 A 6 - B 6 0,55 0,558 0,699 + 0,043 + 0,84 A 7 - B 7 0,6 0,638 0,767 + 0,06 + 0,55 A 8 - B 8 0,709 0,7 0,83 + 0,0 + 0, A 9 - B 9 0,806 0,808 0,890 + 0,00 + 0,084 A 0 - B 0 0,903 0,900 0,947-0,003 + 0,044 A - B,000,000,000 0,000 0,000 4
F. Rappresetazoe de valor d z, d s e d s ' d cu alla Tab. 4 Valor d z, ds, ds ' 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0, 0, 0 0 3 4 5 6 7 8 9 0 3 4 5 6 7 8 9 0 z ds ds' Corot Se d s e d s ' possoo apparre, come el caso potzzato, pù "ecac" d z, tuttava o s può are a meo d sealare che ess potrebbero "esasperare" la dssomlaza esstete ra due dstrbuzo come ell'potes d cu alla Tab. 5, cu le 3 sole modaltà per le qual è dversa da, pur rappresetado complessvamete solo lo 0,05 del totale, dao luoo, spece per d s ', a valor che ua certa msura tedoo a sovrastmare l eettva dssomlaza. Quest'ultma costatazoe coerma l'opportutà d ua utlzzazoe d d s e/o d s ' coutamete a z. Tab. 5 - Dssomlaza tra le dstrbuzo A e B MODALITÀ DEL CARATTERE A DISTRIBUZIONI B x 0,35 0,35 x 0,40 0,40 x 3 0,9 0,9 x 4 0,03 0,0 x 5 0,0 0,0 x 6 0,0 0,0 Totale,00,00 Idc semplc relatv z 0,05 d s 0,40 d s ' 0,0 - Sempre rermeto a dstrbuzo secodo uo stesso carattere a u lvello d msurazoe scala omale, se è vero che qualsvola dce d dssomlaza msura la dstaza assoluta (Z ) o relatva (d s e d s ') esstete tra le due dstrbuzo, tuttava ess ulla c dcoo sul modo cu elle due dstrbuzo s caratterzzao le modaltà raduate secodo valor delle. Per quato quado s è preseza d ua scatva dssomlaza ormalmete le modaltà delle due dstrbuzo raduate secodo valor delle rspettve requeze rsulto deret, tuttava o è escluso, come s vedrà seuto rcorredo sa a cas potetc sa a dat emprc, che a rote d ua elevata dssomlaza, le raduatore delle modaltà elle due dstrbuzo possao essere detche o vceversa che, preseza d ua bassa dssomlaza, le raduatore possao caratterzzars per ua orte dverstà de rah cu s collocao le medesme modaltà elle due dstrbuzo. 5
Se date le dstrbuzo A e B secodo u carattere d qualsas atura s sosttuscoo alle modaltà l posto (p A, e p B, ) che esse occupao base a valor delle A, e B, 3 elle rspettve raduatore, ambedue crescet o decrescet, come msura della dverstà delle due raduatore può essere assuta la [9], D = p p [9] che, asseza d modaltà alla par, sarà sempre uuale a zero se le due raduatore soo perettamete coraduate, metre sarà uuale a raduatore soo perettamete cotroraduate. L dce relatvo sarà qud dato da: d A, B, per par o p A, p B, = [0]. D max per dspar, se le due Nel caso d modaltà alla par 4, s ha, salvo cas partcolar, che l mmo della [9] sa maore d 0 e che l massmo o cocda co o. Cò perché, pur essedo la successoe delle modaltà elle due dstrbuzo ordate base alle A, e alle B, orde o decrescete o o crescete, o s può, se o cas partcolar, avere ua coraduazoe e ua cotroraduazoe peretta. Nella evetualtà d modaltà alla par, per otteere l dce relatvo, sarà qud ecessaro determare emprcamete, caso per caso, quale sa l massmo e l mmo della [9]. A tal e, come dcato ell esempo potetco rportato ella Tab. 6, è sucete coraduare e cotroraduate le modaltà d ua qualsas delle due dstrbuzo rspetto all altra e qud calcolare D max e D m. L dce relatvo sarà qud dato da d = p A, p B, D m = []. D max D m che assumerà certamete valore 0 el caso che le raduatore delle modaltà elle due dstrbuzo sao, seppure maera mperetta, coraduate, e se al cotraro soo, sempre modo mperetto, cotroraduate. I rermeto al caso potetco esame s può osservare che se per l calcolo della dverstà ra le due raduatore s osse utlzzata luoo della [] la [0] s sarebbe otteuto u valore d d par a 0,458, u valore coè che sostazalmete o dersce da quello otteuto co la [] 5. Ioltre, ache e cas cu le due dstrbuzo s caratterzzo per essere massmamete 3 Per la determazoe delle raduatore relatve alle poszo assute dalle modaltà elle due dstrbuzo, è opportuo are rermeto alle, e o alle ode evtare d utlzzare u rade umero d decmal. Se s usao poch decmal, att, se s hao delle che derscoo per ua o poche utà, le corrspodet potrebbero, per va delle approssmazo, apparre uual. 4 S a comuque presete che, se le raduatore soo costrute sulla base delle A, e alle B,, ella realtà tale evetualtà s osserva assa raramete. 5 Ua tale rsultaza potrebbe durre a rteere che el caso d utà alla par sa superluo determare l Max e l M che s avrebbe el caso d coraduazoe o cotroraduazoe, seppure mperette, delle raduatore delle modaltà. Tuttava questa evdeza, propro perché dscede da u caso del tutto potetco, o è detto che s realzz e cas cocret, soprattutto quado s ha u umero elevato d pare. 6
dssml 6, propro per la preseza d utà alla par essedoc dverse modaltà co = 0, potrebbe o essere uuale a o 7. D Tab. 6 - Calcolo d d el caso d modaltà alla par Modaltà Dstrbuzo Graduatore A, B, p A p B 5 4,5 3,5,0 0,5 0,5 5 4,5 3,5,0 9,5 0,5 3 3 39 3,5,5 0 6,5 3,5 0 4 3 37 3,5,5 9 5,5 3,5 0 5 3 65 5 8 3,0 8 3,0 5 0 6 4 88 6 5,0 6,5 0,5 6,5 0,5 7 48 86 7 0 3,0 6,5 0,5 6,5 0,5 8 55 56 8 6,5,5 5 3,0 8 0 9 67 56 9 6,5,5 3,5 5,5 9 0 0 84 9 0,5,5 3,5 7,0 0 0,5 84 54 0,5 5 5,5 8,5 0,5 90 8 9 3,0,0 0 Totale 537 738 33,0 7,0 3 pa, pb, 33,0 3 d = = 0,44 7,0 3 U dato che è opportuo teere presete è relatvo al atto che se el caso cu s restra la massma dssomlaza la dverstà ra le due raduatore è massma, cò o è sempre vero per l cotraro. Può, att, avers ua massma dverstà ra le raduatore ache ell evetualtà cu s hao o apprezzabl valor d z, cos come rsulta dalla Tab. el caso dell potes D. Tab. 7 - Valor d z e d d calcolat rermeto a quattro potetc cas Esemp d corot tra potetche dstrbuzo A B C D Modaltà A, B, A, B, A, B, A, B, 0,40 0,80 0,0 0,4 0,40 0,0 0,0 0,4 0,0 0,03 0,6 0,8 0,0 0,03 0,6 0,7 3 0,05 0,0 0,4 0,6 0,05 0,0 0,4 0,0 4 0,08 0,0 0,5 0,7 0,08 0,8 0,5 0,8 5 0,0 0,090 0,8 0,5 0,0 0,5 0,8 0,5 6 0,7 0,05 0,7 0,0 0,7 0,34 0,7 0,6 Totale,00,00,00,00,00,00,00,00 z 0,40 0,09 0,4 0,0 d 0 0,89 0,89,00 Max pb vs pa pa, pb,,max M pbvs pa pa, pb,m 6 Come precedetemete sottoleato cò s realzza e cas coè cu - modaltà elle due dstrbuzo hao requeza zero ed ua sola, dversa elle due dstrbuzo, uuale a, e quado ua delle due dstrbuzo s hao modaltà co requeza 0 e le corrspodet dell altra > 0. 7 È ovvo che questa evetualtà, per altro del tutto teorca, o è ecessaro calcolare l max d D quato se è massma la dssomlaza ache le raduatore sarao, per quato modo mperetto, ecessaramete cotroraduate. 7
Seppure cosderado delle dstrbuzo potetche e per alcu vers estreme, dalla Tab.7 s può comuque osservare che el caso A a rote d u apprezzable valore d z (z = 0,40) s ha ua peretta cocdeza delle raduatore (d = 0) metre el caso B s ha ua stuazoe opposta: o apprezzable dssomlaza (z = 0,09) ed elevata dvereza ra le raduatore (d = 0,89). Queste rsultaze, per quato o rerte a stuazo real, suerscoo che per valutare e descrvere, modo pù esaustvo, la dverstà tra due dstrbuzo secodo u carattere qualsas sa opportuo assocare al dc d dssomlaza ache ua msura della dvereza ra le raduatore delle modaltà costrute base alle requeze assolute co cu esse s presetao elle due dstrbuzo 8. Tab. 8 Dstrbuzoe percetuale e relatve raduatore de vot alle lste elle elezo del Parlameto Europeo del uo 994 Itala e ella crcoscrzoe elettorale merdoale Crcoscrzoe Itala elettorale LISTE merdoale % p % p Forza Itala 30,6 30,4 Partto Democratco della Sstra 9, 7,4 3 Alleaza Nazoale,5 3 9, Partto Popolare Italao 0,0 4,9 4 Lea Nord 6,6 5 0,4 0 Rodazoe Comusta 6, 7 6, 6 Patto Se 3,3 8,7 8 Federazoe de Verd 3, 9,9 7 Paella Rormator, 0,7 9 Altre 6,5 6 7,3 5 Totale 00,0 00,0 Fote: ISTAT, Compedo Statstco Italao, 995 z = 0,09; d = 0,4 Passado dall potetco ad u caso cocreto, ua verca emprca d quato aermato s ha corotado le dstrbuzo de vot otteut dalle vare lste alle elezo del uo 994 Itala e ella Crcoscrzoe Merdoale. Dalla Tab.8 s può, att, osservare che a rote d ua dssomlaza pressoché esstete (z = 0,09) s restra u valore d d (0,8) che sottolea che ra le due raduatore v è vece ua certa dvereza, seppure o molto elevata 9. 8 Ua msura della dvereza ra le raduatore potrebbe essere data ache rcorredo ad u dce d correlazoe d orde, come ad esempo? d Spearma (Let, par. 5.3, cap.iii, parte IV). S è proposto l dce d quato, assumedo valor tra 0 e e basados sulle dereze assolute tra post assut dalle modaltà elle due raduatore, esso, o solo, è cocettualmete assmlable a z, ma è ache d pù mmedata compresoe. A questo proposto è sucete osservare che se? = 0, cò o dca aatto che le due raduatore soo detche. È comuque opportuo teer sempre presete che due dc d e z o soo omoee, quato ess msurao due deret stuazo: z la dstaza tra due dstrbuzo e d la dverstà ra due raduatore. 9 I questo caso le raduatore soo state costrute acedo rermeto alle dstrbuzo percetual de vot quato, oostate l approssmazoe ad u solo decmale, o v soo utà alla par. 8