Elemet d Statstca descrttva Parte III Paaa
Idce d asmmetra (/) Idce d forma che esprme l grado d asmmetra (skewess) d ua dstrbuzoe. Sao u, u,,u osservazo umerche. Chamamo dce d asmmetra l espressoe: c a u σ 3 Questo dce msura la tedeza d ua dstrbuzoe d valor ad assumere valor modo asmmetrco rspetto alla meda. Questo dce è chamato ache dce beta d Fsher, oltre ad esso soo stat propost altr dc per valutare l asmmetra. La tpologa della dstrbuzoe è vsualzzata bee da u stogramma. Da u spezoe vsva dell stogramma s ha fatt ua sesazoe mmedata rguardo al fatto che la dstrbuzoe sa pù o meo raccolta/dspersa oppure smmetrca/asmmetrca. Gl dc d forma (d cu l coeffcete d asmmetra è l ultmo che predamo esame) hao lo scopo d esprmere ua valutazoe oggettva d tal caratterstche. Paaa
Idce d asmmetra (/) c a u σ 3 PROPRIETÀ: Se c a > 0 la dstrbuzoe ha ua coda verso destra Se c a < 0 la dstrbuzoe ha ua coda verso sstra Se c a 0 la dstrbuzoe è smmetrca Questa espressoe dell dce forsce ua valutazoe dstorta, pù sesble quato pù pccolo è l campoe. Per elmare questa dstorsoe s usa l dce d asmmetra corretto: c acorr u ( )( ) s 3 dove s è la devazoe stadard campoara. 3 La fuzoe ASIMMETRIA d Ecel forsce l dce d asmmetra corretto. La relazoe fra dce corretto e dce è: c acorr c a ((-)) / /(-) Paaa 3
dat 0 0... 3 3. 4 4.. 6 6. 7 7. fa 8 8 3 0 4 4 Esempo d dce d asmmetra c a. postva, stogramma co coda a destra 4 Il rsultato llustrato è l dce seza correzoe. Paaa 4
Stes de dat Correlazoe fra varabl
Correlazoe fra varabl Aals d tpo comparatvo: dage per stablre se esste ua coessoe tra due caratter rlevat su og utà statstca. Effettuamo lo studo d correlazoe fra due varabl statstche utlzzado u dagramma d dspersoe (scatter plot). Dall aals s può cocludere che: esste ua correlazoe dretta; esste ua correlazoe versa; o esste alcua correlazoe. 6 Esemp d aals d correlazoe possoo rguardare: Correlazoe fra reddt e cosum d ua popolazoe; Correlazoe fra statura e peso; Correlazoe fra la cldrata del motore e cosumo d carburate ua popolazoe d automobl; Correlazoe fra colore degl occh e colore de capell. L ultmo esempo s rfersce a caratterstche o umerche. Nel seguto cosderamo l solo caso d caratterstche umerche. S tratta og caso d aals effettuate su ua doppa sere d dat rcavat da ua popolazoe (o da u campoe): da og utà statstca otteamo due valor, uo d tpo, uo d tpo. Paaa 6
Esempo A S cosdero varabl statstche d tpo umerco relatve al peso Kg e all altezza m d u campoe d 0 persoe. Il peso è stato attrbuto ad ua varable, l altezza è stata attrbuta ad ua varable otteedo le due seguet sere d valor: 64 70 6 3 64 4 8 6 6 7 48 8 7 9 79 0 63 69 64 3 4 8 4 6 66 7 64 8 7 9 0 60 70. 73. 67. 3 6. 4 60. 8. 6 67. 7 6. 8 7. 9 0 74. 68. 70. 3 66. 4 6. 63. 6 6. 7 68. 8 7. 9 60. 0 63. 7 Paaa 7
Esempo A: dagramma d dspersoe Poedo ascssa la varable (altezza) e ordata la varable (peso), s ottee l dagramma ( uvola d put ): Barcetro della uvola d put S ota ua relazoe tra le due varabl: put d more ascssa hao ( geere) ache more ordata. Esste ua correlazoe dretta 8 Correlazoe dretta sgfca: al crescere della varable la varable d massma cresce. Il barcetro è l puto del pao che ha per coordate le mede delle due dstrbuzo. Paaa 8
Esempo B S cosdero varabl statstche, relatve a u campoe d 0 utà, che forscoo la seguete tabella: 00 0 3 0 4 30 40 89 8 3 78 4 74 70 6 0 7 60 8 70 9 80 0 90 6 66 7 6 8 4 9 0 4 9 Paaa 9
Esempo B: dagramma d dspersoe Poedo ascssa la varable e ordata la varable, s ottee: S ota ua relazoe tra le due varabl: put d more ascssa hao maggore ordata ordata. Esste ua correlazoe versa 0 Correlazoe versa sgfca: al crescere della varable la varable d massma dmusce. Rspetto al caso A otamo oltre che qu la correlazoe è molto pù stretta: o esste ad esempo alcu puto che, al crescere dell ascssa, dmusca la propra ordata. Paaa 0
Esempo C: dagramma dspersoe U dagramma d dspersoe del tpo: o suggersce alcua relazoe tra le varabl. No esste correlazoe. Paaa
Idcator d correlazoe Soo espresso legate alla correlazoe tra due varabl. Covaraza: σ ( )( ) La covaraza è la meda de prodott degl scostamet dalla meda. S dmostra che la covaraza può essere espressa come: σ ( ) Coeffcete d correlazoe: ρ σ σ Il coeffcete d correlazoe è l rapporto fra l dce d covaraza e l prodotto delle devazo stadard d e. σ Paaa
Propretà degl dcator d correlazoe. σ può essere postva o egatva. ρ ha lo stesso sego d σ 3. ρ è u umero puro (quattà admesoale). Se σ >0 e soo dette drettamete correlate Se σ <0 e soo dette versamete correlate Se σ 0 e soo dette o correlate 3 Paaa 3
Osservazo sugl dcator d correlazoe S dmostra che: σ σ σ ρ - ρ ρ ± esstoo due costat a, b tal che a +b (,,,) I partcolare ρ allora b>0, se ρ - allora b<0 D cosegueza: Se ρ tra le varabl esste correlazoe dretta completa: tutt put soo dspost su ua retta e tra le due varabl c è ua relazoe fuzoale leare per cu a+b co b>0. Se ρ - tra le varabl esste correlazoe versa completa: tutt put soo dspost su ua retta e tra le due varabl c è ua relazoe fuzoale leare per cu a+b co b<0. Se ρ 0 le varabl soo o correlate; Se ρ 0 fra le varabl esste scarsa correlazoe; Se ρ fra le varabl c è forte correlazoe leare dretta; Se ρ - fra le varabl c è forte correlazoe leare versa. 4 Paaa 4
Retta d regressoe È la rappresetazoe grafca d ua possble relazoe leare fra le due varabl. Date coppe d valor osservat (, ),(, ),(, ), s vuole determare l equazoe a+b d ua retta che pass l pù possble vco a put (, ). a INTERCETTA sull asse ; b PENDENZA (coeff. agolare della retta). Retta d regressoe tgα PENDENZA INTERCETTA Le fuzo INTERCETTA e PENDENZA d Ecel forscoo drettamete l tercetta e la pedeza. NB: queste due fuzo rchedoo come parametro la tabella delle (varable dpedete) e come parametro la tabella delle (varable dpedete). Ad esempo: INTERCETTA(D8:D34;C8:C34) calcola l tercetta sull asse della retta d regressoe che approssma ua uvola d put avet valor coteut elle celle C8:C34 e valor coteut elle celle D8:D34, smlmete l coeffcete agolare della retta è dato da PENDENZA(D8:D34;C8:C34). S deve porre attezoe a trodurre parametr della fuzoe ell orde corretto. I Ecel la uvola d put vee geerata medate l comado (dalla barra de meu) Isersc-Grafco e scegledo l tpo Dspers. (X,Y). Ua volta geerata la uvola d put è possble sovrapporv la retta d regressoe selezoado l grafco geerato e seredo l comado Grafco-Aggug lea d tedeza Paaa
S Determazoe della retta d regressoe (/) a e b vegoo determat attraverso l metodo de mm quadrat, ossa modo da redere mma la somma degl scart elevat al quadrato, qud l espressoe: S ( a, b) ( ( a + b )) ( a, b) ( a b) + ( a b ) +... + ( a b ) Dervate parzal: Sa ( a, b) ( a b ) ( a b ) +... ( a b ) S b( a, b) ( a b ) ( a b )... ( a b ) Sa ( a, b) ( a b ) Sb ( a, b) ( a b ) 6 Gl scart pres cosderazoe soo le dffereze fra l geerco valore della varable dpedete e l corrspodete valore che l ordata della retta d regressoe assume per. Queste dffereze soo po elevate al quadrato modo da otteere valor tutt postv evtado così che scart ugual valore assoluto ma d sego opposto s eutralzzo. Scambado fra d loro le varabl (ossa assumedo alteratvamete ua oppure l altra come varable dpedete ) s ottegoo geere due dverse rette d regressoe. Paaa 6
Determazoe della retta d regressoe (/) Uguaglado a zero le dervate parzal s ottee l sstema: ( a b ) 0 ( a b ) 0 le cu soluzo rsultao essere: σ a σ σ b σ I corrspodeza d tal valor la fuzoe S(a,b) ha u mmo. 7 L aullameto delle due dervate parzal forsce a rgore solo u puto d stazoaretà (puto crtco) della fuzoe. Tuttava, dato che la fuzoe S(a,b) ha solo questo puto crtco, o è ma egatva e può assumere valor postv comuque grad, s coclude che tale puto è u mmo. Il coeffcete b (PENDENZA) può assumere valor postv o egatv comuque grad valore assoluto (l valore assoluto può tedere a per σ X 0), pertato la retta d regressoe può assumere qualuque clazoe el pao. Il sego d b è lo stesso sego della covaraza. Esamado la struttura d a e d b s vede che la retta d regressoe passa per l barcetro della uvola d put. Paaa 7
Osservazo sul metodo de mm quadrat Co l metodo de mm quadrat è possble determare altr tp d curve, oltre la retta, che terpreto l adameto del feomeo osservato. Ad esempo:. S osserva che valor rlevat s dspogoo lugo ua lea d tpo parabolco; o pù geerale:. S ota che tra le due varabl c è u legame d poteza (s vsualzza faclmete utlzzado u dagramma a scala logartmca sull asse delle, l adameto rsulta leare co pedeze proporzoal alla poteza) 3. Cosegueze: S utlzza ella rcerca d mmzzazoe d u fuzoale la curva approssmate pù opportua. 8 I Ecel è possble sovrapporre a ua uvola d put vece che ua retta d regressoe ua curva pù complessa (ad esempo ua polomale d grado dato) e seredo l comado Grafco-Aggug lea d tedeza e qud selezoado l approprato tpo d curva dal meu che vee presetato (cartella Tpo). Paaa 8
Esempo A: retta d regressoe Teedo presete l dagramma d dspersoe dell esempo A, e teedo coto che ρ 0.89, costruamo la retta d regressoe: Se e osserva la sgfcatvtà sa term d adereza alla uvola d put, sa attraverso l coeffcete agolare postvo (correlazoe dretta) 9 Questo esempo è stato geerato co Ecel. Dopo avere rchesto grafco della uvola d put s è dato l comado Grafco-Aggug lea d tedeza, selezoato l tpo Leare (cartella Tpo), e fe selezoato Vsualzza l equazoe sul grafco (cartella Opzo). I tal modo sul grafco appaoo mmedatamete vsualzzat due valor dell tercetta a (-68,8) e del coeffcete agolare b (39,0). Per avere valor pù precs (ad esempo per utlzzarl calcol ulteror) occorroo le due fuzo INTERCETTA e PENDENZA. Paaa 9
Esempo B: retta d regressoe Teedo presete l dagramma d dspersoe dell esempo B, e teedo coto che ρ -0.99, costruamo la retta d regressoe: Se e osserva la sgfcatvtà sa term d adereza alla uvola d put, sa attraverso l coeffcete agolare egatvo (correlazoe versa) 0 Ache questo esempo è stato geerato co Ecel, co le stesse modaltà del precedete Paaa 0