Corso di Laurea i Ecoomia e Fiaza Statistica 1 A.A. 2015/2016 (8 CFU, corrispodeti a 48 ore di lezioe frotale e 24 ore di esercitazioe) Prof. Luigi Augugliaro 1 / 19
Iterdipedeza lieare fra variabili quatitative cotiue Esempio. U gruppo di ricercatori è iteressato a valutare la relazioe esistete tra le quotazioi di due titoli azioari, idicati rispettivamete co X ed Y. Di seguito è riportata ua parte dei dati rilevati per 50 giori cosecutivi: X 9.98 10.16 10.16 9.93 10.15 10.01 10.09 9.95 10.01 9.81 Y 10.03 10.15 10.12 9.94 10.21 10.08 10.11 9.95 10.05 9.90 X 9.91 10.01 10.15 10.01 10.08 10.00 10.06 9.91 9.88 9.98 Y 9.89 10.04 10.13 10.01 10.09 10.04 10.02 9.96 9.87 10.05 X 10.00 9.77 10.06 9.98 9.93 9.89 10.03 10.02 10.00 9.97 Y 9.99 9.76 10.10 10.05 9.92 9.84 10.04 10.07 10.02 9.96 X 9.94 10.06 9.90 10.10 9.90 9.98 9.93 9.99 9.89 9.98 Y 9.94 10.08 9.90 10.07 9.83 10.12 9.87 10.01 9.98 9.97 X 10.12 10.13 10.09 9.79 9.94 10.11 10.09 10.11 10.01 10.04 Y 10.12 10.07 10.04 9.79 10.00 10.04 10.08 10.03 10.05 10.05 Ua prima idicazioe relativa al comportameto cogiuti delle due variabili rilevate può essere otteuta tramite l opportua rappresetazioe grafica: il diagramma a dispersioe. 2 / 19
Diagramma a dispersioe Y 9.8 9.9 10.0 10.1 10.2 9.8 9.9 10.0 10.1 Il grafico mostra che al crescere della quotazioe del titolo azioario X cresce la quotazioe del titolo Y, e viceversa. I questo caso diremo che siamo i preseza di ua iterdipedeza lieare diretta. X 3 / 19
Diversamete, diremo che siamo i preseza di ua iterdipedeza lieare iversa quado al crescere di ua variabile l altra decresce. Il seguete grafico mostra u esempio di iterdipedeza lieare iversa. Diagramma a dispersioe Y 98 99 100 101 98 99 100 101 102 103 X 4 / 19
Per misurare l iterdipedeza lieare fra due variabili quatitative cotiue si utilizza la covariaza data dalla media del prodotto degli scarti delle due variabili dalla propria media, formalmete i1 σ XY ( )(y i M Y ) L espressioe precedete mostra che il sego della covariaza dipede dalla prevaleza dei segi del prodotto degli scarti ( )(y i M Y ): i. σ XY > 0 quado vi è ua prevaleza di scarti cocordi ii. σ XY < 0 quado vi è ua prevaleza di scarti discordi Il umeratore della covariaza è defiito codeviaza. 5 / 19
σ XY > 0 σ XY < 0-2 -1 0 1 2-2 -1 0 1 2-2 -1 0 1 2-2 -1 0 1 2 Le due figure mostrao che i. quado vi è ua prevaleza di scarti cocordi (σ XY > 0), le due variabili soo iterdipedeti liearmete i modo diretto, ovvero al crescere (decrescere) di ua variabile l altra variabile cresce (decresce); ii. quado vi è ua prevaleza di scarti discordi (σ XY < 0), le due variabili soo iterdipedeti liearmete i modo iverso, ovvero al crescere (decrescere) di ua variabile l altra variabile decresce (cresce). 6 / 19
Sebbee l espressioe i1 σ XY ( )(y i M Y ) sia la defiizioe esatta di covariaza, elle applicazioi risulta utile la seguete formula ridotta σ XY M XY M X M Y dove M X e M Y soo rispettivamete la media di X e Y, metre M XY è la media del prodotto di X e Y, ovvero M XY i1 x i y i Dimostrazioe i1 σ XY (x i M X )(y i M Y ) i1 (x i y i + M X M Y x i M Y y i M X ) i1 x i y i + M X M Y M Y i1 x i M X i1 y i i1 x i y i + M X M Y i1 M x i i1 Y M y i X M XY + M X M Y M X M Y M X M Y M XY M X M Y 7 / 19
Osservazioi i. la covariaza σ XY è espressa el prodotto delle uità di misura della variabile X e della variabile Y ; ii. attraverso la disuguagliaza di Cauchy-Schawrtz è possibile defiire u limite iferiore e u limite superiore per la covariaza; si dimostra che σ X σ Y σ XY σ X σ Y L espressioe precedete cosete di defiire u idice per valutare il grado di iterdipedeza lieare tra due variabili X e Y che gode delle segueti proprietà: i. assume valori compresi tra -1 e 1 ii. o dipede dall uità di misura delle variabili X e Y, ovvero è u umero puro. Dividedo ambo i membri della disuguagliaza di Cauchy-Schawrtz per σ X σ Y si ricava 1 σ XY σ X σ Y 1 L idice ρ XY σ XY σ X σ Y prede il ome di coefficiete di correlazioe lieare di Bravais-Pearso e soddisfa le codizioi defiite i precedeza. 8 / 19
-3-2 -1 0 1 2 3 ρ0 ρ0.25-3 -2-1 0 1 2 3-3 -2-1 0 1 2 3-3 -2-1 0 1 2 3 ρ1 ρ0.75-3 -2-1 0 1 2 3-6 -4-2 0 2 4-3 -2-1 0 1 2 3-4 -2 0 2 9 / 19
-3-2 -1 0 1 2 3 ρ0 ρ-0.25-3 -2-1 0 1 2 3-3 -2-1 0 1 2 3-3 -2-1 0 1 2 3 ρ1 ρ-0.75-3 -2-1 0 1 2-6 -4-2 0 2 4 6-3 -2-1 0 1 2 3-4 -2 0 2 4 10 / 19
Esempio. U gruppo di ricercatori è iteressato a valutare la relazioe esistete tra le quotazioi di due titoli azioari, idicati rispettivamete co X ed Y. Di seguito è riportata ua parte dei dati rilevati per 10 giori cosecutivi: X 9.98 10.16 10.16 9.93 10.15 10.01 10.09 9.95 10.01 9.81 Y 10.03 10.15 10.12 9.94 10.21 10.08 10.11 9.95 10.05 9.90 Si utilizzi il più adeguato idice statistico per valutare il gradi di iterdipedeza lieare tra le due variabili i esame. 11 / 19
X Y X 2 Y 2 X Y 9.98 10.03 99.60 100.60 100.10 10.16 10.15 103.23 103.02 103.12 10.16 10.12 103.23 102.41 102.82 9.93 9.94 98.60 98.80 98.70 10.15 10.21 103.02 104.24 103.63 10.01 10.08 100.20 101.61 100.90 10.09 10.11 101.81 102.21 102.01 9.95 9.95 99.00 99.00 99.00 10.01 10.05 100.20 101.00 100.60 9.81 9.90 96.24 98.01 97.12 100.25 100.54 1005.13 1010.90 1008.00 Sulla base dei precedeti risultati si ricava che: M X 100.25 10 M Y 100.54 10 10.025 σ 2 X 1005.13 10 10.054 σ 2 Y 1010.90 10 10.025 2 0.012 ρ XY 0.982 10.054 2 0.007 M XY 1008.00 100.8 σ XY 100.8 10.025 10.054 0.009 10 Il valore del coefficiete di correlazioe (ρ XY 0.982) mostra chiaramete che le due variabili i esame soo caratterizzate da ua elevata iterdipedeza lieare diretta. 12 / 19
Cosideriamo la seguete distribuzioe doppia di frequeze X /Y y 1 y 2... y j... y c Tot. x 1 11 12... 1j... 1c 1. x 2 21 22... 2j... 2c 2......................... x i i1 i2... ij... ic i......................... x r r1 r2... rj... rc r. Tot..1.2....j....c I questo caso per il calcolo della covariaza è ecessario teer coto delle frequeze assolute cogiute ij, formalmete r c i1 j1 σ XY (x i M(X ))(y j M(Y )) ij dove M(X ) e M(Y ) soo rispettivamete la media margiale di X e Y. 13 / 19
Suppoiamo che sia vera l ipotesi di idipedeza i distribuzioe, i questa caso è vera la codizioe ij i..j. Cosideriamo la formula della covariaza r c i1 j1 σ XY (x i M(X ))(y j M(Y )) ij r c i1 j1 (x i M(X ))(y j M(Y ))( i..j )/ r i1 (x c i M(X )) i. j1 (y j M(Y )).j Per la prima proprietà della media aritmetica, ovvero la sommatoria degli scarti di ua variabile dalla propria media è ulla si ricava r i1 (x c i M(X )) i. j1 0 (y j M(Y )).j 0 quidi σ XY 0. I altri termii, se due variabili soo idipedeti i distribuzioe allora soo ache o correlate. I geerale o è vero il viceversa, i altri termii la codizioe di icorrelazioe è più debole della codizioe di idipedeza i distribuzioe. 14 / 19
La seguete distribuzioe doppia di frequeza è otteuta rilevado su di u campioe di soggetti la variabile altezza e la variabile peso. Altezza Peso 40 50 50 75 75 90 Tot. 160 165 6 27 10 43 165 170 3 34 13 50 170 175 1 29 37 67 175 180 0 9 52 61 Tot. 10 99 112 221 Calcolare il coefficiete di correlazioe lieare di Bravais-Pearso. 15 / 19
Cosideriamo la covariaza σ XY. Utilizzado la formula ridotta σ XY M XY M X M Y si ricava che per il calcolo della covariaza è ecessario cosiderare la media margiale di X e la media margiale di Y. Dalle segueti tabelle si ricava Classi i1 xi c xi c i1 (xi c)2 (xi c)2 i1 160 165 43 162,5 6987,5 26406,25 1135468,75 165 170 50 167,5 8375,0 28056,25 1402812,50 170 175 57 172,5 11557,5 29756,25 1993668,75 175 180 67 177,5 10827,5 31506,25 1921881,25 Tot. 221 37747,5 6453831,25 che la media e lo scarto quadratico medio margiali della variabile altezza soo rispettivamete M X 37747, 5 6453831, 25 170, 80 cm σ X 170, 80 2 5, 5 cm 221 221 16 / 19
Classi 1j y c j y c j 1j (y c j )2 (y c j )2 1j 40 50 10 45,0 450,0 2025,00 20250,00 50 75 99 62,5 6187,5 3906,25 386718,75 75 90 112 82,5 9240,0 6806,25 762300,00 Tot. 221 15877,5 1169268,75 che la media e lo scarto quadratico medio margiali della variabile peso soo rispettivamete M Y 15877, 5 1169268, 75 71,84 Kg σ Y 71, 84 2 11.39 Kg 221 221 17 / 19
ri1 cj1 xi c yj c Per il calcolo della media del prodotto delle due variabili, ovvero M XY ij cosideriamo le segueti tabelle Tabella dei prodotti x c i y c j y c 1 y c 2 y c 3 x c 1 7312,5 10156,25 13406,25 x c 2 7537,5 10468,75 13818,75 x c 3 7762,5 10781,25 14231,25 x c 4 7987,5 11093,75 14643,75 Tabella dei prodotti x c i y c j ij y c 1 y c 2 y c 3 Tot. x c 1 43875,00 274218,75 134062,50 452156,25 x c 2 22612,50 355937,50 179643,75 558193,75 x c 3 7762,50 312656,25 526556,25 846975,00 x c 4 0,00 99843,75 761475,00 861318,75 Tot. 74250,00 1042656,25 1601737,50 2718643,75 da cui si ricava M XY r i1 c j1 xc i y c j ij 2718643, 75 221 12301, 56 18 / 19
Sulla base dei risultati precedeti si ricava σ XY M XY M X M Y 12301, 56 170, 80 71, 84 31, 29 ρ σ XY 31, 29 σ X σ Y 5, 5 11, 39 0.5 19 / 19