Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Obiettivo I due semplici esercizi seguenti hanno l obiettivo di consolidare le nostre nozioni in tema di analisi della concordanza e della correlazione nel caso di variabili statistiche quantitative componenti una variabile statistica doppia X, Y Nel primo esercizio misureremo la concordanza e la correlazione tra il PIL pro capite (a valori correnti in dollari 2014) e il punteggio attribuito nello stesso anno dall associazione Reporters Sans Frontières in materia di libertà di stampa su un campione di 168 Paesi; nel secondo esercizio analizziamo la concordanza e la correlazione tra potenza (espressa in CV) e velocità (espressa in km/h) su un campione di 200 autoveicoli in produzione nel 2015 Pagina 2
Esercizio #1 Esercizio 1. Abbiamo rilevato il PIL pro capite e il punteggio attribuito dall associazione Reporters Sans Frontières in materia di libertà di stampa su un campione di 168 Paesi. Il nostro obiettivo è accertare se tra i due fenomeni sussiste un legame di tipo lineare (concordanza) e misurarne l intensità (correlazione). Formulario σ xy = k i=1 h j=1 x i y j f ij μ x μ y ρ xy = σ xy σ x σ y Pagina 3
Esercizio #1 La Tabella 1 riporta la distribuzione congiunta del PIL pro capite e del World Press Freedom Index rilevati su un insieme di 168 Paesi: Tabella 1 - PIL pro capite e libertà di stampa in 168 Paesi nel 2014. (PIL pro capite a valori correnti 2014) PIL pro capite (USD) World Press Freedom Index [0-30) [30-60) [60-90] Totale [0-12000) 41 64 10 115 [12000-48000) 26 11 1 38 [48000-120000] 13 2 0 15 T otale 80 77 11 168 Pagina 4
Esercizio #1 Poiché disponiamo dei microdati relativi ai 168 Paesi, è possibile rappresentare le coppie determinazione PIL pro capite-indice di libertà di stampa avvalendoci di uno scatter plot: Dall esame della dislocazione delle coppie determinazione sul piano, appare evidente che all aumentare del PIL pro capite il valore dell indice di libertà di stampa diminuisce: tenuto conto di come è costruito il World Press Freedom Index, ciò indica che la libertà di stampa aumenta all aumentare del PIL pro capite. Pagina 5
Esercizio #1 In primo luogo, calcoliamo la distribuzione delle frequenze relative congiunte, rapportando ciascuna frequenza assoluta congiunta del quadro centrale della Tabella 1 al totale delle osservazioni: PIL pro capite (USD) Tabe lla 2 - Distribuzione delle frequenze relative congiunte World Press Freedom Index [0-30) [30-60) [60-90] Totale [0-12000) 0,2440 0,3810 0,0595 0,6845 [12000-48000) 0,1548 0,0655 0,0060 0,2262 [48000-120000] 0,0774 0,0119 0,0000 0,0893 T otale 0,4762 0,4583 0,0655 1,0000 Pagina 6
Esercizio #1 Per il calcolo del coefficiente di correlazione lineare di Bravais-Pearson, è necessario determinare la varianza e lo scarto quadratico medio del PIL pro capite e dell indice di libertà di stampa. Per quanto riguarda il PIL pro capite, avremo che Tabella 3 - Prospetto di calcolo della media e della varianza del PIL pro capite (000 USD) PIL pro capite (USD) x i x i 2 f i x i f i x i 2 f i [0-12000) 6 36 0,6845 4,1071 24,6429 [12000-48000) 30 900 0,2262 6,7857 203,5714 [48000-120000] 84 7056 0,0893 7,5000 630,0000 Totale 1,0000 18,3929 858,2143 La varianza del PIL pro capite sarà pari a σ x 2 = k i=1 x i 2 f i μ x 2 = 858,2143 18,3929 2 = 519,9171 Pagina 7
Esercizio #1 Applichiamo la procedura appena illustrata anche per il calcolo della varianza dell indice di libertà di stampa, organizzando il seguente prospetto di calcolo: Tabella 4 - Prospetto di calcolo della media e della varianza del World Press Freedom Index World Press Freedom Index y i y i 2 f i y i f i y i 2 f i [0-30) 15 225 0,4762 7,1429 107,1429 [30-60) 45 2025 0,4583 20,6250 928,1250 [60-90] 75 5625 0,0655 4,9107 368,3036 Totale 1,0000 32,6786 1403,5714 La varianza dell indice di libertà di stampa sarà data da σ y 2 = h j=1 y j 2 f j μ y 2 = 1403,5714 32,6786 2 = 335,6824 Pagina 8
Esercizio #1 Come fase finale della procedura, organizziamo il prospetto di calcolo per la covarianza con il metodo dei momenti: PIL pro capite (000 USD) Tabe lla 5 - Prospetto di calcolo della covarianza World Press Freedom Index 15 45 75 6 21,9643 102,8571 26,7857 30 69,6429 88,3929 13,3929 84 97,5000 45,0000 0,0000 Ciascun elemento del quadro centrale è calcolato moltiplicando tra loro i valori centrali del PIL e dell indice di libertà di stampa, ponderati per le corrispondenti frequenze relative congiunte riportate nella Tabella 2. Ad esempio, con riferimento al primo elemento in alto a sinistra, avremo che x 1 y 1 f 11 = 6 15 0,2440 = 21,9643 Pagina 9
Esercizio #1 Svolte tali operazioni per tutte le celle del quadro centrale, la covarianza sarà data dalla seguente espressione: σ xy = k i=1 h j=1 x i y j f ij μ x μ y = 465,5357 18,3929 32,6786 = 135,5166 Lo scarto quadratico medio del PIL è pari a σ x = σ x 2 = 519,9171 = 22,8017, mentre quello dell indice di libertà di stampa è pari a σ y = σ y 2 = 335,6824 = 18,3216. Quindi, il coefficiente di correlazione lineare di Bravais-Pearson sarà pari a ρ xy = σ xy 135,5166 = σ x σ y 22,8017 18,3216 = 0,3244 valore che indica l esistenza di un debole legame lineare tra PIL pro capite e libertà di stampa. Pagina 10
Esercizio #2 Esercizio 2. Nella Tabella 6 sono riportati potenza (misurata in CV) e velocità (espressa in km/h) di 200 modelli di autoveicoli in commercio nel 2015. Il nostro obiettivo è accertare se tra i due fenomeni sussiste un legame di tipo lineare (concordanza) e misurarne l intensità (correlazione). Tabella 6 - Potenza e velocità massima di 200 modelli di automobili (2015) Potenza CV Velocità massima (km/h) [120-160) [160-200) [200-260] Totale [40-80) 66 54 0 120 [80-160) 4 48 8 60 [160-320] 0 8 12 20 Totale 70 110 20 200 Pagina 11
Esercizio #2 Come illustrato in precedenza, preliminarmente riconduciamo il collettivo osservato ad un collettivo ipotetico di ampiezza unitaria, determinando la distribuzione delle frequenze relative congiunte: Potenza CV Tabe lla 7 - Distribuzione delle frequenze relative congiunte Velocità massima (km/h) [120-160) [160-200) [200-260] Totale [40-80) 0,3300 0,2700 0,0000 0,6000 [80-160) 0,0200 0,2400 0,0400 0,3000 [160-320] 0,0000 0,0400 0,0600 0,1000 Totale 0,3500 0,5500 0,1000 1,0000 Pagina 12
Esercizio #2 Come nel precedente esercizio, calcoliamo media aritmetica e varianza delle variabili statistiche componenti la variabile statistica doppia, che serviranno per calcolare la covarianza ottenuta con il metodo dei momenti e il coefficiente di correlazione lineare. Quanto alla «potenza», procediamo ad organizzare il seguente prospetto di calcolo: Tabella 8 - Prospetto di calcolo della media e della varianza della potenza Potenza CV x i x i 2 f i x i f i x i 2 f i [40-80) 60 3600 0,60 36,00 2160,00 [80-160) 120 14400 0,30 36,00 4320,00 [160-320] 240 57600 0,10 24,00 5760,00 Totale 1,00 96,00 12240,00 La varianza della potenza sarà data da σ x 2 = k i=1 x i 2 f i μ x 2 = 12240 96 2 = 3024 Pagina 13
Esercizio #2 Ripetiamo la procedura appena descritta per la velocità. L organizzazione del prospetto di calcolo è riportato di seguito: Tabella 9 - Prospetto di calcolo della media e della varianza della velocità Velocità (km/h) y i y i 2 f i y i f i y i 2 f i [120-160) 140 19600 0,35 49,00 6860,00 [160-200) 180 32400 0,55 99,00 17820,00 [200-260] 230 52900 0,10 23,00 5290,00 Totale 1,00 171,00 29970,00 La varianza della velocità è pari a σ y 2 = h j=1 y j 2 f j μ y 2 = 29970 171 2 = 729 Pagina 14
Esercizio #2 La fase finale della procedura consiste nell organizzazione del prospetto di calcolo della covarianza, ottenuta con il metodo dei momenti. Il prospetto è riportato di seguito: Potenza CV Tabe lla 10 - Prospetto di calcolo della covarianza Velocità massima (km/h) 140 180 230 60 2772,00 2916,00 0,00 120 336,00 5184,00 1104,00 240 0,00 1728,00 3312,00 Come si ricorderà, le quantità che figurano nel quadro centrale sono ottenute moltiplicando i valori centrali del PIL e dell indice di libertà di stampa che individuano la riga e la colonna di riferimento per tali quantità, ponderati per le corrispondenti frequenze relative congiunte riportate nella Tabella 2. Ad esempio, con riferimento al primo elemento in alto a sinistra, avremo che x 1 y 1 f 11 = 6 15 0,2440 = 21,9643 Pagina 15
Esercizio #2 Determinati con la procedura descritta gli elementi del quadro centrale, sommandoli rispetto agli indici i e j e sottraendo alla quantità ottenuta il prodotto delle medie aritmetiche ci consente di calcolare la covarianza, che risulterà pari a σ xy = k i=1 h j=1 x i y j f ij μ x μ y = 17352 96 171 = 936 Lo scarto quadratico medio della potenza è dato da σ x = σ x 2 = 3024 = 54,99, mentre quello della velocità è pari a σ y = σ y 2 = 729 = 27. Quindi, il coefficiente di correlazione lineare di Bravais-Pearson sarà definito dal rapporto: ρ xy = σ xy 936 = σ x σ y 54,99 27 = 0,6304 valore che indica l esistenza di un rilevante legame lineare tra potenza e velocità di un autoveicolo, come dovevamo logicamente attenderci. Pagina 16