Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Documenti analoghi
Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Alfonso Iodice D Enza

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Alfonso Iodice D Enza

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Alfonso Iodice D Enza

Esercitazione di Statistica Indici di associazione

Corso in Statistica Medica

Statistica Analisi bidimensionale La dipendenza in media. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Analisi bidimensionale La correlazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

REGRESSIONE E CORRELAZIONE

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Analisi bivariata. Il caso di caratteri quantitativi

Regressione & Correlazione

ESERCITAZIONI N. 3 corso di statistica

Statistica. Alfonso Iodice D Enza

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03

SCOPO DELL ANALISI DI CORRELAZIONE

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Analisi statistica e matematico-finanziaria II. Alfonso Iodice D Enza Università degli studi di Cassino e del Lazio Meridionale

Esercitazione III Soluzione

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Statistica descrittiva in due variabili

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Matematica Lezione 22

Indice di contingenza quadratica media (phi quadro) χ n

STATISTICA 1 ESERCITAZIONE 6

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Corso di Psicometria Progredito

Statistica. Alfonso Iodice D Enza

Associazione tra caratteri quantitativi: gli indici di correlazione

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Variabilità e Concentrazione Esercitazione n 02

Fondamenti e metodi analisi empirica nelle scienze sociali

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Statistica. Alfonso Iodice D Enza

Rappresentazioni grafiche di distribuzioni doppie

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Analisi dei dati per la comunicazione

Statistica di base per l analisi socio-economica

ESERCIZI DI RIEPILOGO 1

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Istituzioni di Statistica e Statistica Economica

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Statistica descrittiva II

Esercizi di statistica

La dipendenza. Antonello Maruotti

STATISTICA (I modulo - Statistica Descrittiva) Soluzione Esercitazione I ( )

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y

Statistica a.a Autovalutazione 1

Relazioni Statistiche

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Analisi dell associazione tra due caratteri

Cognome e Nome:... Matricola e corso di laurea:...

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Dispensa di Statistica

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Casa dello Studente. Casa dello Studente

Statistica. Alfonso Iodice D Enza

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati

ESERCITAZIONE IV - Soluzioni

Stesso valore medio per distribuzioni diverse

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Cognome e Nome:... Corso di laurea:...

Corsi di Introduzione alla teologia

Esercitazioni di Statistica

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

ESERCITAZIONI N. 2 corso di statistica

Esercitazione del

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Argomenti della lezione:

Statistica a.a Autovalutazione 1

Indici di variabilità ed eterogeneità

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

Variabile divisa in classi: varianza

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Facoltà di Giurisprudenza

Prova Pratica di Statistica I+II - Prof. M. Romanazzi

Statistiche e relazioni

Facoltà di Economia - Sede di Udine Pre-Test di Statistica - A 23 ottobre Foglio domande

Facoltà di Economia - Sede di Udine Pre-Test di Statistica - C 23 ottobre Foglio domande

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Statistica descrittiva: analisi di regressione

STATISTICA. Esercitazione 5

Transcript:

Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Obiettivo I due semplici esercizi seguenti hanno l obiettivo di consolidare le nostre nozioni in tema di analisi della concordanza e della correlazione nel caso di variabili statistiche quantitative componenti una variabile statistica doppia X, Y Nel primo esercizio misureremo la concordanza e la correlazione tra il PIL pro capite (a valori correnti in dollari 2014) e il punteggio attribuito nello stesso anno dall associazione Reporters Sans Frontières in materia di libertà di stampa su un campione di 168 Paesi; nel secondo esercizio analizziamo la concordanza e la correlazione tra potenza (espressa in CV) e velocità (espressa in km/h) su un campione di 200 autoveicoli in produzione nel 2015 Pagina 2

Esercizio #1 Esercizio 1. Abbiamo rilevato il PIL pro capite e il punteggio attribuito dall associazione Reporters Sans Frontières in materia di libertà di stampa su un campione di 168 Paesi. Il nostro obiettivo è accertare se tra i due fenomeni sussiste un legame di tipo lineare (concordanza) e misurarne l intensità (correlazione). Formulario σ xy = k i=1 h j=1 x i y j f ij μ x μ y ρ xy = σ xy σ x σ y Pagina 3

Esercizio #1 La Tabella 1 riporta la distribuzione congiunta del PIL pro capite e del World Press Freedom Index rilevati su un insieme di 168 Paesi: Tabella 1 - PIL pro capite e libertà di stampa in 168 Paesi nel 2014. (PIL pro capite a valori correnti 2014) PIL pro capite (USD) World Press Freedom Index [0-30) [30-60) [60-90] Totale [0-12000) 41 64 10 115 [12000-48000) 26 11 1 38 [48000-120000] 13 2 0 15 T otale 80 77 11 168 Pagina 4

Esercizio #1 Poiché disponiamo dei microdati relativi ai 168 Paesi, è possibile rappresentare le coppie determinazione PIL pro capite-indice di libertà di stampa avvalendoci di uno scatter plot: Dall esame della dislocazione delle coppie determinazione sul piano, appare evidente che all aumentare del PIL pro capite il valore dell indice di libertà di stampa diminuisce: tenuto conto di come è costruito il World Press Freedom Index, ciò indica che la libertà di stampa aumenta all aumentare del PIL pro capite. Pagina 5

Esercizio #1 In primo luogo, calcoliamo la distribuzione delle frequenze relative congiunte, rapportando ciascuna frequenza assoluta congiunta del quadro centrale della Tabella 1 al totale delle osservazioni: PIL pro capite (USD) Tabe lla 2 - Distribuzione delle frequenze relative congiunte World Press Freedom Index [0-30) [30-60) [60-90] Totale [0-12000) 0,2440 0,3810 0,0595 0,6845 [12000-48000) 0,1548 0,0655 0,0060 0,2262 [48000-120000] 0,0774 0,0119 0,0000 0,0893 T otale 0,4762 0,4583 0,0655 1,0000 Pagina 6

Esercizio #1 Per il calcolo del coefficiente di correlazione lineare di Bravais-Pearson, è necessario determinare la varianza e lo scarto quadratico medio del PIL pro capite e dell indice di libertà di stampa. Per quanto riguarda il PIL pro capite, avremo che Tabella 3 - Prospetto di calcolo della media e della varianza del PIL pro capite (000 USD) PIL pro capite (USD) x i x i 2 f i x i f i x i 2 f i [0-12000) 6 36 0,6845 4,1071 24,6429 [12000-48000) 30 900 0,2262 6,7857 203,5714 [48000-120000] 84 7056 0,0893 7,5000 630,0000 Totale 1,0000 18,3929 858,2143 La varianza del PIL pro capite sarà pari a σ x 2 = k i=1 x i 2 f i μ x 2 = 858,2143 18,3929 2 = 519,9171 Pagina 7

Esercizio #1 Applichiamo la procedura appena illustrata anche per il calcolo della varianza dell indice di libertà di stampa, organizzando il seguente prospetto di calcolo: Tabella 4 - Prospetto di calcolo della media e della varianza del World Press Freedom Index World Press Freedom Index y i y i 2 f i y i f i y i 2 f i [0-30) 15 225 0,4762 7,1429 107,1429 [30-60) 45 2025 0,4583 20,6250 928,1250 [60-90] 75 5625 0,0655 4,9107 368,3036 Totale 1,0000 32,6786 1403,5714 La varianza dell indice di libertà di stampa sarà data da σ y 2 = h j=1 y j 2 f j μ y 2 = 1403,5714 32,6786 2 = 335,6824 Pagina 8

Esercizio #1 Come fase finale della procedura, organizziamo il prospetto di calcolo per la covarianza con il metodo dei momenti: PIL pro capite (000 USD) Tabe lla 5 - Prospetto di calcolo della covarianza World Press Freedom Index 15 45 75 6 21,9643 102,8571 26,7857 30 69,6429 88,3929 13,3929 84 97,5000 45,0000 0,0000 Ciascun elemento del quadro centrale è calcolato moltiplicando tra loro i valori centrali del PIL e dell indice di libertà di stampa, ponderati per le corrispondenti frequenze relative congiunte riportate nella Tabella 2. Ad esempio, con riferimento al primo elemento in alto a sinistra, avremo che x 1 y 1 f 11 = 6 15 0,2440 = 21,9643 Pagina 9

Esercizio #1 Svolte tali operazioni per tutte le celle del quadro centrale, la covarianza sarà data dalla seguente espressione: σ xy = k i=1 h j=1 x i y j f ij μ x μ y = 465,5357 18,3929 32,6786 = 135,5166 Lo scarto quadratico medio del PIL è pari a σ x = σ x 2 = 519,9171 = 22,8017, mentre quello dell indice di libertà di stampa è pari a σ y = σ y 2 = 335,6824 = 18,3216. Quindi, il coefficiente di correlazione lineare di Bravais-Pearson sarà pari a ρ xy = σ xy 135,5166 = σ x σ y 22,8017 18,3216 = 0,3244 valore che indica l esistenza di un debole legame lineare tra PIL pro capite e libertà di stampa. Pagina 10

Esercizio #2 Esercizio 2. Nella Tabella 6 sono riportati potenza (misurata in CV) e velocità (espressa in km/h) di 200 modelli di autoveicoli in commercio nel 2015. Il nostro obiettivo è accertare se tra i due fenomeni sussiste un legame di tipo lineare (concordanza) e misurarne l intensità (correlazione). Tabella 6 - Potenza e velocità massima di 200 modelli di automobili (2015) Potenza CV Velocità massima (km/h) [120-160) [160-200) [200-260] Totale [40-80) 66 54 0 120 [80-160) 4 48 8 60 [160-320] 0 8 12 20 Totale 70 110 20 200 Pagina 11

Esercizio #2 Come illustrato in precedenza, preliminarmente riconduciamo il collettivo osservato ad un collettivo ipotetico di ampiezza unitaria, determinando la distribuzione delle frequenze relative congiunte: Potenza CV Tabe lla 7 - Distribuzione delle frequenze relative congiunte Velocità massima (km/h) [120-160) [160-200) [200-260] Totale [40-80) 0,3300 0,2700 0,0000 0,6000 [80-160) 0,0200 0,2400 0,0400 0,3000 [160-320] 0,0000 0,0400 0,0600 0,1000 Totale 0,3500 0,5500 0,1000 1,0000 Pagina 12

Esercizio #2 Come nel precedente esercizio, calcoliamo media aritmetica e varianza delle variabili statistiche componenti la variabile statistica doppia, che serviranno per calcolare la covarianza ottenuta con il metodo dei momenti e il coefficiente di correlazione lineare. Quanto alla «potenza», procediamo ad organizzare il seguente prospetto di calcolo: Tabella 8 - Prospetto di calcolo della media e della varianza della potenza Potenza CV x i x i 2 f i x i f i x i 2 f i [40-80) 60 3600 0,60 36,00 2160,00 [80-160) 120 14400 0,30 36,00 4320,00 [160-320] 240 57600 0,10 24,00 5760,00 Totale 1,00 96,00 12240,00 La varianza della potenza sarà data da σ x 2 = k i=1 x i 2 f i μ x 2 = 12240 96 2 = 3024 Pagina 13

Esercizio #2 Ripetiamo la procedura appena descritta per la velocità. L organizzazione del prospetto di calcolo è riportato di seguito: Tabella 9 - Prospetto di calcolo della media e della varianza della velocità Velocità (km/h) y i y i 2 f i y i f i y i 2 f i [120-160) 140 19600 0,35 49,00 6860,00 [160-200) 180 32400 0,55 99,00 17820,00 [200-260] 230 52900 0,10 23,00 5290,00 Totale 1,00 171,00 29970,00 La varianza della velocità è pari a σ y 2 = h j=1 y j 2 f j μ y 2 = 29970 171 2 = 729 Pagina 14

Esercizio #2 La fase finale della procedura consiste nell organizzazione del prospetto di calcolo della covarianza, ottenuta con il metodo dei momenti. Il prospetto è riportato di seguito: Potenza CV Tabe lla 10 - Prospetto di calcolo della covarianza Velocità massima (km/h) 140 180 230 60 2772,00 2916,00 0,00 120 336,00 5184,00 1104,00 240 0,00 1728,00 3312,00 Come si ricorderà, le quantità che figurano nel quadro centrale sono ottenute moltiplicando i valori centrali del PIL e dell indice di libertà di stampa che individuano la riga e la colonna di riferimento per tali quantità, ponderati per le corrispondenti frequenze relative congiunte riportate nella Tabella 2. Ad esempio, con riferimento al primo elemento in alto a sinistra, avremo che x 1 y 1 f 11 = 6 15 0,2440 = 21,9643 Pagina 15

Esercizio #2 Determinati con la procedura descritta gli elementi del quadro centrale, sommandoli rispetto agli indici i e j e sottraendo alla quantità ottenuta il prodotto delle medie aritmetiche ci consente di calcolare la covarianza, che risulterà pari a σ xy = k i=1 h j=1 x i y j f ij μ x μ y = 17352 96 171 = 936 Lo scarto quadratico medio della potenza è dato da σ x = σ x 2 = 3024 = 54,99, mentre quello della velocità è pari a σ y = σ y 2 = 729 = 27. Quindi, il coefficiente di correlazione lineare di Bravais-Pearson sarà definito dal rapporto: ρ xy = σ xy 936 = σ x σ y 54,99 27 = 0,6304 valore che indica l esistenza di un rilevante legame lineare tra potenza e velocità di un autoveicolo, come dovevamo logicamente attenderci. Pagina 16