Statistica. Alfonso Iodice D Enza

Похожие документы
Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza iodicede@unicas.it

La dipendenza. Antonello Maruotti

Statistica. Alfonso Iodice D Enza

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

STATISTICA 1 ESERCITAZIONE 6

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercitazione di Statistica Indici di associazione

Statistica. Alfonso Iodice D Enza

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Indice di contingenza quadratica media (phi quadro) χ n

Teoria e tecniche dei test. Concetti di base

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Università di Cassino. Esercitazione di Statistica 1 del 28 novembre Dott.ssa Paola Costantini

Esercizi di statistica

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Esercitazione III Soluzione

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Prova scritta di Statistica

ESERCIZI STATISTICA DESCRITTIVA

Lezione 5 Corso di Statistica. Francesco Lagona

LABORATORIO DI PROBABILITA E STATISTICA

Statistica. Alfonso Iodice D Enza iodicede@gmail.com

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

INDICI DI FORMA: L ASIMMETRIA

Capitolo 12. Suggerimenti agli esercizi a cura di Elena Siletti. Esercizio 12.1: Suggerimento

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Med. Med. Si determinano il limite inferiore e superiore applicando le seguenti formule

1.1 Obiettivi della statistica Struttura del testo 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)

REGRESSIONE E CORRELAZIONE

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Paolo Baldi Appunti di Metodi Matematici e Statistici, 1996, Ediz CLUEB. Giovanni Prodi Metodi Matematici e Statistici, 1992, Ediz.

A1. La curva normale (o di Gauss)

Istituzioni di Statistica

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

Relazioni tra variabili: le tabelle di contingenza

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Statistica bivariata: il problema della dipendenza

Транскрипт:

Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1

Outline () Statistica 2 / 1

La curtosi La curtosi è la caratteristica della forma della distribuzione che misura lo spessore delle code di una distribuzione: il maggiore/minore spessore delle code della distribuzione determina un maggiore/minore appiattimento della forma della distribuzione. () Statistica 3 / 1

La curtosi La curtosi è la caratteristica della forma della distribuzione che misura lo spessore delle code di una distribuzione: il maggiore/minore spessore delle code della distribuzione determina un maggiore/minore appiattimento della forma della distribuzione. () Statistica 3 / 1

La curtosi La curtosi è la caratteristica della forma della distribuzione che misura lo spessore delle code di una distribuzione: il maggiore/minore spessore delle code della distribuzione determina un maggiore/minore appiattimento della forma della distribuzione. () Statistica 3 / 1

La curtosi La curtosi è la caratteristica della forma della distribuzione che misura lo spessore delle code di una distribuzione: il maggiore/minore spessore delle code della distribuzione determina un maggiore/minore appiattimento della forma della distribuzione. () Statistica 3 / 1

Indice di Curtosi indice di curtosi di Pearson β Tale indice di forma sempre maggiore, minore o uguale a 3. Esso rappresenta la media delle modalità standardizzate elevate alla quarta n n ( xi µ ) β = 1 n i=1 (z i ) = 1 n i=1 σ () Statistica / 1

Indice di Curtosi Distribuzione leptocurtica (β > 3) () Statistica / 1

Indice di Curtosi Distribuzione platicurtica (β < 3) () Statistica / 1

Indice di Curtosi Distribuzione normocurtica (β = 3) () Statistica / 1

Il box-plot Il grafico a scatola (box-plot) è una particolare rappresentazione di una distribuzione: gli elementi utilizzati per costruire la scatola sono i quantili e gli estremi della distribuzione. () Statistica 5 / 1

Il box-plot Il grafico a scatola (box-plot) è una particolare rappresentazione di una distribuzione: gli elementi utilizzati per costruire la scatola sono i quantili e gli estremi della distribuzione. () Statistica 5 / 1

Costruzione di un box plot Si consideri la seguente distribuzione di frequenze () Statistica 6 / 1

Costruzione di un box plot La rappresentazione evidenzia la presenza di un valore anomalo () Statistica 6 / 1

Costruzione di un box plot () Statistica 6 / 1

Costruzione di un box plot () Statistica 6 / 1

Costruzione di un box plot I valori anomali, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: () Statistica 7 / 1

Costruzione di un box plot I valori anomali, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Q 1 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sotto del quale una modalità considerata outlier () Statistica 7 / 1

Costruzione di un box plot I valori anomali, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Q 1 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sotto del quale una modalità considerata outlier Q 3 + 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sopra del quale una modalità considerata outlier () Statistica 7 / 1

Box plot e istogramma () Statistica 8 / 1

Box plot e istogramma () Statistica 8 / 1

Box plot e istogramma () Statistica 8 / 1

Box plot e istogramma () Statistica 8 / 1

Box plot e istogramma () Statistica 8 / 1

Misura del legame Data una variabile doppia (X, Y ), la misura del legame che caratterizza le componenti X ed Y si definisce () Statistica 9 / 1

Misura del legame Data una variabile doppia (X, Y ), la misura del legame che caratterizza le componenti X ed Y si definisce connessione se X e Y sono mutabili correlazione se X e Y sono variabili () Statistica 9 / 1

Interdipendenza e dipendenza Se le componenti di una variabile doppia (X, Y ) oggetto di studio rivestono lo stesso ruolo ai fini dell analisi si studia l interdipendenza tra X e Y. Se si vuole studiare, invece, l andamento della variabile Y rispetto ad X, si farà riferimento alla dipendenza di Y da X. () Statistica 10 / 1

Interdipendenza e dipendenza Se le componenti di una variabile doppia (X, Y ) oggetto di studio rivestono lo stesso ruolo ai fini dell analisi si studia l interdipendenza tra X e Y. Se si vuole studiare, invece, l andamento della variabile Y rispetto ad X, si farà riferimento alla dipendenza di Y da X. Y si definisce variabile dipendente X si definisce variabile indipendente () Statistica 10 / 1

Frequenze condizionate () Statistica 11 / 1

Frequenze condizionate () Statistica 11 / 1

Frequenze relative condizionate () Statistica 12 / 1

Frequenze relative condizionate La distribuzione delle frequenze relative condizionate della variabile A (k modalità) rispetto alla j sima modalità della variabile B (h modalità) si ottiene dividendo ciascun elemento dell j ma colonna (frequenza assoluta) per il rispettivo totale di di colonna n ij /n.j per i = 1,..., k. () Statistica 12 / 1

Frequenze relative condizionate () Statistica 13 / 1

Frequenze relative condizionate La distribuzione delle frequenze relative condizionate della variabile B (h modalità) rispetto alla i sima modalità della variabile A (k modalità) si ottiene dividendo ciascun elemento dell i ma riga (frequenza assoluta) per il rispettivo totale di riga n ij /n i. per j = 1,..., h. () Statistica 13 / 1

Esempio tabella 2 mutabili Ad un collettivo di 129 giornalisti di box provenienti da 10 diverse riviste di settore è stato chiesto quale fosse il migliore tra i pugili Lennox Lewis e Evander Holyfield. I dati sono espressi dalla seguente tabella a doppia entrata () Statistica 1 / 1

Calcolo frequenze relative condizionate B A () Statistica 15 / 1

Calcolo frequenze relative condizionate A B () Statistica 16 / 1

Indipendenza Le componenti di una variabile doppia (X, Y ) sono indipendenti se le distribuzioni di frequenze relative condizionate Y X e X Y sono costanti. Formalmente dovrà risultare per Y X () Statistica 17 / 1

Indipendenza Le componenti di una variabile doppia (X, Y ) sono indipendenti se le distribuzioni di frequenze relative condizionate Y X e X Y sono costanti. Formalmente dovrà risultare per Y X n i1 n.1 = n i2 n.2 = n i3 n.3 =... = n ih n.h () Statistica 17 / 1

Indipendenza Le componenti di una variabile doppia (X, Y ) sono indipendenti se le distribuzioni di frequenze relative condizionate Y X e X Y sono costanti. Formalmente dovrà risultare per Y X e per X Y n i1 n.1 = n i2 n.2 = n i3 n.3 =... = n ih n.h n 1j n 1. = n 2j n 2. = n 3j n 3. =... = n kj n k. () Statistica 17 / 1

Giudizi truccati e indipendenza Si supponga di aver manipolato i giudizi affinchè la rivista di appartenenza del giornalista sia indipendente dal pugile votato () Statistica 18 / 1

Giudizi truccati e indipendenza Dalla definizione di indipendenza, calcolando le frequenze relative condizionate delle due componenti (rivista/pugile) verifichiamo che esse sono costanti rispetto alle modalità condizionanti. Infatti () Statistica 19 / 1

Giudizi truccati e indipendenza Dalla definizione di indipendenza, calcolando le frequenze relative condizionate delle due componenti (rivista/pugile) verifichiamo che esse sono costanti rispetto alle modalità condizionanti. Infatti () Statistica 19 / 1

Giudizi truccati e indipendenza Dalla definizione di indipendenza, calcolando le frequenze relative condizionate delle due componenti (rivista/pugile) verifichiamo che esse sono costanti rispetto alle modalità condizionanti. Infatti () Statistica 19 / 1

Indipendenza Se le componenti di una variabile doppia (X, Y ) sono indipendenti (le distribuzioni di frequenze relative condizionate Y X e X Y sono costanti) e vale la seguente relazione () Statistica 20 / 1

Indipendenza Se le componenti di una variabile doppia (X, Y ) sono indipendenti (le distribuzioni di frequenze relative condizionate Y X e X Y sono costanti) e vale la seguente relazione con i = 1,..., k; j = 1,..., h ˆn ij = n i.n.j n.. () Statistica 20 / 1

Indipendenza Se le componenti di una variabile doppia (X, Y ) sono indipendenti (le distribuzioni di frequenze relative condizionate Y X e X Y sono costanti) e vale la seguente relazione ˆn ij = n i.n.j n.. con i = 1,..., k; j = 1,..., h Pertanto, data una distribuzione doppia di frequenze, il legame tra le due componenti (mutabile) varierà tra una situazione di indipendenza (assenza di legame) e un qualche grado di connessione () Statistica 20 / 1

Indice quadratico di connessione (X 2 ) Gli indici per la misura della connessioni sono basati sulle differenze tra le frequenze osservate sul collettivo n ij e le frequenze teoriche ˆn ij, che si osserverebbero sul collettivo se le mutabili considerate fossero indipendenti. () Statistica 21 / 1

Indice quadratico di connessione (X 2 ) Gli indici per la misura della connessioni sono basati sulle differenze tra le frequenze osservate sul collettivo n ij e le frequenze teoriche ˆn ij, che si osserverebbero sul collettivo se le mutabili considerate fossero indipendenti. Indice quadratico di connessione (X 2 ) è dato dalla seguente relazione X 2 = k h (n ij ˆn ij ) 2 ˆn i=1 j=1 ij () Statistica 21 / 1

Indice quadratico di connessione (X 2 ) Gli indici per la misura della connessioni sono basati sulle differenze tra le frequenze osservate sul collettivo n ij e le frequenze teoriche ˆn ij, che si osserverebbero sul collettivo se le mutabili considerate fossero indipendenti. Indice quadratico di connessione (X 2 ) è dato dalla seguente relazione X 2 = k h (n ij ˆn ij ) 2 ˆn i=1 j=1 ij in caso di indipendenza, essendo n ij = ˆn ij, risulta X 2 = 0 il massimo valore dell indice è dato dalla seguente espressione: n min(k 1, h 1) () Statistica 21 / 1

Calcolo indice di connessione Con riferimento all esempio precedente, ecco la tabella delle frequenze teoriche ˆn ij () Statistica 22 / 1

Calcolo indice di connessione Con riferimento all esempio precedente, ecco la tabella delle frequenze teoriche ˆn ij () Statistica 22 / 1

Calcolo indice di connessione Il calcolo dell indice quadratico di connessione è pertanto () Statistica 23 / 1

Calcolo indice di connessione Il calcolo dell indice quadratico di connessione è pertanto X 2 ( 5.1)2 (10 8.9)2 = + + 5.1 8.9 (7.7)2 (6 8.26)2 + + +.7 8.26 +... + (1.01)2 (10 6.99)2 + + =.01 6.99 = 0.2 + 0.1 + 1.08 + 0.62 +... + 2.26 + 1.29 = 16.68 () Statistica 23 / 1

Indice ν di Cramer avendo definito n min(k 1, h 1) come valore massimo che X 2 può assumere, è possibile ottenere una versione normalizzata dell indice di connessione. Viene definito indice ν di Cramer. () Statistica 2 / 1

Indice ν di Cramer avendo definito n min(k 1, h 1) come valore massimo che X 2 può assumere, è possibile ottenere una versione normalizzata dell indice di connessione. Viene definito indice ν di Cramer. X ν = 2 n min(k 1, h 1) con k e h numero di modalità delle componenti della mutabile doppia. L indice è normalizzato, quindi 0 ν 1. () Statistica 2 / 1

Indice ν di Cramer X ν = 2 n min(k 1, h 1) = 16.68 129 min(9, 1) = 0.13 () Statistica 25 / 1