Esercitazioni di statistica Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 1 Ottobre 2014 Stefania Spina Esercitazioni di statistica 1/42
Introduzione Descrivere insieme di dati Definizioni E molto importante che i risultati numerici di uno studio siano presentati in modo chiaro e conciso, in modo che il lettore possa notare facilmente le caratteristiche essenziali dei dati. Questo diventa particolarmente importante quando si devono trattare molti dati, il che capita spesso quando si eseguono sondaggi o esperimenti controllati. Stefania Spina Esercitazioni di statistica 2/42
Analisi monovariata Definizioni Analisi monovariata: insieme di tecniche che prendono in considerazione una variabile alla volta. Il punto di partenza dell analisi monovariata è la distribuzione di frequenza. Stefania Spina Esercitazioni di statistica 3/42
Definizioni Le distribuzioni unitarie e di frequenza Supponiamo di aver rilevato su di un collettivo di otto studenti i seguenti sei caratteri: sesso, voto in statistica sociale, colore degli occhi, livello di soddisfazione per il corso di statistica sociale, altezza e peso. I dati sono registrati in una tabella, chiamata anche matrice dei dati. Ogni riga della tabella descrive il profilo di uno studente; ogni colonna illustra la distribuzione unitaria semplice dei sei caratteri oggetto di studio. Sesso Voto Statistica Sociale Colore occhi Soddisfazione Statura Peso Beppe Maschio 26 Neri molto 160 60 Maria Femmina 30 Verdi molto 169 65 Eva Femmina 18 Marrone poco 150 55 Francesco Maschio 26 Marrone abbastanza 180 65 Mario Maschio 30 Azzurri molto 185 90 Piero Maschio 18 Azzurri per niente 190 95 Roberta Femmina 24 Marrone abbastanza 174 60 Luca Maschio 18 Verdi poco 170 67 Stefania Spina Esercitazioni di statistica 4/42
Definizioni Le distribuzioni unitarie e di frequenza La distribuzione unitaria del carattere descrive, in maniera analitica, le modalità di ciascuna unità statistica, ma non consente di rappresentare, in maniera sintetica, le caratteristiche del fenomeno osservato. Per fornire una descrizione sintetica, a partire della distribuzione unitaria, dovremmo esaminare ogni colonna della matrice, considerando la frequenza con cui si presenta la modalità del carattere esaminato. Stefania Spina Esercitazioni di statistica 5/42
Definizioni Frequenza assoluta e Distribuzione di frequenza Il primo e più semplice strumento di sintesi e analisi dei dati è la distribuzione di frequenza. Una frequenza (assoluta) è il numero di volte che si manifesta la modalità di una variabile. Una tabella di frequenza o distribuzione di frequenza registra ogni categoria, valore, o classe di valori che una variabile potrebbe avere e il corrispondente numero di volte che ognuna di esse ricorre nei dati. La frequenza assoluta della i-ma modalità è indicata con n i. Stefania Spina Esercitazioni di statistica 6/42
Definizioni Esempio: Distribuzione di frequenza (frequenze assolute) Stefania Spina Esercitazioni di statistica 7/42
Frequenza relativa Descrivere insieme di dati Definizioni La frequenza relativa (f i = n i n ) è data dal rapporto fra ciascuna frequenza assoluta (n i ) e la somma di tutte frequenze assolute (n). La frequenza relativa cumulata (F i ) è la somma della frequenza relativa associata ad una modalità con quelle di tutte le modalità precedenti. (n.b. può essere definita anche la frequenza assoluta cumulata - N i ). Per calcolare la distribuzione delle frequenze cumulate, la variabile deve essere almeno misurata su una scala di tipo ordinale. Stefania Spina Esercitazioni di statistica 8/42
Definizioni Esempio: Distribuzioni di frequenze cumulate assolute, relative e le percentuali corrispondenti Stefania Spina Esercitazioni di statistica 9/42
Definizioni Distribuzione di frequenza per variabili continue (n.b. possono essere definite anche le %, le frequenze assolute cumulate e le frequenze relative cumulate) Stefania Spina Esercitazioni di statistica 10/42
Definizioni Esempio: Distribuzione di frequenza per classi X: Tempo impiegato per svolgere a casa un compito al computer (in minuti) Dati rilevati su n = 30 studenti Stefania Spina Esercitazioni di statistica 11/42
Introduzione Descrivere insieme di dati Definizioni I grafici rappresentano un modo per veicolare le informazioni, utilizzando elementi esclusivamente visivi. Si ricorre ad essi per rendere più chiari ed immediatamente leggibili i dati statistici. Per ogni distribuzione statistica è possibile individuare la rappresentazione grafica più adatta, ossia l immagine che è in grado di sposare correttezza metodologica e chiarezza espositiva. Quando si decide di utilizzare una rappresentazione grafica bisogna tener presente: il fenomeno oggetto di studio; il livello di misura associato alla variabile esaminata (nominale, ordinale, ecc); la tipologia della distribuzione di frequenza (unitaria, in classi). Stefania Spina Esercitazioni di statistica 12/42
Definizioni Il diagramma a torta rappresenta i dati sottoforma di fette o sezioni di un cerchio. Ogni fetta rappresenta una categoria e la dimensione della fetta è proporzionale alla frequenza relativa della categoria. Il diagramma a barre rappresenta la frequenza assoluta o la frequenza relativa di una tabella di frequenza sottoforma di un rettangolo o barra o colonna. Stefania Spina Esercitazioni di statistica 13/42
Grafici a torta Descrivere insieme di dati Grafico a torta Diagramma a barre Altri grafici per dati discreti I grafici a torta consentono di visualizzare come la totalità di un fenomeno si ripartisce, in percentuale, fra le sue componenti. Fatturato nel settore delle Telecomunicazioni nel 1999. Stefania Spina Esercitazioni di statistica 14/42
Esempio: Grafico a torta Grafico a torta Diagramma a barre Altri grafici per dati discreti Spese del Governo in Danimarca e Olanda, 1992-1995 Danimarca Olanda Assistenza sociale 39.9 37.2 Istruzione 10.6 10.1 Beni accessori 1.8 3.2 Salute 1.1 14.3 Altro 46.6 35.2 Totale 100 100 Stefania Spina Esercitazioni di statistica 15/42
Esempio: Grafico a torta Grafico a torta Diagramma a barre Altri grafici per dati discreti Percentuale delle spese governative in Olanda Stefania Spina Esercitazioni di statistica 16/42
Esercizio: Tabella di frequenze Grafico a torta Diagramma a barre Altri grafici per dati discreti Calcolare le frequenze assolute e relative e loro rappresentazione grafica Beppe Maria Eva Francesco Mario Piero Roberta Luca Genere Maschio Femmina Femmina Maschio Maschio Maschio Femmina Maschio Stefania Spina Esercitazioni di statistica 17/42
Grafico a torta Diagramma a barre Altri grafici per dati discreti Frequenza assoluta Maschio 5 Femmina 3 Totale 8 frequenza relativa = frequenza assoluta totale frequenze assolute Frequenza relativa Maschio 0.625 Femmina 0.375 Totale 1 Stefania Spina Esercitazioni di statistica 18/42
Grafico torta Descrivere insieme di dati Grafico a torta Diagramma a barre Altri grafici per dati discreti Stefania Spina Esercitazioni di statistica 19/42
Diagramma a barre Grafico a torta Diagramma a barre Altri grafici per dati discreti Stefania Spina Esercitazioni di statistica 20/42
Diagramma a barre multiple Grafico a torta Diagramma a barre Altri grafici per dati discreti Il diagramma a barre multiple consente di visualizzare come due o più fenomeni si sono evoluti nel tempo o come mutano rispetto a diverse aree geografiche. Stefania Spina Esercitazioni di statistica 21/42
Diagramma a barre suddivise Grafico a torta Diagramma a barre Altri grafici per dati discreti Il diagramma a barre suddivise consente di mettere in evidenza i mutamenti che un fenomeno subisce nel tempo o in diverse aree geografiche, ridistribuendosi rispetto alle proprie modalità. Stefania Spina Esercitazioni di statistica 22/42
Esempio: Diagramma a barre Grafico a torta Diagramma a barre Altri grafici per dati discreti Stefania Spina Esercitazioni di statistica 23/42
Diagramma a barre Grafico a torta Diagramma a barre Altri grafici per dati discreti 0 50 100 150 200 Professori ordinari Professori associati Ricercatori Stefania Spina Esercitazioni di statistica 24/42
Esercizio: Diagramma a barre Grafico a torta Diagramma a barre Altri grafici per dati discreti Stefania Spina Esercitazioni di statistica 25/42
Diagramma a barre Grafico a torta Diagramma a barre Altri grafici per dati discreti 0 1000 2000 3000 4000 5000 Architettura Economia Giurisprudenza Ingegneria Lett. e Fil. Sc. Form Sc. Mat. Fis. Nat Sc. Pol. Stefania Spina Esercitazioni di statistica 26/42
Grafico a torta Diagramma a barre Altri grafici per dati discreti Altri grafici per dati discreti: Diagrammi in coordinate polari Si utilizzano per rappresentare serie cicliche. Le serie cicliche sono distribuzioni in cui non è dato stabilire quale sia il termine iniziale assoluto e quello finale assoluto della serie, cioè senza un inizio ed una fine certi dell andamento del fenomeno. Esempio : I nati, i matrimoni, le vendite di determinati prodotti, fenomeni astronomici o atmosferici e così via secondo i mesi dell anno, i giorni della settimana ecc. Stefania Spina Esercitazioni di statistica 27/42
Grafico a torta Diagramma a barre Altri grafici per dati discreti Altri grafici per dati discreti: Cartogrammi I cartogrammi sono grafici utili per rappresentare serie territoriali, cioè serie relative a caratteri geografici, le cui modalità sono luoghi, nazioni, regioni, province, etc. Per costruire un cartogramma occorre disporre di una carta geografica o topografica in cui siano chiaramente delimitate le diverse zone, regioni, circoscrizioni (geografiche, politiche, amministrative) rispetto alle quali viene analizzata l intensità o la frequenza di uno o più caratteri (es. nati, morti, reddito pro capite, secondo le Regioni, Province, Comuni). Stefania Spina Esercitazioni di statistica 28/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico : Diagramma a punti Un diagramma a punti è un grafico usato per piccole quantità di dati in cui ogni osservazione è indicata da un punto su un singolo asse orizzontale. L asse del grafico è suddiviso in modo tale che ogni punto, rappresentante i dati, occupi un posto univoco sull asse. Quando più d una osservazione presenta lo stesso valore, i punti vengono impilati l uno sopra l altro. Stefania Spina Esercitazioni di statistica 29/42
Istogramma Descrivere insieme di dati Diagramma a punti Istogramma Rappresentazioni di tipo informatico Un istogramma è molto simile a un diagramma a barre ma la scala di misura dell asse delle ascisse deve tener conto che i dati sono intrinsecamente ordinati. L istogramma è un grafico costituito da barre non distanziate, dove ogni barra possiede un area proporzionale alla frequenza della classe. Distinguiamo istogramma: con ampiezze delle classi uguali (Es classi età 5-10,11-15) con ampiezze delle classi diverse (Es classi età 5-8, 8-15, 15-30) Stefania Spina Esercitazioni di statistica 30/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esempio: Istogramma con ampiezze delle classi uguali Stefania Spina Esercitazioni di statistica 31/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Costruzione delle classi di un istogramma Numero k di classi e determinazione dell ampiezza per classi di uguale ampiezza Stefania Spina Esercitazioni di statistica 32/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esempio: Istogramma con ampiezze delle classi uguali Frequenza assoluta 18 22 3 22 26 3 26 30 2 Totale 8 Stefania Spina Esercitazioni di statistica 33/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esempio: Istogramma con ampiezze delle classi uguali istogramma età Frequency 0.0 0.5 1.0 1.5 2.0 2.5 3.0 18 20 22 24 26 28 30 Stefania Spina votoesercitazioni di statistica 34/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esempio: Istogramma con ampiezze delle classi diverse 1 L ultima classe è stata chiusa a 102 anni Stefania Spina Esercitazioni di statistica 35/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Costruzione di un istogramma con ampiezze delle classi diverse L istogramma si compone di tanti rettangoli contigui quante sono le classi da rappresentare. La base del rettangolo coincide con l ampiezza della classe a i = x i x i 1. Per costruire il rettangolo occorre definire l altezza, definita densità di frequenza, data dal rapporto h i = n i a i Stefania Spina Esercitazioni di statistica 36/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esempio: Istogramma con ampiezze delle classi diverse Stefania Spina Esercitazioni di statistica 37/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esempio: Istogramma con ampiezze delle classi diverse Stefania Spina Esercitazioni di statistica 38/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esercizio: Istogramma con ampiezze delle classi diverse Stefania Spina Esercitazioni di statistica 39/42
Diagramma a punti Istogramma Rappresentazioni di tipo informatico Esercizio: Istogramma con ampiezze delle classi diverse Stefania Spina Esercitazioni di statistica 40/42
Ideogrammi o pittogrammi Diagramma a punti Istogramma Rappresentazioni di tipo informatico Gli ideogrammi o pittogrammi sono rappresentazioni grafiche aventi carattere molto divulgativo perché si avvalgono di figure, simboli, generalmente tutti simili tra loro, aventi un immediata attinenza con il carattere considerato (figure umane, oggetti ecc.) e di grandezza o numero variabile per indicare l entità della frequenza o dell intensità del carattere rappresentato. Qualsiasi carattere statistico (qualitativo o quantitativo) può essere rappresentato con questa tipologia di grafici. Stefania Spina Esercitazioni di statistica 41/42
Le facce di Chernoff Diagramma a punti Istogramma Rappresentazioni di tipo informatico Le facce di Chernoff sono una rappresentazione grafica particolare in cui si utilizzano i tratti di un volto (occhi, naso, bocca) per rappresentare le diverse componenti di un informazione. Tali rappresentazioni sono adatte sia per distribuzioni statistiche semplici che multiple. Stefania Spina Esercitazioni di statistica 42/42