Dipartimento di Statistica Regione Toscana Comune di Firenze Progetto di diffusione della cultura Statistica Introduzione alla statistica descrittiva Carla Rampichini Dipartimento di Statistica G. Parenti Università di Firenze Materiale: http://www.ds.unifi.it/didattica/percorsi/concorsoscuole/ Esplorazione dei dati Cos è la STATISTICA Statistica Descrittiva Dati e variabili Tabelle Grafici (torte, barre, istogrammi, box-plot) Indici sintetici di posizione e variabilità le medie (moda, mediana, media aritmetica) variabilità Statistica e matematica La statistica è una scienza quantitativa, ma il modo di pensare statistico è diverso da quello matematico per almeno 2 aspetti la statistica non può prescindere dal contesto (dati) la logica dell inferenza statistica: se questa particolare ipotesi fosse vera, quanto sarebbe verosimile ottenere dei dati come i nostri? Statistica, dati, variabilità La statistica è una scienza che ragiona partendo dai dati Il principio fondamentale della Statistica è la variabilità dei dati Se il mondo fosse perfettamente prevedibile e non ci fosse variabilità, non ci sarebbe bisogno della Statistica
Cos è la STATISTICA? Scrivete due frasi che spieghino cosa significa per voi il termine Statistica perchè potrebbe essere utile per voi conoscere un po distatistica trascrivete il numero di lettere che compongono ciascuna parola scritta nella prima frase I numeri che avete scritto sono DATI Tuttavia NON tutti i numeri sono DATI (e non tutti i dati sono numeri ) I numeri 10, 3, 7 non sono dati di per sè, ma lo sono se si riferiscono al n. di lettere che compongono le prime tre parole della frase Cosa pensiamo sia la STATISTICA? Chi legge la definizione che ha scritto? Cos è la STATISTICA Esistono molte definizioni, una prima definizione generalmente accettata è la seguente: La STATISTICA studia i modi in cui un FENOMENO COLLETTIVO può essere sintetizzato, analizzato e quindi compreso FENOMENO è tutto ciò che è direttamente o indirettamente osservabile (facciamo un po di esempi) Con il termine STATISTICA, nel linguaggio di tutti i giorni, si indicano anche semplicemente i risultati numerici (le statistiche richiamate nei telegiornali, ad esempio: l'inflazione, il PIL etc.) di un processo di sintesi dei dati osservati. Altezza Vendite di un azienda Sport preferito Intelligenza Ansia Emozione
Come si studiano i fenomeni: un po di esempi Un urna contiene n palline uguali. Di quante osservazioni abbiamo bisogno per conoscere le caratteristiche delle palline? Una Nel vostro liceo sono iscritti N alunni. Qual è il loro sport preferito?... n 1 calcio, n 2 basket, n 3 Tizio è affetto da una rarissima patologia. Come conoscere l evoluzione della malattia? Osservare e studiare Tizio nel tempo Qual è il reddito degli italiani? Bisogna rilevare il reddito di tutta la popolazione Osservazioni sui fenomeni È sufficiente osservare una sola volta che l acqua distillata in riva al mare bolle a 100 centigradi, per poter affermare che nelle stesse condizioni ciò avviene sempre Le caratteristiche individuali variano, in genere, da persona a persona La nascita di un bambino è un fatto individuale L emigrazione è un fatto collettivo Come può essere un fenomeno? Fenomeno (Esempi) tipico Si presenta sempre nello stesso modo, per cui l osservazione di un solo caso fornisce le caratteristiche degli altri nelle medesime circostanze, ovvero un solo esperimento consente di conoscere i risultati nelle stesse condizioni atipico Una certa caratteristica è rilevata più o meno frequentemente, ma non sempre individuale Riguarda un solo soggetto collettivo Riguarda un insieme di soggetti (popolazione) Tipico: L acqua distillata in riva al mare bolle a 100 centigradi Atipico: Il colore degli occhi dei ragazzi della Classe
Fenomeno (Esempi) Fenomeni collettivamente tipici Individuale: Nascita di un bambino Trasferimento di una persona da uno Stato ad un altro Collettivo: Natalità di una popolazione Emigrazione I fenomeni atipici osservati su un gran numero di casi, se presentano delle regolarità, (es. ogni 105 maschi nascono 100 femmine) possono essere considerati collettivamente tipici Cosa significa Cosa significa misurare Studiare un ricondurlo fenomeno a schemi Per poterlo misurare e descrivere ricavare leggi e/o regolarità conoscere il suo andamento prevederlo e modificarlo Stabilire una corrispondenza tra alcune proprietà dei numeri e certe proprietà degli oggetti Assegnare particolari caratteristiche matematiche a particolari attributi Assegnare un modello formale a oggetti e eventi secondo una regola, purché sia consistente Creare una corrispondenza biunivoca fra una grandezza ed un numero (o una categoria)
Le origini della statistica Mosè volle conoscere l ammontare della popolazione israelita Servio Tullio istituì il Census Esigenza di conoscere quantitativamente alcuni fenomeni sociali Carlo Magno istituì rilevazioni a carattere finanziario e amministrativo La Statistica Inizialmente scienza che si occupava degli avvenimenti notevoli dello Stato (da Status ) Insieme di teorie e metodi che permettono di studiare i fenomeni collettivamente tipici Disciplina che studia quantitativamente i fenomeni collettivamente tipici, allo scopo di mettere in luce le leggi e le regolarità nascoste Variabilità Riprendete le frasi scritte prima: tutte le parole che avete scritto contengono lo stesso numero di lettere? Osservate che la stessa misurazione numero di lettere può dare luogo a risultati diversi a seconda della parola considerata. Questo fatto illustra uno dei concetti fondamentali della statistica: la variabilità Misuriamo tutti lo stesso oggetto A gruppi di 5: trovate un metodo per misurare con un righello il diametro della pallina che vi ho dato Utilizzando il vostro metodo, misurate due volte il diametro della pallina al millimetro più vicino, esprimete la misura in millimetri Inseriamo le vostre misure in un foglio di lavoro Osserviamo che non tutte le misure sono uguali: la maggior parte dovrebbero essere vicine al diametro programmato dalla ditta che ha prodotto le palline (valore vero). Perchè le misure variano?
Perchè le misure non sono uguali? variabilità Il metodo di misura utilizzato può essere diverso qualcuno di voi avrà bloccato la pallina tra due libri e misurato la distanza tra i libri Altri avranno avvolto il nastro millimetrato intorno alla pallina, misurato la lunghezza del filo e quindi diviso per π Ogni gruppo ha misurato la sua pallina e le palline non sono perfettamente uguali Tuttavia la maggior parte delle differenze sono dovute a errori di misura. È difficile misurare il diametro di una sfera! Diagramma a barre delle misure Contiamo quante volte si presenta ciascun valore frequenze Costruiamo il grafico In ascissa scriviamo i valori in millimetri In ordinata riportiamo il valore delle frequenze Che forma ha il grafico? Come mai ha questa forma? Il grafico mostra una gobba in corrispondenza del valore vero, questo è tipico delle distribuzioni degli errori di misura Discussione Osservando il grafico, scegliete 2 numeri che vi sembrano ragionevoli per completare questa frase: La misura tipica del diametro è di circa mm, con uno scarto in più o in meno di circa mm Come potremmo ridurre la variabilità nelle misure? Utilizzando un unica palina Utilizzando tutti lo stesso metodo di misura insegnando a tutti come si misura il diametro Potremmo eliminare completamente la variabilità delle misure? no, non è possibile! Esempio: se il diametro vero è 49.5 mm. quando misuriamo il diametro con il righello al mm più prossimo, qualcuno riporterà 50 e altri 49 mm, a seconda che pensino che la misura sia un po sopra o un po sotto 49.5 mm Variabili statistiche
Variabili statistiche Una variabile è una caratteristica (p.e. genere) di una persona o di una cosa alla quale può essere assegnata una quantità (numero, p.e. età) o una descrizione (categoria) p.e maschio o femmina La persona o la cosa cui sono assegnati il numero o la categoria è detta unità di osservazione (o unità statistica) I dati sono l insieme di numeri o categorie registrati per le unità di osservazione La variabilità si riferisce al fatto che la variabile assume un valore diverso a seconda dell unità di osservazione considerata Variabili e unità di osservazione Quando avete contato il numero di lettere che formano le parole avete registrato dei dati Per questi dati, le unità di osservazione sono le parole che avete scritto. Qual è la variabile? La variabile è la lunghezza della parola, misurata in termini di numero di lettere che la compongono Questa caratteristica può assumere i valori (modalità): 1,2,3, fino a?? Chi ha scritto la parola più lunga? semplici Una persona Un soldato Un albero Gruppo di elementi di qualsiasi natura Unità Statistiche (classificazione) composte Una famiglia Un reggimento Un bosco Collettivo statistico Universo - Popolazione (classificazione) Finito quando è possibile togliere uno dopo l altro tutti gli elementi che lo costituiscono Insieme di unità statistiche Infinito quando non è finito
Conosciamo la classe (popolazione) Non esistono due studenti uguali, gli studenti (unità di osservazione) variano da uno all altro in molti modi interessanti Un buon metodo per iniziare a pensare alla variabilità consiste nel raccogliere DATI sugli studenti di questa classe: come è ciascuno di voi rispetto agli altri? Rispondete al questionario in modo anonimo e saltate le domande cui non volete o non potete rispondere ATTENZIONE AI PROBLEMI DI MISURA! Problemi di misura Come si misura la frequenza del battito cardiaco? Attenzione dobbiamo utilizzare tutti lo stesso STRUMENTO DI MISURA perché i dati siano confrontabili p.e. scegliamo di contare i battiti per 10 secondi e poi moltiplichiamo per 6 Contiamo le risposte Analizeremo oggi le risposte ad una delle domande. UtilizzeremogliaItridatiraccoltiinsiemela prossimavolta leggiamo alcune delle risposte alla domanda 5 scrivi un numero a caso tra 1 e 20 Contiamo le risposte creando una TABELLA DI SPOGLIO (foglio di lavoro) Rappresentiamo graficamente i dati. Lavorate insieme a gruppi di 5. Alcuni grafici Ci sono molti modi di rappresentare la DISTRIBUZIONE dei dati Istogrammi e diagrammi a barre Torte Dot-plot Altri Esempio: 100 numeri estratti a caso tra 1 e 20