Statistica descrittiva



Похожие документы
Un po di statistica. Christian Ferrari. Laboratorio di Matematica

11. Analisi statistica degli eventi idrologici estremi

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

La distribuzione Gaussiana

Grafici delle distribuzioni di frequenza

Corso di. Dott.ssa Donatella Cocca

Statistica descrittiva: prime informazioni dai dati sperimentali

STATISTICA DESCRITTIVA UNIVARIATA

CENNI DI METODI STATISTICI

Facciamo qualche precisazione

Indici di dispersione

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Elementi di Statistica descrittiva Parte I

Elementi di Psicometria con Laboratorio di SPSS 1

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

Analisi Statistica per le Imprese (6 CFU) - a.a Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

RAPPRESENTAZIONE DEI DATI

Il concetto di valore medio in generale

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Inferenza statistica. Statistica medica 1

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

DISTRIBUZIONI DI PROBABILITÀ

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

ESAME DI STATISTICA Nome: Cognome: Matricola:

Lezione 1. Concetti Fondamentali

Prova di autovalutazione Prof. Roberta Siciliano

1. Distribuzioni campionarie

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

INDICI DI TENDENZA CENTRALE

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

Statistica. Le rappresentazioni grafiche

STATISTICA E PROBABILITá

Statistica (Prof. Capitanio) Slide n. 1. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Politecnico di Torino. Esercitazioni di Protezione idraulica del territorio

Elementi di Statistica

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A Alberto Perotti, Roberto Garello

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Statistica. Alfonso Iodice D Enza iodicede@unina.it

LOGISTICA APPUNTI DI STATISTICA

INDICE PREFAZIONE VII

Calcolo delle probabilità

1. L analisi statistica

Statistica. L. Freddi. L. Freddi Statistica

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

Appunti di complementi di matematica

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

Elementi di statistica descrittiva I 31 Marzo 2009

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Slide Cerbara parte1 5. Le distribuzioni teoriche

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

ESERCIZI DI STATISTICA DESCRITTIVA

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Corso di laurea in Economia e Gestione delle Arti e delle Attività Culturali a.a INTRODUZIONE ALLA STATISTICA DESCRITTIVA

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

Corso di Statistica. Corso di Laurea in Ingegneria Edile. Ingegneria Tessile. Docente: Orietta Nicolis

La distribuzione Normale. La distribuzione Normale

Corso di Psicometria Progredito

Acquedotti: La stima dei fabbisogni

Elementi di statistica. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 1

Corso di Idraulica ed Idrologia Forestale

Capitolo 12 La regressione lineare semplice

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2007/2008 Esercizi di riepilogo - 14 dicembre 2007

Metodi statistici per le ricerche di mercato

LA STATISTICA E IL CALCOLO DELLE PROBABILITÀ

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Statistica inferenziale

DI IDROLOGIA TECNICA PARTE III

LA STATISTICA NEI TEST INVALSI

Elementi di statistica

Dott.ssa Caterina Gurrieri

Statistica 1 A.A. 2015/2016

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Statistica. Lezione 6

Esercizio 1 Istogrammi

Probabilità e statistica

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

Statistica descrittiva

ELEMENTI DI STATISTICA PER IDROLOGIA

STATISTICA (L-Z) - Parte I Esercitazione 3

Statistiche campionarie

STATISTICA (A-K) a.a Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

LEZIONI DI STATISTICA E CALCOLO DELLE PROBABILITA STATISTICA

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Lezione 1. Concetti Fondamentali

ELEMENTI DI STATISTICA

E NECESSARIO RICORRERE ALLE VARIABILI CASUALI

Corso di Automazione Industriale 1. Capitolo 4

Indagine campionaria sul ricorso alla rendita vitalizia Esercizi

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

Транскрипт:

Corso di Laurea in Ingegneria per l Ambiente ed il Territorio Corso di Costruzioni Idrauliche A.A. 2004-05 www.dica.unict.it/users/costruzioni Statistica descrittiva Ing. Antonino Cancelliere Dipartimento di Ingegneria Civile e Ambientale Università di Catania acance@dica.unict.it 095 738278 Statistica Molti fenomeni presentano un carattere di variabilità e casualità Esempi Temperatura massima in un giorno dell anno Altezza di precipitazione in un dato mese Numero di eruzioni vulcaniche dell Etna in un secolo Popolazione residente in una certa area Generalmente si assume che tale variabilità non possa essere interpretata in maniera deterministica e si ricorre quindi allo strumento statistico per descriverne il carattere sulla base di una serie di osservazioni l'ambiente ed il Territorio

Statistica In termini generali, i metodi statistici possono essere suddivisi in: Statistica descrittiva Teoria delle probabilità Statistica matematica Statistica Popolazione: insieme di tutte le possibili modalità con cui un fenomeno casuale può manifestarsi Campione: insieme limitato di osservazioni estratte da una popolazione Esempio: lancio di un dado Popolazione {,2,3,4,5,6} Campione di dimensione 3: 2,5,4 Esempio: temperatura media del mese di Gennaio a Catania: Popolazione: -273.6 C + Campione osservato nel periodo 986-996: 3.3, 4.5, 6.4, 4.7, 3.4, 3.2, 3.7, 3.8, 4.4, 4.0, 5.4 C Esempio: precipitazione annua nella stazione di Caltanissetta: Popolazione: 0 + Campione osservato nel periodo 990-2000 475, 687.6, 533.2, 376.2, 453.7, 357.2, 822.2, 68.4, 385, 390.2, 473.6 mm l'ambiente ed il Territorio 2

Statistica descrittiva La statistica descrittiva si pone l obiettivo di descrivere in maniera sintetica un campione osservato di dati La descrizione viene generalmente effettuata in diversi modi: Rappresentazioni grafiche Analisi di frequenza Calcolo di indici descrittivi La statistica descrittiva ha anche la funzione di fornire le informazioni sulla base delle quali effettuare inferenze sulla popolazione, attraverso la teoria delle probabilità e la matematica statistica Rappresentazione dei dati Un campione osservato di dati si presenta generalmente come una successione (cronologica) di valori della variabile in esame Esempio: Serie delle temperature massime annue registrate nella stazione di Palermo nel periodo 92-990 Serie del numero di giorni piovosi in una anno registrati nella stazione di Catania nel periodo 950-996 Serie delle portate medie (deflussi) mensili del Simeto alla stazione di Giarretta Contro esempio: Porosità dello strato superficiale del terreno in una ampia area l'ambiente ed il Territorio 3

Rappresentazione dei dati???? 200 Stazione di Caltanissetta (879-996) 000 Precipitazione (mm) 800 600 400 200 880 900 920 940 960 980 2000 Anni Analisi di frequenza L analisi di frequenza si pone l obiettivo di valutare la frequenza con cui le osservazioni tendono a ripetersi Se la variabile è discreta, le frequenza di ciascuno dei valori della variabile può essere calcolata contando le occorrenze delle osservazioni nel campione Tali frequenze possono essere riportate nel cosidetto istogramma di frequenza l'ambiente ed il Territorio 4

Analisi di frequenza Esempio: lancio di un dado non truccato 30 volte: 7 No. di : 5 No. di 2: 4 No. di 3: 5 No. di 4: 6 No. di 5: 5 No. di 6: 5 Numero di osservazioni 6 5 4 3 2 0 2 3 4 5 6 Faccia Analisi di frequenza Se la variabile è continua (come è il caso in molti fenomeni naturali) non ha senso contare il ripetersi di ciascun valore poiché ciascuna occorrenza è generalmente unica E preferibile quindi suddividere il campo di variazione delle osservazioni in classi di ampiezza finita e contare il numero di osservazioni ricadenti in ciascuna classe l'ambiente ed il Territorio 5

Analisi di frequenza Esempio: serie di precipitazione annue osservate nella stazione di Caltanissetta nel periodo 980-2000 (2 anni) Anno Precipitazione (mm) 980 454.0 98 356.2 982 645.4 983 409.8 984 458.6 985 487.2 986 387.6 987 452.6 988 565.8 989 332.8 990 475.0 99 687.6 992 533.2 993 376.2 994 453.7 995 357.2 996 822.2 997 68.4 998 385.0 999 390.2 2000 473.6 Consideriamo 4 classi di ampiezza 50 mm: 300-450, 450-600, 600-750, 750-900 300-450 450-600 600-750 750-900 332.8 356.2 357.2 376.2 385.0 387.6 390.2 409.8 452.6 453.7 454.0 458.6 473.6 475.0 487.2 533.2 565.8 68.4 645.4 687.6 822.2 8 9 3 Istogramma di frequenza assoluta e relativa Numero di osservazioni 0 8 6 4 2 0 Frequenza assoluta 300-450 450-600 600-750 750-900 L istogramma di frequenza assoluta riporta il numero di osservazioni che ricadono in ciascuna classe Classi L istogramma di frequenza relativa riporta il numero di osservazioni che ricadono in ciascuna classe in rapporto al numero totale di osservazioni 0.50 0.40 0.30 0.20 0.0 0.00 Frequenza relativa 300-450 450-600 600-750 750-900 Classi l'ambiente ed il Territorio 6

Calcolo delle frequenze assolute e relative Ordinare i dati in ordine crescente Suddividere il campione in k classi di uguale ampiezza. K può essere calcolato con: Formula di Sturges K=+3.3*Log(N) K=N /2 5 K 25 Contare il numero di osservazioni n i che ricadono nella i-esima classe Frequenza assoluta: n i Frequenza relativa: f i =n i /N Frequenza cumulata di Weibull Consente di calcolare la frequenza di non superamento di un dato osservato Ordinati i dati in ordine crescente, la frequenza di non superamento dell i-esimo valore è data da: Fi=i/(n+) con n dimensione del campione Numero d'ordine i Precipitazione (mm) Fi 332.8 0.0455 2 356.2 0.0909 3 357.2 0.364 4 376.2 0.88 5 385.0 0.2273 6 387.6 0.2727 7 390.2 0.382 8 409.8 0.3636 9 452.6 0.409 0 453.7 0.4545 454.0 0.5000 2 458.6 0.5455 3 473.6 0.5909 4 475.0 0.6364 5 487.2 0.688 6 533.2 0.7273 7 565.8 0.7727 8 68.4 0.882 9 645.4 0.8636 20 687.6 0.909 2 822.2 0.9545 Frequenza di Weibull Fi 0.8 0.6 0.4 0.2 0 200 400 600 800 000 Precipitazione (mm) l'ambiente ed il Territorio 7

Indici descrittivi Gli indici descrittivi consentono di sintetizzare alcuni aspetti essenziali della distribuzione dei dati in esame Essi vengono distinti in: Indici di tendenza centrale Indici di dispersione (variabilità) Indici di forma Indici di tendenza centrale Gli indici di tendenza centrale forniscono dei valori attorno ai quali si può ritenere concentrata la variabile statistica in esame, fornendo così una idea (molto) sintetica del fenomeno investigato Con riferimento ad una serie di osservazioni x, x 2,,x n possiamo calcolare: n Media aritmetica: x = x t n t= Mediana: valore che non viene superato nel 50% dei casi Ordinati i dati in ordine crescente, valore corrispondente al valore centrale se N è dispari, alla media dei due valori centrali se N è pari Moda: valore che si presenta con maggiore frequenza Se la variabile è continua può essere calcolata come la media degli estremi della classe cui corrisponde la massima frequenza assoluta o relativa Media, mediana e moda generalmente non coincidono! l'ambiente ed il Territorio 8

Indici di tendenza centrale Esempio: serie di precipitazioni annue osservate nella stazione di Caltanissetta nel periodo 980-2000 Anno Precipitazione (mm) Media=482 mm 980 454.0 98 356.2 982 645.4 983 409.8 984 458.6 985 487.2 986 387.6 987 452.6 988 565.8 989 332.8 990 475.0 99 687.6 992 533.2 993 376.2 994 453.7 995 357.2 996 822.2 997 68.4 998 385.0 999 390.2 2000 473.6 0.50 0.40 0.30 0.20 0.0 0.00 Mediana=454 mm Moda= 525 mm Frequenza relativa 300-450 450-600 600-750 750-900 Classi Indici di dispersione Misurano la dispersione dei dati attorno ai valori centrali: Ampiezza del campione o range: R=x max -x min Indica la variabilità totale dei dati, cioè gli estremi dell intervallo di valori che la variabile assume Scarto assoluto medio n D = x t x Indica lo scostamento medio (in valore n t= assoluto) dalla media aritmetica Varianza campionaria: Indica la dispersione attorno alla media S 2 = n n ( xt x) t= 2 Scarto quadratico medio: E l operatore di dispersione per eccellenza e misura la dispersione attorno alla media (stesse dimensioni) Coefficiente di variazione: Coefficiente adimensionale di dispersione S = n S Cv = x n ( x t x) t= 2 l'ambiente ed il Territorio 9

200 Totali annui di precipitazione (mm) registrati alla stazione di Caltanissetta 000 800 600 400 200 scarto quadratico medio=44 mm media=54 mm Cv=.27 min=248 mm max=028 mm range=780 mm 0 900 920 940 960 980 2000 anni l'ambiente ed il Territorio 0