Idraulica e Idrologia: Lezione 6

Documenti analoghi
Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

Distribuzioni campionarie

Capitolo 6. Variabili casuali continue. 6.1 La densità di probabilità

Il confronto fra medie

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Idraulica e idrologia: Lezione 9

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Introduzione alla probabilità

STATISTICA ESERCITAZIONE

Questionario 1. Sono assegnati i seguenti dati

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Il Corso di Fisica per Scienze Biologiche

Il campionamento e l inferenza. Il campionamento e l inferenza

Cenni di probabilità

Distribuzioni campionarie. Antonello Maruotti

L indagine campionaria Lezione 3

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Lezione 1. La Statistica Inferenziale

Note sulla probabilità

LE MISURE. attendibilità = x i - X

Idraulica e Idrologia: Lezione 2

Lezione 8. La Statistica Inferenziale

ISTOGRAMMI E DISTRIBUZIONI:

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Distribuzioni e inferenza statistica

Modelli descrittivi, statistica e simulazione

11. Analisi statistica degli eventi idrologici estremi

Capitolo 2 Le misure delle grandezze fisiche

Per capire qual è l altezza media degli italiani è stato intervistato un campione di 1523 cittadini. La media campionaria dell altezza risulta essere:

CALCOLO DELLE PROBABILITA' risultato non può essere previsto con certezza ogni risultato possibile di un esperimento

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica descrittiva II

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Elementi di base su modello binomiale e modello normale

Alfredo Rizzi. Già professore ordinario di teoria dell inferenza statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Fin qui si sono considerate le variabili casuali ciascuna per proprio conto. Ora consideriamo la possibilità di relazioni tra variabili.

λ è detto intensità e rappresenta il numero di eventi che si

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

LA DISTRIBUZIONE NORMALE

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Campionamento La statistica media campionaria e la sua distribuzione

Teoria e tecniche dei test. Concetti di base

Lezione 3 Calcolo delle probabilità

Distribuzioni di probabilità

1/55. Statistica descrittiva

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

COMUNE DI CONSIGLIO DI RUMO

Statistica. Campione

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Le rappresentazioni grafiche

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Definizione frequentistica di probabilita :

ALLEGATO 1 METODO E DATI DI RIFERIMENTO PER LA DETERMINAZIONE DELLE QUANTITÀ DI PIOGGIA PER EVENTI ESTREMI

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

standardizzazione dei punteggi di un test

Statistica descrittiva e statistica inferenziale

Intervalli di confidenza

DISTRIBUZIONI DI PROBABILITA

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

La probabilità composta

STATISTICA 1 ESERCITAZIONE 2

Legge di sopravvivenza nel lancio dei dadi

ESERCIZI DI RIEPILOGO 1

Capitolo 6. La distribuzione normale

Probabilita' mediante l'analisi combinatoria D n,k =Disposizioni di n oggetti a k a k (o di classe k)

RELAZIONE IDROLOGICA IDRAULICA

Statistica descrittiva

Probabilità I Calcolo delle probabilità

DISTRIBUZIONI DI PROBABILITA

RICHIAMI DI STATISTISTICA E CALCOLO DELLE PROBABILITA

INDICATORI DI TENDENZA CENTRALE

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA

Casa dello Studente. Casa dello Studente

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Lezione n. 1 _Complementi di matematica

Probabilità. Ing. Ivano Coccorullo

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

LEZIONI DI STATISTICA MEDICA

La SCALA di Probabilità varia tra 0.00 e 1.00.

Errori di misura Teoria

Teoria della probabilità Variabili casuali

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Lezione 8: Esercizi di Idrologia

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Modulo 1 Concetti di base della Tecnologia dell Informazione

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

INDICATORI DI TENDENZA CENTRALE

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

La simulazione con DERIVE Marcello Pedone LE SIMULAZIONI DEL LANCIO DI DADI CON DERIVE

a) 36/100 b) 1/3 c)

Statistica descrittiva

Transcript:

Idraulica e Idrologia: Lezione 6 Agenda del giorno - Eventi estremi in idrologia: legame fra magnitudo e probabilità; - Statistica e probabilità in idrologia; - Tempo di ritorno. 1

Analisi statistica di dati idrologici INTRODUZIONE I processi idrologici evolvono, nello spazio e nel tempo, secondo modalità che sono in parte predicibili (o deterministiche) ed in parte casuali (stocastiche - dal greco stochastikós congetturale ) in quanto non adeguatamente descritti dalle leggi fisiche in nostro possesso La incerta comprensione dei fenomeni idrologici è dovuta essenzialmente a tre fattori: l implicita aleatorietà dei fenomeni che innescano i processi idrologici (es.: precipitazione); la presenza, in tutte le misure idrologiche, di un elevata componente di errore dovuta a problemi di campionamento (le misure idrologiche consentono di accedere ad un campione - spesso estremamente modesto - dell insieme dei valori assunti dalla variabile idrologica considerata); la mancanza di un rigoroso inquadramento fisico di tipo teorico dei processi idrologici alle diverse scale spaziali e temporali alle quali tali processi si manifestano. Questo significa che, anche se si disponesse di misure esatte non affette da errori di campionamento, la previsione del comportamento del sistema idrologico sarebbe comunque affetta da errore. 2

Analisi statistica degli eventi idrologici estremi L ANALISI STATISTICA NELL AMBITO DELL ANALISI IDROLOGICA I sistemi idrologici sono talvolta investi da eventi estremi (precipitazioni, piene, siccità). La magnitudo di un evento estremo è inversamente proporzionale alla sua frequenza di accadimento: eventi molto severi accadono meno frequentemente di eventi di moderata intensità. Obiettivo dell analisi statistica dei dati idrologici: collegare la magnitudo degli eventi estremi alla loro frequenza di accadimento tramite l impiego di distribuzioni di probabilità. I dati idrologici utilizzati a tale scopo sono assunti essere indipendenti e identicamente distribuiti. In pratica, questo si consegue utilizzando per le analisi statistiche i valori massimi annuali della variabile di interesse. Si consideri una serie di valori di portata massima annuale: ogni valore è considerato indipendente rispetto agli altri, e ciascun valore può essere considerato come la realizzazione di un processo stocastico identico per tutti gli anni considerati (questo implica che il sistema idrologico che produce tali valori estremi - il bacino idrografico a monte della sezione dove sono stati osservati i valori massimi annuali - non subisca variazioni nel periodo considerato. Variazioni tipiche sono quelle collegate all uso del suolo, o alla costruzione di uno sbarramento). 3

Analisi statistica di dati idrologici Alcune definizioni 4

Statistica e probabilità Quando è possibile effettuare ripetuti esperimenti indipendenti, come nel lancio di un dado o di una moneta, è possibile riscontrare che la frequenza di un evento tende ad avvicinarsi ad un certo limite, anche se l evento considerato rimane impredicibile. Questo effetto viene indicato con il termine regolarità statistica. Operando in laboratorio, è possibile evidenziare tale regolarità mediante la ripetizione di esperimenti indipendenti in circostanze identiche. In idrologia, tuttavia, i dati utilizzati sono di tipo osservativo piuttosto che sperimentale (la maggior parte degli esperimenti non possono essere ripetuti nelle stesse circostanze). Per questi dati, pertanto, la regolarità statistica non può essere dimostrata tramite la ripetizione dell esperimento. La giustificazione per l uso degli strumenti statistici e probabilistici in idrologia dipende quindi dalla rappresentazione espressiva che tali metodi forniscono circa il valore atteso e la variabilità di osservazioni future. 5

Statistica La statistica fornisce metodi per inferire le proprietà di una popolazione sulla base di quelle di un campione, a tale popolazione appartenente. Oltre alla semplice descrizione della popolazione, essa offre informazioni sulla incertezza relativa alla conoscenza della popolazione acquisita tramite il campione. Pertanto, la statistica consente di valutare il valore di un dato, misurato in termini di decrescita dell incertezza. Valutare le incertezze è pertanto fondamentale per indirizzare gli sforzi di acquisizione di ulteriori dati. 6

Statistica Il concetto fondamentale in statistica è rappresentato dalla popolazione, ovvero dalla collezione completa di eventi ci cui interessa valutare le proprietà. Una popolazione può essere finita e numerabile esplicitamente (es.: la popolazione di tutti i corsi d acqua sul pianeta terra che drenano più di 1000 km2), oppure infinita e definita in astrazione (es.: la popolazione di tutte le possibili portate che si possono verificare lungo un corso d acqua presso una sua specifica sezione). 7

Statistica Gli strumenti della statistica consentono quindi di: sviluppare metodologie per l efficiente raccolta dei dati; individuare metodi per descrivere sinteticamente i dati raccolti; fornire una interpretazione dei dati; trarre conclusioni sulla base dei dati. 8

Probabilità La probabilità fornisce il fondamento teorico per i metodi statistici. La probabilità consente il calcolo della probabilità di un evento (ovvero, di osservare un determinato valore campionario), quando siano assegnate determinate caratteristiche della popolazione. Di converso, la statistica fornisce metodi per inferire le caratteristiche della popolazione, assegnate quelle del campione. Stime e stimatori Uno stimatore è definito come una procedura per il calcolo delle caratteristiche della popolazione a partire da quelle del campione. Un valore specifico calcolato tramite uno stimatore è definito come stima. Uno stimatore distorto è costituito da uno stimatore che, utilizzato più volte, fornisce stime che, in media, differiscono rispetto a quelle della popolazione. 9

Trattamento probabilistico dei dati DISTRIBUZIONI DI PROBABILITÀ Il processo di inferenza statistica consente di identificare le proprietà statistiche della popolazione a partire da quelle del campione. La funzione di probabilità così identificata consente di specificare, fra l altro, la probabilità che un generico valore x venga (o non venga) superato. Alcuni principi generali La probabilità deve soddisfare una serie di assiomi: 1. La probabilità di un evento è un numero compreso fra 0 e 1 2. La probabilità dell evento certo è 1 3. La probabilità di un evento ottenuto come somma di due eventi che mutuamente si escludono è pari alla somma delle probabilità dei due eventi. 4. La probabilità condizionata di un evento A dato che un evento B si è verificato è data dal prodotto delle probabilità di A e di B (se i due eventi sono indipendenti fra loro). 10

Trattamento probabilistico dei dati ESEMPI Nel caso del lancio di un dado, la probabilità che si verifichi uno dei 6 possibili risultati è pari ad 1/6. La probabilità che si verifichi: 1 o 2 o 3 o 4 o 5 o 6 = 1/6+1/6+..1/6=1 La probabilità che, in due lanci successivi, si verifichi la prima volta 2 e la seconda 5 si può calcolare come una probabilità condizionata: 1/6 * 1/6 = 1/36 La probabilità che, in due lanci successivi, non si verifichi né 2 né 5 si può calcolare utilizzando il principio della probabilità totale e quello della probabilità condizionata: p(a)= probabilità che in due lanci successivi si verifichino 2 e 5=1/36 p(b)= probabilità che in due lanci successivi non si verifichino né 2 né 5 P(A)+P(B)=1 P(B)=1-P(A) P(B)=1-1/36=35/36 11

Statistica descrittiva Passiamo agli strumenti 12

Sintesi e descrizione del campione di dati: istogramma L istogramma rappresenta la distribuzione di frequenza del campione, ottenuta: suddividendo l intervallo di misura in k parti uguali (intervalli); determinando il numero di dati e la percentuale di dati che ricadono in ciascun intervallo (nel primo caso si ha la distribuzione di frequenza assoluta, nel secondo di frequenza relativa); riportando una linea a barre la cui altezza è proporzionale al numero ovvero alla percentuale di dati che ricadono in ciascun intervallo. Il numero degli intervalli Per ottenere una buona rappresentazione grafica della frequenza, il numero degli intervalli va scelto accuratamente. Per un campione di numerosità n, il numero di intervalli k dovrebbe essere eguale al più piccolo numero intero tale che 2 k n. Esempio: n=30 allora: k=5 13

Istogramma Numero intervalli eccessivamente ridotto Intervalli eccessivamente numerosi 14

Distribuzioni di frequenza e di probabilità Le funzioni di frequenza relativa e di frequenza cumulata sono definite per il campione. La funzione di densità di probabilità è rappresentata dal rapporto fra la funzione di frequenza cumulata e x, per n (numero di elementi del campione) tendente ad infinito e x tendente a zero. La funzione di probabilità F(x) rappresenta la probabilità che la variabile X assuma un valore compreso fra l estremo inferiore ed x. (Alcune distribuzioni sono definite per valori negativi di x). F(x) indica la probabilità di non superamento 15

Distribuzione di probabilità L area sotto la curva rappresenta la probabilità. La probabilità che x cada nell intervallo [a,b] è pari a P(a x b) b a f(x)dx 16

Distribuzione di probabilità cumulata Definizione: La probabilità cumulata di non superamento relativa al valore a è la probabilità che un evento sia compreso fra il limite inferiore ed a, ovvero La probabilità cumulata di superamento relativa al valore a è la probabilità che un evento sia superiore ad a, ovvero 17

Tempo di ritorno - 1 Il concetto di probabilità di non superamento (associato ad un certo evento idrologico) è spesso sostituito (per ragioni di comodità di rappresentazione) da quello di tempo di ritorno T. In realtà, il concetto di tempo di ritorno può essere introdotto senza far ricorso alla probabilità. Si consideri l idrogramma in figura, dove sono indicati gli intervalli compresi fra successi istanti associati a valori di portata maggiori di Q. Se si considera un periodo di tempo molto esteso, per ogni valore arbitrario di portata Q il tempo di ritorno corrispondente è definito come la media degli intervalli T( Q') media ( 1, 2, 3,..., n) 18

Tempo di ritorno - 2 DEFINIZIONI T 1 dove x T è la variabile caratterizzata da un tempo di ritorno T P( X x ) T se P=0.01, T=100 anni Il tempo di ritorno di un evento di assegnata intensità è quindi: Numero di anni che in media separa il verificarsi di due eventi di intensità eguale o superiore a quella assegnata. Numero di anni in cui l evento di intensità assegnata viene eguagliato o superato in media 1 volta. In queste definizioni, la parola chiave è in media. Infatti, il tempo di ritorno non è il numero di anni che separa due eventi di intensità eguale o superiore a quella assegnata. Secondo tale ultima definizione, dopo il verificarsi di un evento T-ennale (ovvero di probabilità di superamento 1/T), occorrerebbe attendere T anni affinché l evento si ripeta (con certezza). Questo non è vero: infatti, la probabilità di un tale evento rimane pari ad 1/T in ciascun anno, indipendentemente dal verificarsi di un simile evento nell anno precedente o in anni recenti. 19