RICHIAMI DI STATISTISTICA E CALCOLO DELLE PROBABILITA

Documenti analoghi
Variabili aleatorie. Variabili aleatorie e variabili statistiche

Esercizi di Calcolo delle Probabilità

LICEO SCIENTIFICO QUESTIONARIO QUESITO 1

Calcolo delle Probabilità 2

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

MATEMATICA FINANZIARIA RISCHI: RAPPRESENTAZIONE E GESTIONE (CENNI)

Modelli descrittivi, statistica e simulazione

Variabile casuale Normale

REGRESSIONE E CORRELAZIONE

L indagine campionaria Lezione 3

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Il Corso di Fisica per Scienze Biologiche

Vedi: Probabilità e cenni di statistica

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Probabilita' mediante l'analisi combinatoria D n,k =Disposizioni di n oggetti a k a k (o di classe k)

Statistica ARGOMENTI. Calcolo combinatorio

Misure Meccaniche e Termiche. punti massa. Valore atteso: Varianza:

Teorema del limite centrale TCL

Elementi di base su modello binomiale e modello normale

Il campionamento e l inferenza. Il campionamento e l inferenza

Esercitazioni di Statistica

Distribuzioni e inferenza statistica

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Esercitazione: La distribuzione NORMALE

Teoria della probabilità Variabili casuali

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

Ulteriori Conoscenze di Informatica e Statistica

DISTRIBUZIONI DI PROBABILITA

STATISTICA ESERCITAZIONE 9

Esperimentazioni di Fisica 1 Elementi di Calcolo delle Probabilità

Elementi di Statistica

3. Distribuzioni. Corso di Simulazione. Anno accademico 2006/07

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Indirizzo Giuridico Economico Aziendale

un elemento scelto a caso dello spazio degli esiti di un fenomeno aleatorio;

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Statistica. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Due variabili aleatorie X ed Y si dicono indipendenti se comunque dati due numeri reali a e b si ha. P {X = a, Y = b} = P {X = a}p {Y = b}

Lanciando un dado, il tuo compagno esclama: uscirà 1, 2, 3, 4, 5 o 6 oppure: uscirà il numero 4. uscirà il numero 9

La probabilità composta

Note sulla probabilità

Capitolo 6. Variabili casuali continue. 6.1 La densità di probabilità

UNIVERSITÀ di ROMA TOR VERGATA

Distribuzioni di probabilità

Strumenti di indagine per la valutazione psicologica

Per capire qual è l altezza media degli italiani è stato intervistato un campione di 1523 cittadini. La media campionaria dell altezza risulta essere:

Calcolo della probabilità

Esercizi svolti di statistica. Gianpaolo Gabutti


Cosa dobbiamo già conoscere?

La PROBABILITA è un numero che si associa ad un evento E ed esprime il grado di aspettativa circa il suo verificarsi.

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

La SCALA di Probabilità varia tra 0.00 e 1.00.

MATEMATICA CORSO A CORSO DI LAUREA IN SCIENZE BIOLOGICHE I PROVA IN ITINERE COMPITO PROVA 1

Istituzioni di Statistica e Statistica Economica

CAPITOLO QUINTO DISTRIBUZIONE NORMALE

Variabili aleatorie Parte I

04 - Numeri Complessi

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Funzioni. iniettiva se x y = f (x) f (y) o, equivalentemente, f (x) = f (y) = x = y

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

NOZIONI DI CALCOLO DELLE PROBABILITÀ

SOLUZIONI DEL 1 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

STATISTICA DESCRITTIVA BIVARIATA

Laboratorio di Calcolo B 68

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

STATISTICA (2) ESERCITAZIONE 1. Dott.ssa Antonella Costanzo

Prontuario degli argomenti di Algebra

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Distribuzione Gaussiana - Facciamo un riassunto -

0 se y c 1 (y)) se c < y < d. 1 se y d

FENOMENI CASUALI. fenomeni casuali

Frequenza relativa e probabilità

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.

IL TEOREMA DEGLI ZERI Una dimostrazione di Ezio Fornero

ESERCIZI PROBABILITA I

( ) le colonne della matrice dei coefficienti, con. , risulta A 3 = A 1 + 4A 2 + 4A 5, A 4 = A 1 + A 2,

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

3 CERTAMEN NAZIONALE DI PROBABILITA E STATISTICA FELICE FUSATO Fase di Istituto 7 febbraio 2012

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

V.C. RETTANGOLARE o UNIFORME

COPPIE DI VARIABILI ALEATORIE

Esercitazioni di statistica

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Statistica. Alfonso Iodice D Enza

È l insieme di tutti i possibili esiti di un esperimento aleatorio; si indica generalmente con il simbolo.

Capitolo 6. La distribuzione normale

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

L assegnazione è coerente? SÌ NO. A e B sono stocasticamente indipendenti? SÌ NO

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Distribuzioni di Probabilità

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Transcript:

RICHIAMI DI STATISTISTICA E CALCOLO DELLE PROBABILITA La Statistica è la disciplina che studia gli eventi non deterministici (o incerti) riguardo ai quali non si ha una completa conoscenza. Tali eventi sono detti eventi aleatori. Sono tali, ad esempio, il risultato del lancio di una moneta o di un dado, o l estrazione dei numeri del lotto. Se per descrivere gli eventi possibili si fa uso di una variabile, tale variabile viene detta variabile aleatoria (v.a.). CALCOLO DELLE PROBABILITA LA PROBABILITA Agli eventi aleatori viene generalmente associato un numero che viene detto probabilità. Secondo una definizione non rigorosa la probabilità è il numero che quantifica il grado di fiducia che si nutre riguardo al verificarsi di un dato evento aleatorio. Se un fenomeno non deterministico ammette diversi risultati la probabilità di uno solo di essi (i.e. l i-esimo evento) può essere calcolata come il numero di occorrenze dell i-esimo evento diviso il numero totale di risultati possibili. Esempi: 1) È intuitivo che la probabilità associata al risultato Testa del lancio di una moneta non truccata corrisponda al 50%. Significa che il grado di fiducia che attribuiamo al verificarsi dell evento Testa è pari ad 1/2. I risultati possibili nel lancio di una moneta sono 2: testa o croce. Tra essi il numero di occorrenze del risultato Testa è 1. Per cui la probabilità che da un lancio esca testa è: P{Testa} = 1/2. 2) Si vuole studiare la probabilità che dal lancio del dado esca un numero pari. I numeri possibili risultanti dal lancio di un dado sono 6 [1 2 3 4 5 6]. Di questi 3 sono numeri pari [2 4 6]. Pertanto la probabilità che il risultato sia un numero pari è (detto x il risultato del dado): P{x è pari}=3/6. 3) Si vuole studiare la probabilità che alla tombola venga estratto un numero pari minore di 15 (evento x). Tutti i numeri della tombola sono 90. I numeri pari minori di 15 sono 7 [2 4 6 8 10 12 14]. Pertanto la probabilità associata al suddetto risultato è: P{x}=7/90. Risulta a questo punto chiaro che la probabilità di tutti i risultati possibili di un fenomeno è pari ad 1 e che la probabilità è un numero compreso tra 0 ed 1. P [0,1]. Infine la probabilità associata a tutti gli eventi meno l evento x è definita probabilità complementare e vale 1-P{x}.

UNIONE E INTERSEZIONE DI PROBABILITA Spesso risulta utile calcolare la probabilità associata al verificarsi di più eventi alternativi. Ad esempio alla tombola un giocatore può comprare 2 cartelle. La vittoria di una cartella esclude la vittoria dell altra (i due eventi sono alternativi) ma risulta intuitivo affermare che il giocatore ha una probabilità doppia rispetto a chi ha comprato una sola cartella. In tal caso si parla di unione di probabilità e se gli eventi sono tra loro indipendenti il calcolo viene effettuato sommando tra loro le probabilità dei singoli eventi alternativi. Esempio: 4) Con riferimento all esempio 2) il calcolo della probabilità che un numero pari sia il risultato del lancio di un dado corrisponde a calcolare la probabilità che il risultato sia 2 oppure 4 oppure 6. Secondo questo approccio la probabilità può essere calcolata come: P{x} = P{2} + P{4} + P{6} = 1/6 + 1/6 + 1/6 = 1/2. Ancora può risultare utile il calcolo della probabilità associata al verificarsi contemporaneo di due eventi non alternativi. Ad esempio, nelle scommesse sportive, può essere utile calcolare la probabilità di indovinare i risultati di due o più partite di campionato. E importante che i due eventi non siano tra loro alternativi: la probabilità che il risultato del lancio di una moneta sia contemporaneamente sia testa sia croce è evidentemente nulla. In questo caso si parla di intersezione di probabilità e, nel caso di eventi tra loro indipendenti, si calcola come prodotto delle probabilità associate ai singoli eventi Esempio: 5) Con riferimento all esempio 3) si vuole studiare la probabilità che alla tombola venga estratto un numero pari minore di 15 (evento x). La probabilità che il numero estratto sia pari (evento y) è 45/90 = 1/2, mentre la probabilità che il numero sia minore di 15 (evento z) è 14/90 = 7/45. La probabilità combinata dei due eventi è: P{x} = P{y} * P{z} = 1/2 *7/45 = 7/90. ENNUPLE DI NUMERI E COEFFICIENTE BINOMIALE Le definizioni di unione e di intersezione di probabilità risultano utili nel calcolo di probabilità di combinazioni di numeri. Si scelga come esempio il gioco del lotto e si voglia calcolare la probabilità associata all estrazione di una combinazione di 6 numeri. La probabilità che il primo numero estratto corrisponda ad uno dei sei giocati è pari a 6/90. Infatti i casi vincenti sono sei a fronte di 90 casi possibili. Si può anche affermare che ciascuno dei 6 numeri giocati ha una probabilità pari ad 1/90 di essere il primo estratto; pertanto la probabilità che uno tra essi corrisponda al primo estratto è pari a 1/90 + 1/90 + 1/90 + 1/90 + 1/90 + 1/90 = 6/90. Una volta indovinato il primo numero, restano 5 numeri ancora da indovinare a fronte di 89 numeri da estrarre. La probabilità che il secondo numero estratto corrisponda ad uno dei rimanenti cinque è pari a 5/89. La probabilità di indovinare tutti i 6 numeri giocati (evento x) è pari all intersezione delle probabilità di indovinare ciascuno dei sei numeri:

P{x} = 6/90 * 5/89 * 4/88 * 3/87 * 2/86 * 1/85 = (1 * 2 * 3 * 4 * 5 * 6) / (90 * 89 * 88 * 87 * 86 * 85) Moltiplicando numeratore e denominatore per la stessa quantità: P{x} = (1 * 2 * 3 * 4 * 5 * 6) / (90 * 89 * 88 * 87 * 86 * 85) * (84 * 83 * * 2 * 1) / (84 * 83 * * 2 * 1) si può scrivere: P {x} = 6! * (90-6)! / 90! Laddove la scrittura n! (n fattoriale) rappresenta il prodotto dei primi n numeri naturali. La metodologia mostrata valga come prova empirica della formula per calcolare la probabilità associata all estrazione di una combinazione di n numeri da un insieme di m numeri: P{x} = n! (m-n)! / m! Si definisce coefficiente binomiale ( m n ) = m! n! (m n)! il numero di ennuple che è possibile estrarre da una serie di m numeri. Il suo inverso rappresenta la probabilità relativa ad una sola di tali ennuple.

STATISTICA FUNZIONI DISTRIBUZIONE E DENSITA DI PROBABILITA PER VARIABILI DISCRETE Assegnata una variabile aleatoria x, la funzione distribuzione di probabilità (cdf) lega ad ogni valore x 0 della variabile x la probabilità: F(x 0 ) = P{x x 0 } La funzione densità di probabilità (pdf) lega ad ogni valore x 0 della variabile x la probabilità: f(x 0 ) = P{x=x 0 } Esempi: 6) La funzione distribuzione associata alla variabile x che descrive il risultato del lancio di un dado vale: F(6) = 1 F(5) = 5/6 F(4) = 4/6 F(3) = 3/6 F(2) = 2/6 F(1) = 1/6 7) La funzione densità associata alla variabile x che descrive il risultato del lancio di un dado vale: F(6) = 1/6 F(5) = 1/6 F(4) = 1/6 F(3) = 1/6 F(2) = 1/6 F(1) = 1/6

VARIABILI ALEATORIE CONTINUE DISTRIBUZIONE E DENSITA DI VARIABILI ALEATORIE CONTINUE Fin qui si è fatto riferimento a variabili aleatorie discrete, ma molto comune è nella pratica il riferimento a variabili aleatorie continue. Sono tali le variabili aleatorie che possono assumere, all interno di un assegnato intervallo, valori appartenenti all insieme di numeri reali. Ad esempio la temperatura di una fiamma in condizioni non adiabatiche può dipendere da fattori ambientali di non facile previsione: essa assume a pieno titolo le caratteristiche di una variabile aleatoria continua. Si prenda come esempio la funzione generatrice di numeri casuali di un calcolatore. Tale funzione restituisce come risultato un numero reale compreso fra 0 ed 1 estratto casualmente. La funzione distribuzione di probabilità per una siffatta variabile è una retta passante per i punti (x,f(x))=(0,0) e (x,f(x))= (1,1) Più difficile risulta il calcolo della probabilità P{x= x 0 }: il numero di eventi possibili è infinito, per cui la probabilità di ciascun numero risulterebbe pari a 1/ = 0. Appare quindi chiaro che nel caso di variabili continue la definizione fin qui data di probabilità perde di significato. Al fine di poter almeno esprimere la probabilità che una variabile aleatoria continua assumi valori prossimi ad un determinato valore è necessario introdurre la definizione di densità di probabilità per variabili continue, che è così formulata: f(x) = lim x 0 F(x+ x) F(x) x = df(x) dx 1 0.8 F(x), f(x) 0.6 0.4 0.2 cdf pdf 0 0 0.2 0.4 0.6 0.8 1 x Le funzioni distribuzione e densità di probabilità gode di alcune proprietà: P(x>x 0 ) = 1- P(x<x 0 ) = 1-F(x 0 ) se x 1 <x 2 : P(x<x 2 )=P(x< x 1 ) + P(x 1 <x<x 2 ) => P(x 1 <x<x 2 )=P(x< x 2 ) - P(x<x 1 ) => P(x 1 <x<x 2 )=F(x 2 )-F(x 1 ) f(x) = 1

x 0 f(x) x 2 = F(x 0 ) f(x) = F(x x 1 2 ) F(x 1 ) PERIODO DI RITORNO In statistica si definisce periodo di ritorno il tempo medio di attesa fra due eventi successivi. Si consideri, a scopo esemplificativo, la variabile aleatoria x che rappresenta le condizioni del tempo meteorologico in un dato giorno e assegniamo ad essa il valore 1 se il suddetto giorno è piovoso e 0 altrimenti. A tale variabile è possibile associare una pdf: P(x=0)=f(0) e P(x=1)=f(1) L inverso di tale probabilità costituisce la definizione di periodo di ritorno: T(x) = 1 f(x) Esso rappresenta il numero medio di giorni da attendere tra il verificarsi di due eventi uguali successivi. Se ad esempio f(1)=0.05, allora il numero medio di giorni da attendere tra il verificarsi di due eventi piovosi successivi risulterebbe pari a T(1)= 1/0.05 = 20 giorni. DISTRIBUZIONE GAUSSIANA La variabile aleatoria gaussiana, nota pure con il nome di Normale, costituisce il modello di v.a. più adoperato. Essa può essere definita come modello interpretativo degli errori o scostamenti x-m, dal valore vero m, che accompagnano le misure sperimentali x di un certo parametro fisico effettuate sempre nelle stesse condizioni. Se le suddette misure non sono affette da errori sistematici è logico ritenere che: sia nulla la media degli errori la pdf degli errori sia simmetrica e tenda a zero per valori crescenti sia negativi che positivi la pdf abbia valore massimo in corrispondenza del valore nullo. Una siffatta funzione densità assume la seguente espressione matematica: f(x) = 1 2π e x2 2 con < x < + F(x) = x 1 2π e x2 2 Gaussiana 1 cdf pdf 0.8 F(x), f(x) 0.6 0.4 0.2 0-3 -2-1 0 1 2 3 x

STATISTICA INFERENZIALE MEDIA, VARIANZA, COVARIANZA E SCARTO QUADRATICO MEDIO In teoria della probabilità il valore atteso (chiamato anche media, speranza o speranza matematica) di una variabile casuale X, è un numero m che formalizza l'idea euristica di valore medio di un fenomeno aleatorio. In generale il valore atteso di una variabile casuale discreta (che assuma cioè solo un numero finito o una infinità numerabile di valori) è dato dalla somma dei possibili valori di tale variabile, ciascuno moltiplicato per la probabilità di essere assunto (ossia di verificarsi), cioè è la media ponderata dei possibili risultati. Per una variabile casuale continua la somma viene sostituita da un integrale: m(x) = { i=1 x ip(x i ) se x è discreta + f(x)xdx se x è continua La varianza di una variabile aleatoria X (e della distribuzione di probabilità che questa segue) è un numero, indicato con Var(X), che fornisce una misura di quanto siano vari i valori assunti dalla variabile, ovvero di quanto si discostino dalla media m(x). var(x) = { i=1 [x i m(x)] 2 P(x i ) se x è discreta + [x m(x)] 2 f(x)dx se x è continua La radice quadrata della varianza viene definita scarto quadratico medio. s. q. m. = var(x) Assegnate due variabili aleatorie x e y la covarianza è un numero Cov(X,Y) che fornisce una misura di quanto le due varino assieme, ovvero della loro dipendenza. Essa è definita come segue: cov(x, y) = { i=1 [x m(x)][y i m(y)]p(x, y) se x, y sono discrete + [x m(x)][y m(y)]f(x, y)dxdy se x, y sono continue Se si hanno due serie di rilevazioni della variabile x ed y rispettivamente, entrambe di numerosità n, si può calcolare la covarianza come: cov(x, y) = 1 n i=1 [x m(x)][y i m(y)] VARIOGRAMMA Sia assegnata una variabile che descrive una grandezza fisica all interno di un dominio spaziale, sia essa la concentrazione di inquinante in un lago o la permeabilità di un acquifero. Noto il valore della variabile in un punto del dominio è possibile studiarne la variabilità spaziale per mezzo del variogramma. Si immagini una variabile aleatoria che vari con continuità lungo una retta e siano noti i valori assunti dalla variabile in corrispondenza di una serie di punti P i appartenenti alla retta e distanti d i da un punto identificato come origine.

O, x 0 P 1, x 1 P 2, x 2 P 3, x 3 P i, x i d 1 d 2 d 3 d 4 γ(o, d) = 1 n [x(0) x(o + d 2n i=1 i)] 2 Il variogramma misura la correlazione dei valori della variabile nell intorno di un punto. Tanto minore è il valore assunto da γ, tanto maggiore sarà la dipendenza.