Introduzione alla probabilità

Documenti analoghi
Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Distribuzioni e inferenza statistica

Statistica descrittiva

Modelli di probabilità

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

FENOMENI CASUALI. fenomeni casuali

Probabilità: teoremi e distribuzioni

DISTRIBUZIONI DI PROBABILITA

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

Alcune v.a. discrete notevoli

Modelli probabilistici variabili casuali

Ulteriori Conoscenze di Informatica e Statistica

Variabili casuali. - di Massimo Cristallo -

Università del Piemonte Orientale Corsi di Laurea triennale di area tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

Variabili aleatorie. Variabili aleatorie

Elaborazione statistica di dati

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 3: Variabili aleatorie discrete notevoli

Elementi di base su modello binomiale e modello normale

Ψ PSICOMETRIA. Corso di laurea triennale (classe 34) STATISTICA INFERENZIALE

1.1 Obiettivi della statistica Struttura del testo 2

Distribuzioni di probabilità

DISTRIBUZIONI DI PROBABILITA (parte 2) 1 / 27

DISTRIBUZIONI DI PROBABILITA

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Ulteriori Conoscenze di Informatica e Statistica

STATISTICA A D (72 ore)

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

ESERCITAZIONE N. 5 corso di statistica

Outline. 1 v.c. continue. 2 v.c. Normale. 3 v.c. Esponenziale. Lezione 13. A. Iodice. v.c. continue. v.c. Normale. v.c.

PROBABILITA. Distribuzione di probabilità

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Il campionamento e l inferenza. Il campionamento e l inferenza

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

Variabili aleatorie discrete. Giovanni M. Marchetti Statistica Capitolo 5 Corso di Laurea in Economia

Funzioni di probabilità per variabili casuali discrete e continue

2. Introduzione alla probabilità

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Variabile Casuale Normale

Lezione 3 Calcolo delle probabilità

Statistica Inferenziale

Statistica. Lezione 4

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

Statistica. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Laboratorio di Calcolo Paola Gallo

Calcolo delle Probabilità

Variabili aleatorie. Variabili aleatorie e variabili statistiche

Statistica. Alfonso Iodice D Enza

NOZIONI DI CALCOLO DELLE PROBABILITÀ

Le variabili casuali o aleatorie

Le frequenze riportate in tabella possono essere considerate il risultato di un esperimento

Lezione n. 1 (a cura di Irene Tibidò)

esperimento casuale: è un esperimento condotto sotto l effetto del caso; evento elementare: ciascuno dei possibili esiti di un esperimento casuale;

Controllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella

Lezione 13 Corso di Statistica. Domenico Cucina

Variabile casuale E 6 E 5 E 4. R S x1 E 2

C.I. di Metodologia clinica

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Modelli descrittivi, statistica e simulazione

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

La probabilità composta

tabelle grafici misure di

Statistica Applicata all edilizia: alcune distribuzioni di probabilità

Esercitazione del 29 aprile 2014

Capitolo 6. La distribuzione normale

Elaborazione statistica di dati

DISTRIBUZIONI DI PROBABILITA

Capitolo 6 La distribuzione normale

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Presentazione dell edizione italiana

LE DISTRIBUZIONI CAMPIONARIE

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3

Principi di Statistica a.a

Modulo III. Definizione ed elementi di calcolo delle probabilità Le variabili casuali La distribuzione normale e la normale standardizzata

V.C. RETTANGOLARE o UNIFORME

Distribuzioni campionarie

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Programma della parte introduttiva: Lezione 5

Statistica. Lezione : 18, 19. Variabili casuali

Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico).

Teoria della probabilità Variabili casuali

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

VARIABILI CASUALI. Fino ad ora abbiamo definito:

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

Utilizzando la terminologia generica di prima, la variabile standardizzata X si calcola quindi

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Esercizi Teoria della Probabilità

Probabilità e Statistica Esercizi

Esercitazione del 04/06/2015 Probabilità e Statistica Foglio 14

La PROBABILITA è un numero che si associa ad un evento E ed esprime il grado di aspettativa circa il suo verificarsi.

Statistica Inferenziale

3.1 La probabilità: eventi e variabili casuali

Computazione per l interazione naturale: fondamenti probabilistici (1)

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34

La SCALA di Probabilità varia tra 0.00 e 1.00.

Transcript:

UNIVERSITÀ DI BOLOGNA FACOLTÀ DI MEDICINA VETERINARIA LAUREA IN SANITA E QUALITA DEI PRODOTTI DI ORIGINE ANIMALE Introduzione alla probabilità Probabilità = metodologia per lo studio di fenomeni aleatori (fenomeni per i quali vi è incertezza sul risultato) Esempi: 1) presenza/assenza di residui di sostanze chimiche nocive nei prodotti derivati dagli animali allevati in terreni sottoposti a trattamenti chimici 2) numero di piccoli nati vivi da una scrofa 3) intervallo di tempo tra la conclusione della somministrazione di un farmaco per la cura di una certa malattia nelle vacche da latte e il termine della tossicità del latte Perché è importante studiare la probabilità in statistica? 1

UNIVERSITÀ DI BOLOGNA FACOLTÀ DI MEDICINA VETERINARIA LAUREA IN SANITA E QUALITA DEI PRODOTTI DI ORIGINE ANIMALE Definizioni di probabilità 1) definizione classica (a priori) P(E) = numero di casi favorevoli ad E numero di casi possibili - formulata rispetto a fenomeni aleatori che ammettono un numero finito di risultati (esempi: lancio di una moneta, lancio di un dado) - formulata nell assunto che i possibili risultati siano tutti ugualmente probabili (la moneta/ il dado devono essere regolari) E= {il risultato di un lancio della moneta è testa} P(E) = 1/2 E = {il risultato di un lancio del dado è un numero pari} = {2, 4, 6} P(E) = 3/6. non è utilizzabile rispetto ad esperimenti casuali i cui risultati non sono tutti ugualmente probabili (esempio: lancio di 2 dadi e registrazione della somma dei risultati) 2

2) definizione frequentista n(e) P(E) = lim n n n = numero di repliche di un esperimento aleatorio, condotte nelle medesime condizioni sperimentali (esempio: n lanci di una moneta regolare) n(e) = numero di repliche in cui un evento E si è verificato ( testa ) n(e) = proporzione di repliche in cui l evento E si è verificato n non è utilizzabile rispetto ad esperimenti casuali non replicabili nelle medesime condizioni sperimentali. 3) definizione soggettiva P(E) = grado di fiducia che un individuo ha sull avverarsi di E Osservazioni 1. Legame tra definizioni classica e frequentista Esempio: se lancio 3 volte una moneta regolare non mi stupisco particolarmente se esce 3 volte testa. Se la lancio 1000 volte mi aspetto che testa esca 500 volte 3

2. Legame tra definizioni frequentista e soggettiva Il grado di fiducia espresso da un individuo circa l avverarsi di E è legato alle sue esperienze, dipendenti dalle manifestazioni dell evento E sperimentate dall individuo nel corso della sua vita. Proprietà fondamentali della probabilità 1. 0 P(E) 1 qualunque sia E 2. P(E) = 0 E è un evento impossibile 3. P(E) = 1 E è un evento certo 4. Complementare dell evento E E = {un gattino contrae la rinotracheite virale felina dopo la vaccinazione a 9 e 13 settimane di vita} Ec = {un gattino NON contrae la rinotracheite virale felina dopo la vaccinazione a 9 e 13 settimane di vita} P(Ec) = 1 P(E) P(E) = 0,04 P(Ec) = 0,96. 4

Regole fondamentali della probabilità 1. Regola della somma Esempio: una scatola di biscotti per cani contiene biscotti di 5 forme differenti, nel medesimo numero. Estraggo a caso un biscotto dalla scatola. E = il biscotto è di forma rotonda P(E) = 1/5 F = il biscotto è di forma quadrata P(F) = 1/5 E F = il biscotto è di forma rotonda, oppure quadrata, oppure di entrambe le forme E, F eventi mutuamente esclusivi P(E F) = P(E) + P(F) Nell'esempio: P(E F) = 1/5 + 1/5 = 2/5 2. Regola del prodotto Esempio: due scatole di biscotti per cani contengono biscotti di 5 forme differenti, nel medesimo numero. Estraggo a caso un biscotto dalla prima scatola ed uno dalla seconda. E = il biscotto della prima scatola è di forma rotonda P(E) = 1/5 F = il biscotto della seconda scatola è di forma rotonda P(F) = 1/5 E F = i due biscotti estratti sono entrambi di forma rotonda E, F eventi indipendenti P(E F) = P(E) P(F) Nell'esempio: P(E F) = 1/5 1/5 = 1/25 5

Variabile casuale (aleatoria) Esempio 1: lancio un dado regolare Possibili risultati: {T, C} Risultati P(T) = P(C) = ½ X P(X) T 1 (successo) ½ C 0 (insuccesso) ½ E' possibile calcolare alcuni indicatori sintetici della distribuzione di probabilità di X, in particolare la media e la varianza dei valori di X. Nell'esempio 1: M(X) = 1/2 V(X) = 1/4 6

Esempio 2: una vacca da latte è sottoposta ad un controllo medico Possibili risultati: {gravida, non gravida} La probabilità che la mucca sia gravida, π, non è nota Risultati X P(X) gravida 1 (successo) non gravida 0 (insuccesso) π (1 π) Qual è la media e la varianza di X? Variabile casuale di Bernoulli - X è una variabile casuale BINARIA - la distribuzione di probabilità di X è caratterizzata da una costante (parametro): la probabilità dell evento successo π π = 0,1 X Ber(π) π = 0,9 7

Esempio 3: tre vacche da latte sono sottoposte ad un controllo medico Per ognuna si ha una variabile casuale binaria di Bernoulli di parametro π: (X1, X2, X3) Possibili risultati: Ei P(Ei) (nell ipotesi di indipendenza) (π = 0.7) (0, 0, 0) (1 π) (1 π) (1 π) = 0,027 (1, 0, 0) π (1 π) (1 π) = 0,063 (0, 1, 0) (1 π) π (1 π) = 0,063 (0, 0, 1) (1 π) (1 π) π = 0,063 (1, 1, 0) π π (1 π) = 0,147 (1, 0, 1) π (1 π) π = 0,147 (0, 1, 1) (1 π) π π = 0,147 (1, 1, 1) π π π = 0,343 Y = numero di mucche risultate gravide al controllo sanitario Possibili risultati P(Y) (π = 0.7) (per la regola della somma) 0 0,027 1 0,189 2 0,441 3 0,343 Media e varianza di X (π = 0.7): M(X) = 2,1 V(X) = 0,63 8

Variabile casuale binomiale - Y è una variabile casuale DISCRETA - la distribuzione di probabilità di Y è caratterizzata da due costanti (parametri): n (numero di mucche) e π (la probabilità dell evento successo ) Y Bin(n, π) La media e la varianza di una variabile casuale binomiale sono rispettivamente pari a nπ, nπ(1-π) Funzione Excel per il calcolo delle probabilità associate ai valori di una variabile casuale Y binomiale: DISTRIB.BINOM 9

Sintassi DISTRIB.BINOM(Numero successi; Prove; Probabilità succcesso; Cumulativo) Numero successi (y) è il numero dei successi in n prove. Prove è il numero delle prove (n). Probabilità successo è la probabilità di osservare un successo in una singola prova (π). Cumulativo = 0 calcola la probabilità associata all'evento Y=y, cumulativo = 1 quella associata all'evento Y y. Uso della funzione per il calcolo delle probabilità della distribuzione di Y = numero di mucche gravide su 3 mucche sottoposte a controllo sanitario Bin(n=3, π = 0,7) Valori possibili di Y Funzione Risultato della funzione 0 DISTRIB.BINOM(0; 3; 0,7; 0) 0,027 1 DISTRIB.BINOM(1; 3; 0,7; 0) 0,189 2 DISTRIB.BINOM(2; 3; 0,7; 0) 0,441 3 DISTRIB.BINOM(3; 3; 0,7; 0) 0,343 Uso della funzione per il calcolo della distribuzione di probabilità cumulata di Y Valori possibili di Y Funzione Risultato della funzione 0 DISTRIB.BINOM(0; 3; 0,7; 1) 0,027 1 DISTRIB.BINOM(1; 3; 0,7; 1) 0,216 2 DISTRIB.BINOM(2; 3; 0,7; 1) 0,657 3 DISTRIB.BINOM(3; 3; 0,7; 1) 1,000 10

n = 5, π = 0,50 n = 5, π = 0,90 n = 10, π = 0,50 n = 10, π = 0,90 n = 50, π = 0,50 n = 50, π = 0,90 11

La distribuzione di probabilità binomiale è molto utilizzata nell inferenza statistica per lo studio di proporzioni (es.: proporzione di animali di una popolazione affetti da una determinata patologia). Ulteriori esempi di distribuzioni di probabilità: a) colore del mantello di capi di bestiame b) dimensione della figliata dell orso lavatore 12

c) altezza al garrese (in cm) di un asino Caratteristiche di una funzione di densità di probabilità f(x) 1. Descrive la distribuzione di probabilità di una variabile casuale continua 2. L area complessiva al di sotto della funzione è pari a 1 3. P(x0 < X < x1) 13

4. P(X < x0) 5. P(X > x1) 14

La distribuzione normale o gaussiana - fondamentale nello sviluppo di molti metodi per l inferenza statistica - rappresenta un modello teorico che può fornire una buona approssimazione della distribuzione empirica di variabili osservate nell ambito dello studio di fenomeni naturali - è una variabile casuale CONTINUA - la sua distribuzione di probabilità dipende da due costanti caratteristiche (parametri): µ e σ X Ν(µ, σ) 1 x µ 2 σ 1 - f(x) = e 2 σ 2π Caratteristiche della f(x): unimodale simmetrica rispetto a x = µ la media aritmetica, la mediana e la moda di X sono uguali e pari a µ la varianza di X è pari a σ2 15

Esempi di distribuzioni gaussiane con particolari valori dei parametri σ2 = 1 µ=0 µ=1 µ=2 µ=0 σ2 = 0,5 σ2 = 1 σ2 = 2 16

- aree tipiche al di sotto della f(x): P(µ σ < X < µ + σ) = 0,6827 P(µ 1,96 σ < X < µ + 1,96 σ) = 0,95 P(µ 2,58 σ < X < µ + 2,58 σ) = 0,99 - Caso notevole: la normale standardizzata Z Ν(0, 1) - Standardizzazione: Z = X µ σ Ν(0, 1) 17

Esempio 1 X = tempo (in secondi) impiegato da un cavallo da corsa nelle gare da 6 furlong negli ippodromi della Louisiana: X Ν(µ = 75,2 s; σ = 2,2 s) P(X < 72,0) =? Appendice A, Tavola A1, pagina 248 18

19

Funzione Excel per il calcolo delle probabilità associate a intervalli di valori per una variabile casuale Z normale standard, del tipo (, z): DISTRIB.NORM.ST Sintassi DISTRIB.NORM.ST(Valore) Valore è un numero (z) che determina l'estremo superiore di un intervallo non limitato inferiormente, relativamente al quale si cerca il corrispondente valore di probabilità per una variabile casuale normale standard Z. Esempi =DISTRIB.NORM.ST(0) restituisce il risultato...??? =DISTRIB.NORM.ST( 1,96) restituisce il risultato...??? =DISTRIB.NORM.ST( 1,45) restituisce il risultato 0,0735 Funzione Excel per il calcolo delle probabilità associate a intervalli di valori per una variabile casuale X normale, del tipo (, x): DISTRIB.NORM Sintassi DISTRIB.NORM(valore; Media; Deviazione standard; Cumulativo) Valore è un numero (x) della distribuzione per il quale si desidera la distribuzione normale. Media è la media aritmetica di X. Deviazione standard è la deviazione standard di X. Cumulativo = 0 calcola il valore della funzione di densità di probabilità, cumulativo = 1 il valore della probabilità che X sia compresa nell'intervallo (, x). Esempi =DISTRIB.NORM(0; 0; 1; 1) restituisce il risultato...??? =DISTRIB.NORM(72; 75,2; 2,2; 1) restituisce il risultato 0,073 20

Esempio 2 Quale tempo dovrebbe essere realizzato da un cavallo da corsa in una gara per avere una probabilità pari al 5% di essere battuto? P(X<x0,05) = 0,05 dove x0,05 = 5 percentile della distribuzione di X Funzione Excel per il calcolo del valore z di una variabile casuale normale standard Z che delimita un intervallo di valori (, z) di probabilità prefissata pari a p: INV.NORM.ST Sintassi INV.NORM.ST(Probabilità) Probabilità è il valore p di probabilità prefissato a partire dal quale si cerca il valore di z. Esempi =INV.NORM.ST(0,5) restituisce il risultato...??? =INV.NORM.ST(0,0735) restituisce il risultato...??? =INV.NORM.ST(0,05) restituisce il risultato 1,6449 Funzione Excel per il calcolo del valore x di una variabile casuale normale X che delimita un intervallo di valori (, x) di probabilità prefissata pari a p: INV.NORM Sintassi INV.NORM(Probabilità; Media; Deviazione standard) Probabilità è il valore p di probabilità prefissato a partire dal quale si cerca il valore di x. Media è la media aritmetica di X. Deviazione standard è la deviazione standard di X. Esempio =INV.NORM(0,05;75,2;2,2) restituisce il risultato 71,58 21

Esempio 3 Entro quali estremi dovrebbe trovarsi il tempo di un cavallo da corsa per poter essere considerato un tempo nella norma (non troppo basso né troppo alto)? P(x0,025<X<x0,975) = 0,95 Equivalenza tra analisi descrittiva e calcolo delle probabilità variabile statistica variabile casuale distribuzione di frequenza empirica distribuzione di probabilità (teorica) Se vi è conformità tra la distribuzione di frequenza empirica di una variabile statistica X e la distribuzione di probabilità di una variabile casuale possiamo avvalerci delle proprietà teoriche di quest ultima per cogliere meglio le caratteristiche più importanti della distribuzione di X. metodi per valutare la conformità tra una distribuzione di frequenza empirica e la distribuzione normale 1) Metodo grafico # 1: basato sull istogramma di frequenza - soggettivo - non adeguato se n < 20 22

2) Metodo grafico # 2: basato sul normal plot - soggettivo 3) Metodi numerici basati sul calcolo di misure specifiche (test di normalità di Shapiro-Wilk e di Kolmogorov-Smirnov) Altre variabili casuali continue 1) Log-normale 2) t di Student 3) Chi quadrato 4) F di Fisher 1. La distribuzione log-normale X variabile con distribuzione asimmetrica a destra Y = log10x 23

Y Ν X lognormale Le proprietà descritte in precedenza possono essere utilizzate per studiare la distribuzione di Y = log10x. Esempio: X = soglia di risposta (in Newton) ad uno stimolo meccanico applicato ad un arto inferiore per 470 pecore x = 5,296 Newton Y = log10x sx = 2,420 Newton y = 0,6778 log Newton sy = 0,1927 log Newton Y = log10x Ν(µ,σ) P(µ 1,96 σ < Y < µ + 1,96 σ) = 0,95 Ci aspettiamo che il 95% dei valori di log10x sia compreso tra 0,3001 (= 0,6778 1,96 0,1927) e 1,0555 (= 0,6778 + 1,96 0,1927) log Newton ovvero, che il 95% dei valori di X sia compreso tra 1,996 (= 100,3001) e 11,363 (= 101,0555) Newton 24

2. La distribuzione t di Student dipende da una costante caratteristica: df detta gradi di libertà della distribuzione (numero intero maggiore di 0) è simmetrica rispetto al valore 0 è unimodale ha forma campanulare per valori bassi di df attribuisce ai valori più lontani da 0 una probabilità maggiore di quanto non avvenga con la normale standard per valori elevati di df tende a coincidere con la normale standard viene utilizzata nella definizione di test statistici per il controllo di ipotesi su una media o la differenza tra due medie X t(df) df = 1, df = 15 e gaussiana standardizzata 25

3. La distribuzione chi quadrato i valori possibili per tale variabile casuale sono i numeri reali positivi dipende da una costante caratteristica: df detta gradi di libertà della distribuzione (numero intero maggiore di 0) è asimmetrica a destra (asimmetria decrescente al crescere di df) per valori elevati di df tende a coincidere con la distribuzione normale viene utilizzata particolarmente nell analisi di dati qualitativi X χ2(df) df = 1, 5, 10, 15 26

4. La distribuzione F di Fisher è il risultato del rapporto tra due variabili casuali chi quadrato indipendenti. I valori possibili per tale variabile casuale sono i numeri reali positivi. dipende da due costanti caratteristiche: df1 e df2 detti gradi di libertà della distribuzione (numeri interi maggiori di 0) è asimmetrica a destra viene utilizzata nella definizione di test statistici per il controllo di ipotesi su due varianze (calcolate a partire da dati la cui distribuzione è normale) e per il confronto tra più medie (analisi della varianza) X F(df1, df2) df1 = 1, df2 =1 df1 = 3, df2 =5 df1 = 3, df2 =15 27

Relazione tra distribuzione binomiale e normale Se X Bin(n, π), dove np > 5 n(1 p) > 5 p = proporzione di successi in n prove (proporzione di mucche gravide su n mucche sottoposte a controllo medico) allora è possibile approssimare la distribuzione di probabilità di X con la normale N(µ, σ), stimando i parametri µ, σ con np e np(1 p). 28