Probabilità. Esperimento, risultati e spazio campionario

Probabilità La probabilità è usata nel linguaggio comune per dare indicazioni quantitative sul verificarsi di certi eventi: i) probabilità di incorre in un data patologia causa l abuso di alcol, fumo, ecc., ii) probabilità di avere un periodo di alta pressione (bel tempo) nel periodo in cui si terranno le olimpiadi; iii) la probabilità di superare o meno un esame in funzione delle preparazione. La probabilità misura la verosimiglianza (likelhood) con la quale può verificarsi un determinato evento ed è la base della statistica inferenziale. La statistica inferenziale permette di prendere decisioni in presenza di incertezze: la teoria della probabilità è utilizzata per valutare le incertezze che condizionano la decisione. La probabilità e le distribuzioni probabilistiche combinata alla statistica descrittiva consente di prendere decisioni relative ad una popolazione a partire dalle informazioni ottenute dal campione. Esperimento, risultati e spazio campionario I controlli di qualità industriali su una apparecchiatura, oggetto, prodotti in serie sono un esempio di esperimento. Il risultato dell esperimento difettoso o corretto sono i risultati dell esperimento, l insieme dei risultati dell esperimento e detto spazio campionario. Lo spazio campionario e indicato con S, e lo spazio campionario dei controlli di qualità è S = {corretto, difettoso} Gli esempi illustrano il significato di esperimento, risultati e spazio campionario: Lo spazio campionario può essere rappresentato graficamente tramite un diagramma di Veen o un diagramma ad albero. - Diagramma di Veen: descrizione figurativa in cui sono indicati tutti i possibili risultai di un esperimento. - Diagramma ad albero: rappresentazione ad albero nella quale ciascun evento è indicato con un ramo. Cap.4 Pagina 1 di 12

Esempio 4-1. Lancio di una moneta. Un solo lancio. Esempio 4-2. Lancio di una moneta. Due lanci. Eventi semplici e composti Per evento si intende uno o più risultati di un esperimento scelti contemporaneamente. Evento semplice. Ciascuno dei possibili risultati di un esperimento Esempio 4-4. Soci maschi e femmine di una associazione salutista. Scelta di una coppia di soci. I risultati dell esperimento rappresentano altrettanti eventi semplici indicati con E 1, E 2, E 3 e E 4. Cap.4 Pagina 2 di 12

Evento composto. Uno o più risultati del medesimo esperimento. Gli eventi composti sono indicati con A, B, C, Esempio 4-5. Nell esempio 4-4 consideriamo A l evento composto rappresentato dai risultati dell estrazione dove è presente un uomo. Esempio 4-6. Favorevoli (F) o contrari (A) alla manipolazione genetica. Scegliamo casualmente due persone: l esperimento ha quattro risultati possibili, e precisamente: Gli eventi FF, FA, AF, AA presi singolarmente sono eventi semplici; l evento composto A corrispondente al risultato dell estrazione al più una persona è contro la manipolazione genetica è A = {FF, AF, FA} Indicare l evento composto B corrispondente al risultato dell estrazione al meno una persona è contro la manipolazione genetica. Esercizio 1. Due studenti sono estratti a caso in una classe per verificare se sono predisposti (P) o non predisposti (N) alla matematica. Indicare lo spazio campionario dell esperimento ed i relativi diagrammi di Veen ed albero. Indicare gli eventi semplici a gli eventi composti: A={almeno un studente P}; B = {al più uno studente P}. Cap.4 Pagina 3 di 12

Calcolo della Probabilità di un Evento La probabilità è una misura della verosimiglianza con cui può verificarsi un dato evento ed è indicata con P ; con P(E i ) si indica la probabilità dell evento semplice E i ; e con P(A) la probabilità dell evento composto A. Proprietà della probabilità 1. La probabilità di un evento è un valore compreso fra 0 ed 1. a. Un evento impossibile ha probabilità 0 b. Un evento certo ha probabilità 1 2. La somma delle probabilità di tutti gli eventi semplici di un esperimento, ΣP(E i ), è sempre 1. La proprietà 2 per l esperimento del lancio di una moneta, di due monete e per il risultato delle partite di calcio fornisce i seguenti risultati: - P(H) + P(T) = 1 - P(HH) + P(HT) + P(TH) + P(TT) = 1 - P(vinta) + P(persa) + P(pareggiata) = 1 Definizione di Probabilità La probabilità può essere calcolata in modo diverso a seconda dell approccio concettuale utilizzato: esistono tre approcci concettuali al calcolo della probabilità: (1) probabilità classica, (2) la probabilità come frequenza relativa; (3) la probabilità soggettiva. Probabilità Classica La definizione classica di probabilità è utilizzata per calcolare la probabilità degli eventi di un esperimento i cui risultati sono equamente probabili. La probabilità classica è definita per un evento semplice e composto nel modo seguente. Per un evento semplice è uguale a 1 diviso il numero totale dei risultati dell esperimento; per un evento Cap.4 Pagina 4 di 12

composto A è uguale al numero di risultati favorevoli ad A diviso il numero totale dei risultati dell esperimento. Importante. Si dimostri che la regola della probabilità classica per eventi semplici e composti verifica le proprietà del calcolo delle probabilità. Esempi di calcolo della probabilità con la regola classica. - Lancio di una moneta bilanciata (fair). Soli risultati possibili gli eventi di S = {H,T}, quindi - Numeri pari nel lancio di un dado a 6 facce. Lo spazio campionario è S = {1,2,3,4,5,6}; l evento composto dato dall uscita di un numero pari è A = {2,4,6}. Nel gergo probabilistico si dice che è avvenuto l evento A se e solo se esce uno di questi tre numeri, e pertanto - Un associazione con 100 iscritti dei quali 40 sono donne e 60 uomini. Si vuole eleggere il presidente per estrazione casuale. Quale è la probabilità che sia eletta una donna? Probabilità come Frequenza relativa Supponiamo di voler calcolare 1. La probabilità che la prossima automobile prodotta sia di colore bianco, verde acido, 2. La probabilità che scelta a caso una famiglia questa possieda 1, 2, ecc., automobili 3. La probabilità che il prossimo neonato sia di sesso femminile 4. La probabilità che un anziano 80-enne sopravviva un altro anno 5. La probabilità che nel lancio di una moneta truccata esca Testa 6. La probabilità di vedere il numero 1 uscire nel lancio di un dado truccato. Gli eventi degli esperimenti 1-6 non sono equiprobabili e quindi non è possibile usare la regola classica. Tuttavia è possibile ripetere ciascun esperimento un numero molto grande di volte o lo si è fatto in precedenza ed utilizzare la frequenza relativa di ciascun risultato come approssimazione della probabilità del risultato stesso. Cap.4 Pagina 5 di 12

Il metodo di calcolo della probabilità basato sulla stima della frequenza relativa può portare a valori diversi della medesima stima della probabilità se questa è calcolata in esperimenti successivi. Ad esempio due stock di auto di 500 unità mandate in produzione in tempi successivi possono avere un numero di auto richieste essere di colore bianco diverso (nel gergo statistico si dice che il numero atteso di auto di colore bianco è diverso). Tuttavia la differenza nella percentuale di auto di un dato colore diventa più piccola all aumentare delle dimensioni del campione. Importante. Se si analizza una popolazione la frequenza relativa di un dato risultato corrisponde al valore esatto della probabilità. Esempio 4-10. In un campione di 500 auto avviate alla produzione 10 di queste sono state ordinate con colore verde acido. Nell ipotesi che gli ordini dalle concessionarie arrivino a caso si vuole calcolare la frequenza relativa del colore verde acido. Poiché il numero totale delle auto nello stock è n=500 e f=10 è la frequenza del colore verde acido; usando la frequenza relativa come stima della probabilità si ottiene: P 10 = 500 ( verde acido) = 0. 02 L esperimento dove gli eventi sono le categorie indicate nello spazio campionario ha la seguente tabella delle frequenze = n f S = {verde acido, altri colori} colore frequenza frequenza relativa Verde acido 10 10/500 = 0.02 Altri colori 490 490/500 = 0.98 Dalla regola della frequenza relativa il valore della probabilità per ciascun evento è P(verde acido) = 0.02 P(altri colori) = 0.98 Importante. Le frequenze realtive non corrispondono ai valori esatti delle probabilità ma sono valori approssimati. Tuttavia se l esperimento viene ripetuto in successione un numero sempre maggiore di volte la frequenza relativa approssima il valore vero della probabilità di ciascun risultato. Questa condizione limite prende nome di legge dei grandi numeri. Esempio 4-11. Determinare la probabilità che scelta a caso una famiglia della città di Roma questa possieda la casa in cui abità. L esperimanto ha due possibili risultati: S = {E 1, E 2 } = {possiede la casa, non possiede la casa} Cap.4 Pagina 6 di 12

Si prende un campione n=1000 famiglie e si calcola la frequenza f delle famiglie che abitano la casa di proprietà. Nell ipotesi che f = 670 la P(E 1 ) è pari a P 670 1000 ( E ) = 0. 670 = n f 1 = Se l esperimento viene ripetuto più volte il valore della P(E 1 ) ottenuto dalla frequenza relativa dei diversi esperimenti è leggermente diverso, tuttavia poiché il campione e di grandi dimensioni le variazioni attese per ciascun esperimento sono molto piccole (grandinumeri.xls). Valutazione soggettiva della Probabilità A volte l esperimento non ha eventi equiprobabili e non può essere ripetuto molte volte per generare i valori necessari per una stima della frequenza relativa. 1. La probabilità che Luigi che sta studiando statistica supererà l esame con 30+Lode. 2. La probabilità che l indice delle contrattazioni in Borsa oggi avrà un andamento positivo rispetto ai giorni precedenti. 3. La probabilità che l Internazionale vinca il campionato 2002/2003. 4. La probabilità che l orario di lavoro del pubblico impiego stabilito per contratto aumenti. In ciascuno di questi casi è possibile assegnare una probabilità soggettiva, basata sull esperienza, sulle informazioni in nostro possesso o sul nostro convincimento personale. Se esaminiamo la prima domanda è chiaro che la probabilità che l esito dell esame si 30 e Lode non è la medesima dei restanti punteggi, ed è chiaro anche che date le nostre previsioni di voto Luigi otterrà un punteggio molto alto e che quasi sicuramente accetterà il voto. Non è quindi possibile utilizzare la regola classica e la frequenza relativa per il calcolo delle probabilità. Tuttavia, possiamo ugualmente ritenere che Luigi abbia un elevata probabilità di prendere la Lode poiché ha una buona predisposizione per la materia; è un perfezionista (secchione), il professore ha sempre dimostrato una buona predisposizione del verso coloro che dimostrano interesse per la disciplina. Non è però da escludere che in quella occasione Luigi abbia una amnesia che ne comprometta l esame. Importante. La probabilità soggettiva è assegnata arbitrariamente. Per questa ragione è soggetta ad errori ed è influenzata dalla esperienza della persona che assegna la probabiltà. Metodi di conteggio Esperimenti con un numero grande di eventi necessitano di metodi per individuare il numero di risultati possibili. Tali metodi vengono indicati anche come regole di conteggio. Metodi di conteggio. Dato un esperimento suddiviso in tre fasi distinte rispettivamente con k, m ed n risultati possibili No. Totale di risultati dell esperimento = k x m x n Cap.4 Pagina 7 di 12

Le regole di conteggio possono essere estese facilmente ad eseprimanti con un numero di fasi distinte maggiore di tre. Esempio 4-12. Lancio triplo di una moneta. Ciascun lancio è una fase con due risultai possibili pertanto No. Totale di risultati = 2 x 2 x 2 = 2 2 = 8 Esempio 4-13. Una persona intenzionata a comprare un automobile può scegliere fra forme di finanziamento con interesse a tasso fisso oppure variabile e durata pari a 36, 48 e 60 mensilità. Quanti possibili risultati ha questo esperimento? No. Totale di risultati = 2 x 3 = 6 Esempio 4-14. Il campionato di calcio Italiano a 18 squadre prevede un totale di 34 partite. Ciascuna partita ha 3 possibili risultati: partita vinta, persa, pareggiata. Il totale di possibili risultati si calcola dalla formula No. Totale di risultati = 3 34 = 1.67 x 10 16 Probabilità marginale e condizionale Una indagine statistica eseguita su 200 lavoratori del pubblico impiego è stato chiesto se sono favorevoli o contrari ad un aumento dell orario di lavoro settimanale da 36 a 38 ore lavorative; le due ore aggiuntive saranno recuperate come, permessi, ferie, ecc. I risultati dell indagine sono riportati nella Tab. 4-3 che prende nome di tabella di classificazione a due vie. Tabella 4.3. Tabella di classificazione a due vie delle risposte degli intervistati Favorevoli Contrari Uomini 75 23 Donne 52 50 Nella tabella 4-3 le risposte date dagli intervistati sono divise in variabili o caratteristiche: sesso di appartenenza (uomo o donna) e opinione (favorevole o contrario). La tabella 4-3 si chiama tabella di contingenza a due vie e ciascuna suddivisione nella quale sono inseriti i dati è indicata come cella. La tabella è composta di 4 celle, e ciascuna cella da la frequenza di ciascuna delle due caratteristiche; ad ex. 50 soggetti intervistati sono la frequenza di entrambe le caratteristiche donna e contrario. Tabella 4.3. Tabella di classificazione a due vie delle risposte degli intervistati con totali. Favorevole Contrario Totali Uomini 75 23 98 Donne 52 50 102 Totali 127 73 200 Supponiamo di scegliere un soggetto a caso fra i 200 intervistati, il risultato dell esperimento può essere classificato a seconda della caratteristica sesso (uomo o donna), oppure opinione (favorevole o contrario). La probabilità associata a ciascuna variabile della tabella a due vie è detta probabilità marginale o probabilità semplice. Le quattro probabilità marginali risultanti dalla Tabella 4.4 sono Cap.4 Pagina 8 di 12

P(uomini) = No. uomini/ No. intervistati = 98/200 = 0.49 P(donne) = No. donne/ No. intervistati = 102/200 = 0.51 P(favorevole) = No. favorevoli/ No. intervistati = 127/200 = 0.64 P(contrario) = No. contrari/ No. intervistati = 63/200 = 0.37 Supponiamo ora di scegliere a caso uno dei duecento soggetti e di sapere che il soggetto è un uomo in altre parole abbiamo già eseguito l esperimento e verificato che la variabile sesso ha dato quale risultato uomini quale è la probabilità che il soggetto sia favorevole all aumento dell orario di lavoro settimanale. La probabilità che l impiegato sia favorevole se maschio si indica con ed è chiamata probabilità condizionale. P(favorevole maschio) Esempio 4-15. Calcoliamo la P(favorevole maschio) dalla tabella 4-4. Poiché il numero degli intervistati uomini è 98 e di questi 75 sono favorevoli la probabilità condizionale analogamente P (favorevole uomo) = No. uomini a favore / No. uomini = 75 / 98 = 0.77 P (contrario uomo) = No. uomini contrari / No. uomini = 23 / 98 = 0.23 Con un calcolo analogo possono essere calcolate le probabilità condizionate P (favorevole donna) = No. donne a favore / No. donne = 52 / 102 = 0.51 P (contrario donna) = No. donne contrarie / No. donne = 50 / 102 = 0.49 Si osservi che nel calcolo della probabilità condizionale l evento già verificatosi (uomo) è sempre al denominatore della definizione empirica di probabilità, mentre l evento di cui si vuole calcolare la probabilità sotto condizione è al numeratore. La probabilità condizionale di ciascuna variabile favorevole/contrario data la variabile uomo/donna può essere calcolata tramite un diagramma ad albero Evento già verificatosi: uomo 98/200 Favorevoli: 75/98 Contrari: 23/98 Favorevoli: 52/102 Evento già verificatosi: donna 102/200 Contrari: 50/102 Esempio 4-16. Dai valori di tabella 4.4 calcolare le seguenti probabilità condizionate P(donna favorevole) P(maschio contrario) Cap.4 Pagina 9 di 12

Esercizio. A 100 dipendenti di una azienda è stato chiesto se sono favorevoli o contrari alla trasformazione del TFR in una forma di pensione integrativa. Le risposte sono riportate nella tabella che segue Tab.4-4 Tabella di classificazione a due vie delle risposte dei dipendenti Favorevoli Contrari Uomini 15 45 Donne 4 36 Calcolare i valori della probabilità marginale per ciascuna variabile della tabella di contingenza, e i valori della probabilità condizionata P(contrario donna) e P(uomo favorevole). Eventi mutuamente esclusivi Eventi che non possono verificarsi simultaneamente sono detti mutuamente esclusivi. 1. Due eventi A e B sono mutuamente esclusivi se non hanno alcun risultato in comune. 2. Se A e B sono mutuamente esclusivi il risultato dell esperimento è A oppure B. 3. Dati A e B mutuamente esclusivi il verificarsi di A esclude il verificarsi di B. Esempio 4-17. Gli eventi che seguono derivano dal lancio di un dado a 6 facce: A = {2, 4, 6} = {no. pari}; B = {1, 3, 5}={no. dispari} C = {1, 2, 3, 4} = {no. minore di 5}, si vuole controllare se A e B e A e C sono mutuamente esclusivi. La condizione di eventi mutuamente escussivi o non esclusivi può essere facilmente verificata applicando le regole 1-3, dalle quale risulta che A e B sono mutuamente esclusivi perché non hanno nessun risultato in comune, uno dei due eventi appare sempre, e il verificarsi di A esclude il verificarsi di B. A e C sono mutuamente non esclusivi perché hanno risultati in comune (2,4), uno di questi due valori comporta il contemporaneo verificarsi di A e di C. Eventi indipendenti Due eventi A e B sono detti indipendenti se il verificarsi di uno dei due eventi non condiziona in alcun modo la probabilità con cui si può verificare il secondo evento. In altre parole A e B sono eventi indipendenti se si verifica contemporaneamente che P(A B) = P(A) e P(B A) = P(B) Se il verificarsi di un evento, ad esempio A, condiziona la probabilità del verificarsi di B i due eventi sono detti dipendenti. In notazione probabilistica due eventi sono detti dipendenti se si verificano le condizioni P(A B) P(A) e P(B A) P(B). Esempio 4-19. Con riferimento ai valori della tabella 4.4 relativi al parere sull utilizzo del TFR dato da 100 impiegati, calcolare se gli eventi donna (F) e favorevole (A) sono indipendenti. Applicando la definizione se viene verificata l eguaglianza P(F) = P(F A) gli eventi sono indipendenti, viceversa se l eguaglianza non è verificata gli eventi non sono indipendenti. Poiché P( F ) = 40/100 = 0.40 e P( F A) = 4/19 =0.21 i due eventi sono dipendenti. Verificare la dipendenza degli eventi A ed F calcolando P(A F) e P(A). Esempio 4-20. Il controllo di qualità eseguito su 100 CD estratti da una scatola ha indicato che 15 di questi sono difettosi. Dei 100 CD contenuti nella scatola 60 sono stati costruiti dalla macchina A e 9 di questi 60 sono difettosi. Indichiamo con D l evento CD difettoso sui 100 nella scatola, e Cap.4 Pagina 10 di 12

con A l evento che il CD difettoso estratto dalla scatola sia prodotto dalla macchina A, vogliamo verificare che gli eventi D ed A sono indipendenti. Poiché dai valori a disposizione è verificato che cioè gli eventi sono indipendenti. P(D)=15/100 = 0.15 e P(D A) = 9/60 = 0.15 P(D) = P(D A) La condizione D ed A eventi indipendenti può essere resa più chiara dalla tabella di contingenza a due vie con i totali di ciascuna variabile (macchina A e B) e (Difettoso, Buono). Tabella 4.6. Tabella di classificazione a due vie controllo di qualità. Difettoso (D) Buono (G) Totali Macchina (A) 9 51 60 Macchina (B) 6 34 40 Totali 15 75 100 Il valore P(D) è la probabilità marginale di uno dei valori della variabile controllo di qualità, e pertanto si calcola come semplice rapporto P(D) = No. Difettosi / No totale CD = 15/100 A sua volta il valore P(A D) è la probabilità condizionale che esca l evento A dato D e pertanto P(A D) = No. Difettosi prodotti da A / No totale prodotti da A = 9/60 Importante. Alcune osservazioni relative agli eventi mutuamente escussivi, indipendenti e dipendenti sono importanti. 1. Due eventi A e B possono essere fra loro mutuamente esclusivi o indipendenti a. Eventi mutuamente esclusivi sono sempre dipendenti b. Eventi indipendenti non sono mai mutuamente escussivi 2. Eventi dipendenti possono essere o non essere mutuamente esclusivi Eventi complementari Due eventi mutuamente esclusivi che rappresentano tutti i possibili risultati di un esperimento sono detti eventi complementari. Due eventi complementari sono sempre mutuamente esclusivi. Eventi complementari. L evento complementare all evento A si indica con A e include tutti i possibili risultati dell esperimento non inclusi in A. poiché due eventi complementari includono tutti i possibili risultati di un esperimento la somma delle loro rispettive probabilità è uguale a 1 P ( A) + P( A ) = 1 e di conseguenza P( A) = 1 P( A), P( A) =1 P( A) tutte le precedenti definizioni sono illustrati da seguente diagramma di Veen. Cap.4 Pagina 11 di 12

Esempio 4-21. In un gruppo di 5000 700 di questi hanno fatto un ricorso al Tribunale S A A Amministrativo per irregolarità commesse dall ufficio Tributi nell anno 1999. Vogliamo calcolare la probabilità che presa a caso un contribuente questo abbia ricorso al giudice (A) o non abbia fatto ricorso (A). P(A) = 4300/5000 = 0.86 P(A) = 700/5000 = 0.14 P(A) + P(A) = 0.14 + 0.86 = 1.00 Fig. 4.11 Diagramma di per due eventi complementari. Esempio 4-22. Preso un campione di 5000 lavoratori dipendenti ai quali è stato sottoposto un questionario, 1500 di questi hanno espresso parere favorevole alla introduzione della previdenza privata gestita dalle aziende a dai rappresentanti dei lavoratori. Indicando con A i contrari e con A i favorevoli calcolare i valori di P(A) e P(A). Verificare la condizione di complementarietà. Cap.4 Pagina 12 di 12