Approfondimento 3.3 Approssimazione della distribuzione binomiale alla normale Come aveva notato de Moivre, se il numero di prove è sufficientemente ampio e la probabilità del successo π sufficientemente maggiore di zero anche se nessuno, poi, ha mai specificato cosa intende per numero di prove sufficientemente ampio (alcuni riferiscono maggiore di 5, altri di 10, altri ancora di 30 ) e probabilità di successo π sufficientemente maggiore di zero la distribuzione binomiale può essere approssimata alla normale. Solani (2008) suggerisce che questa operazione è possibile date le seguenti condizioni: Se π <,05 o π,95 e n 100 Se,05 π < o,90 π <,95 e n 50 Se π <,90 e n 20 mentre Borra e Di Ciaccio (2008) indicano che la numerosità può considerarsi adeguata quando n π 5 e n (1 π) 5. Vediamo come questo sia possibile nella Figura 3.3.1 Con n = 1 prove e p =, la distribuzione è rettangolare, poiché tutti gli esiti possibili hanno probabilità uguale a 0,5. Con n = 2 prove, invece, la distribuzione è triangolare, così come n = 3, ma più andiamo avanti e più la distribuzione comincia a prendere una forma a campana, e in effetti per n = 10 la forma assomiglia a quella della distribuzione normale n = 1, p = n = 2, p = -1 0 1 2 n = 3, p = -1 0 1 2 3 4-1 0 1 2 3 n = 4, p = -1 0 1 2 3 4 5 n = 5, p = n = 10, p =
-1 0 1 2 3 4 5 6 n = 20, p = -1 0 1 2 3 4 5 6 7 8 9 10 11 n = 30, p =,15,05-1 0 1 2 3 4 5 6Numero 7 8 9 10111213141516171819202122-1 0 1 2 3 4 5 6 7 8 Numero 9 1011121314151617181920212223242526272829303132 Figura 3.3.1 Approssimazioni successive della distribuzione binomiale alla normale per p = L approssimazione alla normale della distribuzione binomiale vale anche per probabilità di successo diverse da, e quindi distribuzioni binomiali asimmetriche. In questo caso, però, la distribuzione binomiale ha bisogno di un numero maggiore di prove per approssimarsi adeguatamente alla normale. La Figura 3.3.2 e 3.3.3 mostrano i casi di p =,33 e p = n = 1, p =,33 n = 2, p =,33,70 - -1 0 1 2-1 0 1 2 3 n = 3, p =,33 n = 4, p =,33
-1 0 1 2 3 4 n = 5, p =,33-1 0 1 2 3 4 5 6 n = 20, p =,33-1 0 1 2 3 4 5 n = 10, p =,33-1 0 1 2 3 4 5 6 7 8 9 10 11 n = 30, p =,33,15,05-1 0 1 2 3 4 5 6Numero 7 8 9 10111213141516171819202122-1 0 1 2 3 4 5 6 7 8 Numero 9 1011121314151617181920212223242526272829303132 Figura 3.3.2 Approssimazioni successive della distribuzione binomiale alla normale per p =,33 n = 1, p = n = 2, p = 1 1-1 0 1 2-1 0 1 2 3 n = 3, p = n = 4, p =
1-1 0 1 2 3 4 1 n = 5, p = -1 0 1 2 3 4 5 6 n = 20, p = 1-1 0 1 2 3 4 5 n = 10, p = -1 0 1 2 3 4 5 6 7 8 9 10 11 n = 30, p =,25-1 0 1 2 3 4 5 6Numero 7 8 9 10111213141516171819202122,15,05-1 0 1 2 3 4 5 6 7 8 Numero 9 1011121314151617181920212223242526272829303132 Figura 3.3.3 Approssimazioni successive della distribuzione binomiale alla normale per p = Supponiamo quindi che ci venga chiesto di determinare quale è la probabilità di ottenere, con una moneta onesta, un numero di teste compreso fra 233 e 260 su 500 lanci. Naturalmente potremmo 500 233 munirci di (molta) pazienza e metterci a calcolare tutti i vari (233) 233, 50 500 p =, 233 500 234 234 (234), 50 500 500 235 p =, 235, 50 500 p (235) =,, 234 235 500 2600 260 (260), 50 500 p =, e sommare tutti i risultati, ma comprendente bene che, a meno di 260 farlo fare al computer, è un impresa improba. Possiamo però sfruttare l approssimazione della normale alla binomiale, e considerare l intervallo 233-260 come un intervallo di classe i cui limiti reali siano 232,5 e 260,5. Questa operazione si chiama correzione di continuità, perché non dimenticate che stiamo approssimando ad una distribuzione continua una distribuzione che per sua natura è invece discreta. A questo punto dobbiamo trasformare in punti z i valori 233,5 e 260,5. La
distribuzione binomiale ha media µ = n p e deviazione standard σ = n p q = n p ( 1 p), per cui, visto che stiamo considerando il caso di n = 500 lanci, avremo che µ = 500 0 = 250 e σ = 500, 50 = 11,18. Per cui i punti z corrispondenti sono: 232,5 250 104 100 z 1 = = 1,56 z 2 = = 0, 94 11,18 15 A questo punto il procedimento è identico a quello già visto nel caso della distribuzione normale standardizzata. Dobbiamo calcolare la somma delle due aree della Figura 3.3.4 Figura 3.3.4 Area di probabilità compresa fra 233 e 260 successi Le aree si ricavano dalla tavola dei punti z (Figura 3.3.5): Figura 3.3.5 Valori di probabilità per punteggi z compresi fra la media e -1,56 e fra la media e 0,94
Poiché i due valori di area sono,4406 e,3264, la soluzione è: p(233 < successi < 260) p(-1,56 < z < 0,94) = p(-1,56 < z < 0) + p(0 < z < 0,94) =,4406 +,3264 =,7670 La probabilità di estrarre un punteggio ottenere un numero di teste compreso fra 233 e 260 con una moneta onesta è dunque del 76,70%. Se avessimo calcolato tutte le probabilità esatte con le formule viste nel paragrafo 2.1 di questo capitolo il risultato sarebbe stato 76,75%.