LEZIONE 12-2017 DISTRIBUZIONE NORMALE Distribuzione teorica di probabilità, detta anche Gaussiana Variabili continue Molte distribuzioni empiriche di fenomeno fisici e biologici, ma anche sociopsicologiche, hanno forma che tende alla "normale" Rilevanza sotto il profilo teorico: statistica induttiva basata in gran parte sulle proprietà della "normale" Distribuzioni di frequenza finite e infinite * distribuzioni empiriche di un numero N di casi/soggetti, con N più o meno elevato * teoricamente si può ragionare su N infinitamente grande * si passa da distribuzioni empiriche "frastagliate" (istogramma, spezzata) a curve lisce e continue 1
Forma e caratteristiche della distribuzione normale * continua * simmetrica * unimodale * media, mediana e moda coincidono * tipica forma a campana, nè leptocurtica nè platicurtica * si avvicina asintotticamente all'asse delle ascisse * due punti di flesso (da concava a convessa) *ascisse: tutti i valori di X, da - a + * l'area sottesa dall'intera curva è = 1 (è la somma di tutti le aree di un numero infinitamente grande di rettangoli) * I dati empirici riescono solo ad approssimarla 2
* è possibile calcolare la frequenza (o proporzione) di qualunque valore di X (ma questo è poco interessante) o di intervalli di valori di X Conoscendo media e deviazione standard è quindi possibile determinare l'area sottesa tra due ordinate corrispondenti a due valori qualsiasi di X Da quanto detto è facile intuire che si possono individuare alcuni valori tipici con particolare significato. Per esempio i seguenti valori delimitano rispettivamente l area che racchiude il 95% dei casi della distribuzione e il 99% : a) X 1. 96s 0.95 (95%) -1.96s +1.96s b) X 2. 58s 0.99 (99%) -2.58s +2.58s 3
*in realtà non si deve ogni volta fare il calcolo, perché i valori sono già calcolati e contenuti in tavole apposite. Ma ne dovrebbero esistere tante, una per ogni valore combinato di e. * per ovviare a questo inconveniente, si standardizza, cioè si trasforma la distribuzione normale in distribuzione normale standardizzata, cioè si passa dai punteggi X, ai punteggi z, con media=0 e deviazione standard = 1 * esiste allora una tabella che contiene tutti i valori delle aree per ogni valore di z, X X con z s USO DELLA TAVOLA della normale standardizzata Tavola A del libro di testo La tavola riporta l'area compresa tra z=0 e qualunque valore di z per la metà positiva (per valori negativi basta ricordare che è simmetrica) z 2 0 z 1 z 1 = 0.85 z 2 = -1.50 4
Applicazione 1: una distribuzione ha X = 50 e s = 10 a) trovare la proporzione di casi con punteggio nell'intervallo z 50 = (50-50)/10 = 0 z 65 = (65-50)/10 = 1.50 X = 50 e X = 65 0 1.50 Sulla tavola cerco in corrispondenza di z = 1.50 e trovo area =.4332 proporzione dei casi:.4332 percentuale: 43.32% 0 1.50 5
b) trovare la proporzione di casi con punteggio nell'intervallo X=50 e X= 30 z 50 = (50-50)/10 = 0 z 30 = (30-50)/10 = - 2-2 0 Sulla tavola cerco in corrispondenza di z = 2.00 e trovo area =.4772 proporzione:.4772 percentuale: 47.72% c) trovare proporzione compresa tra X=30 e X=65 z 30 = -2.00 e z 65 = 1.50-2 0 1.50 6
d) trovare proporzione compresa fra X=65 e X=55 z 65 = 1.50 e z 55 = (55-50)/10 =.50 0.50 1.50 7
Applicazione 2: campione di N = 3500 soggetti Variabile X = dogmatismo, X = 52 s = 12 1) quanti soggetti hanno un punteggio compreso fra 29 e 46? Z Z 1 2 29 52 12 46 52 12 1.92.50 proporzione da 0 a 1.92.4726 proporzione da 0 a.50.1915-1.92 -.50 0 proporzione tra -1.92 e -.50.4726 -.1915 =.2811 n = N x.2811 = 3500 x.2811 = 983.85 984 soggetti 8
2) trovare il punteggio X che delimita la "coda" del 10% dei soggetti migliori 0 z.5000 -.1000 =.4000 è l area compresa fra z = 0 e il valore incognito z che la delimita. Devo trovare questo valore di z. Si tratta del problema inverso: conoscendo l area, trovare z (e poi X). Sulle tavole si cerca nella colonna delle proporzioni (aree) quella che si avvicina di più a.4000 0 z Si trova.3997 (più vicino a.4000 di quanto sia.4015) Si individua il valore z corrispondente (z=1.28) Si applica la formula inversa per trovare X conoscendo z: X X Z S 52 1.28 12 67.36 Il punteggio limite per rientrare tra i 35 migliori (10%) è X = 67.36 9
3) trovare il valore X che corrisponde al Q1 Q 1 0 Il I quartile delimita un'area nella prima metà della curva, con.2500 al di sotto e.2500 al di sopra (.7500 al di sopra se si considera l intera curva). Si cerca nella Tavola A, nella colonna delle aree, la proporzione.2500 e si trova.2486 (più vicino di.2518) cui corrisponde z =.67. Poichè siamo nella metà inferiore della curva, z è negativo z = -.67 X = 52 + (-.67) x 12 = 43.96 Allora Q1 = 43.96 ~ 44 ESERCIZI 12 12.1) Considerando la distribuzione normale standardizzata e utilizzando le apposite tavole a1) trovare la proporzione di area a destra di z =.58 a2) trovare la proporzione di area a sinistra di z =.58 a3) trovare z che lascia alla sua destra il 25% dell area a4) trovare la proporzione di area compresa tra z 1 = -.40 e z 2 = 1.35 a5) trovare la proporzione di area compresa tra z 1 =.65 e z 2 = 2.00 12.2) Sapendo che la distribuzione dei punteggi di ansia (X) di un gruppo di 120 impiegati statali ha forma normale, con media = 21 e varianza = 4 b1) trovare la proporzione di soggetti con X compreso tra la media e 24 b2) calcolarne anche la percentuale e il numero assoluto di soggetti b3) trovare la proporzione di soggetti con X compreso tra la media e 18 b4) calcolarne anche la percentuale e il numero assoluto di soggetti 10
b5) trovare la percentuale di soggetti con punteggio compreso tra19 e 22 b6) trovare la percentuale di soggetti con punteggio compreso tra 22 e 25 b7) trovare la proporzione di soggetti con punteggio compreso tra 16 e 18 b8) calcolare il punteggio X di un soggetto che ha z = -1.02 b9) calcolare i due punteggi X che delimitano le code inferiore e superiore della distribuzione con il 25% dei soggetti ciascuna 12.3) In una prova per la valutazione dell Abilità Manuale (punteggio X, da 1 = scarsa a 6 = alta, distribuzione normale), un gruppo di 164 apprendisti ha ottenuto i seguenti risultati: media = 3,5 varianza = 1,69 c1) trovare la proporzione di soggetti che ha un punteggio compreso tra X 1 = 4.8 e X 2 = 5.6 c2) trovare il punteggio minimo che un soggetto deve ottenere per essere incluso tra il 30% dei migliori c3) utilizzando la tavola A, calcolare il primo quartile, il terzo quartile e la mediana c4) trasformare in punto T il punteggio X = 2 11