Variabili Casuali Continue e Distribuzione Normale

Variabili Casuali Continue e Distribuzione Normale Nel Capitolo 5 si è definita variabile casuale continua una variabile casuale che può assumere tutti valori compresi fra gli estremi di un intervallo senza soluzione di continuità. Essendo i valori numerici racchiusi nell intervallo infiniti la variabile casuale continua ha un numero infinito e non numerabile di valori. Esempi di variabile casuale continua sono il tempo impiegato dai pendolari nel percorso casa-lavoro compreso nell intervallo 15-90 minuti, la vita media di una batteria compresa fra le 0 e 400 ore di lavoro, l altezza di una persona, il quantitativo di latte in un confezione di peso dichiarato di un litro, il danaro guadagnato in un anno da una azienda, ecc. La variabile casuale continua è indicata con la lettera x e può assumere in modo continuo tutti i valori compresi nell intervallo x [x min, x max ] 1. Distribuzione di Probabilità continua Supponiamo che le ragazze iscritte all università siano esattamente 5000 e indichiamo con x la variabile continua che indica la loro altezza in pollici. L altezza della ragazze è descritta nella Tabella 6.1 come distribuzione della frequenza relativa di x. Poiché i dati raggruppati indicati da x rappresentano la popolazione universitaria femminile la distribuzione della frequenza relativa è anche la distribuzione di probabilità di x. Le figure 6.1 e 6.2 riportano l istogramma e la poligonale della distribuzione di probabilità di x, e la curva continua di Fig. 6.2 sono una approssimazione della curva di distribuzione di probabilità della variabile continua x. Si osservi che i dati di Tabella 6.1 sono suddivisi in classi di larghezza pari ad 1 pollice, se la larghezza di ciascuna classe fosse di ampiezza diversa dal valore 1 per ottenere la curva di distribuzione della probabilità della variabile casuale continua x dovremmo prima calcolare la densità della frequenza relativa e 1 Si osservi che la variabile casuale discreta è indicata con il simbolo x ={x j ; j=1,2,, n} perché essendo numerabile con l indice j si indica la successione di valori che questa può assumere. Cap.6 Pagina 1 di 21

da questa la distribuzione di probabilità. La densità della frequenza relativa di ciascuna classe si ottiene dividendo la frequenza relativa di ciascuna classe per l ampiezza della classe e si calcola per ottenere che la somma delle aree di tutti i rettangoli dell istogramma sia uguale a 1. La distribuzione di probabilità di una variabile casuale x continua deve soddisfare le seguenti caratteristiche: 1. La probabilità che x assuma un valore compreso nell intervallo [x=a, x=b] è un valore compreso fra 0 ed 1. 2. La probabilità che la variabile x assuma uno dei possibili valori compresi fra tutti gli intervalli fra loro mutuamente esclusivi individuabili in [x min, x max ] è uguale a 1. Le caratteristiche possono essere rappresentate graficamente nel modo seguente: 1) l area racchiusa nell intervallo [a, b]; 2) l area totale al di sotto della distribuzione di probabilità è uguale a 1. La caratteristica 1) indica che la probabilità che la variabile casuale continua x sia contenuta nell intervallo [a, b] è pari all area al di sotto della curva delimitata dagli estremi a e b. Ad esempio nell esempio della distribuzione di probabilità delle altezze della popolazione universitaria femminile la probabilità che presa a caso una ragazza questa abbia una altezza compresa fra x = 65 e x = 68 pollici, è pari all area ombreggiata di Fig. 6.6 ed è indicata con l espressione P(65 x 68) Con la quale si asserisce che x è maggiore o uguale di 65 e al contempo minore o uguale di 68. Importante. Per una variabile casuale continua la probabilità è sempre calcolata a partire da un intervallo delimitato della distribuzione di probabilità. La probabilità che una variabile casuale continua assuma un singolo valore è sempre uguale a zero. Questo si verifica poiché non è possibile calcolare l area al di sotto di una curva delimitata da un intervallo in cui estremi sono uguali. Ad esempio la probabilità che l altezza di una ragazza presa a caso dalla popolazione di studentesse sia esattamente x = 67 è uguale a zero, cioè P(x = 67) = 0 Cap.6 Pagina 2 di 21

Questa condizione ha implicazioni più generali. Infatti, se a e b sono due valori possibili della variabile x valgono le definizioni di probabilità P(x = a) = 0 e P(x = b) = 0 E da queste si ricava che per una variabile causale continua vale l identità P(a x b) = P(a < x< b) I due valori di probabilità P(x = 67) = 0 e P(65 x 68) = P(65 < x< 68) calcolati per la distribuzione delle altezze delle studentesse universitarie sono esplicitati in Fig. 6.7 e Fig. 6.8. Esempio di distribuzione di probabilità continua. Distribuzione del tempo in minuti impiegato dagli atleti che hanno portato a termine la gara di corsa tenutasi nel novembre 1998 a Manchester. La frequenza densità della corsa si svolge su un percorso di 4,768 Miglia pari a Classe frequenza relativa frequenza relativa t (min) f f/n D = f/(n* t) circa 7,6 Km e fra tutti i partecipanti, 8821 atleti hanno terminato la gara (corsa.xls). 20-25 37 0.0042 0.00084 25-30 261 0.0296 0.00592 30-35 641 0.0727 0.01453 35-40 1011 0.1146 0.02292 40-45 1489 0.1688 0.03376 45-50 1841 0.2087 0.04174 50-55 1502 0.1703 0.03406 55-60 811 0.0919 0.01839 60-65 349 0.0396 0.00791 65-70 234 0.0265 0.00531 70-75 186 0.0211 0.00422 75-80 175 0.0198 0.00397 80-85 134 0.0152 0.00304 85-90 100 0.0113 0.00227 90-95 33 0.0037 0.00075 95-100 17 0.0019 0.00039 Σ 8821 1.0000 0.20000 Il tempo impiegato a raggiungere il traguardo è una variabile aleatoria x continua la cui frequenza e frequenza relativa sono riportate nella tabella a fianco. Per comodità di rappresentazione i tempi sono stati raggruppati in classi di ampiezza pari a 5 minuti. Si osservi che gli atleti che hanno portato a termine la gara rappresentano una popolazione; tuttavia, poiché le classi in cui sono stati raggruppati i valori hanno ampiezza diversa da 1, l area contenuta entro le barre dell istogramma della distribuzione delle frequenze relative non è una probabilità 2. La distribuzione di probabilità, dei tempi degli atleti che hanno portato a termine la gara, come area dell istogramma si ottiene dalla densità della frequenza relativa D=f/(N/ t); infatti, la somma della 2 L area delimitata da tutte le classi dell istogramma è data dalla somma delle are di ciascuna classe (ampiezza *frequenza relativa) è poiché la ampiezza è maggiore di 1 l area risultante è anch essa maggiore di 1 e non può essere una probabilità. Cap.6 Pagina 3 di 21

densità D di ciascuna classe di Figura 6.10 moltiplicata per ampiezza t è uguale ad 1, e verifica la proprietà 2 f D t = t = 1 N t Preso un atleta a caso fra coloro che hanno portato a temine la corsa, la probabilità che il tempo da esso impiegato sia compreso fra due classi diverse dalla classe iniziale e finale è una valore compreso fra zero ed 1; ad es. prese le classi 35 40 e 50 55 la per la proprietà 1 P(35< x <55) = 0.14701 14% La figura 6.10 riporta l istogramma della densità delle frequenze relative e la curva di distribuzione della probabilità dei tempi degli atleti che hanno portato a termine la corsa. densità della frequenza relativa 0.05 0.04 0.03 0.02 0.01 0.00 20 30 40 50 60 70 80 90 100 tempo (minuti) Figura 6.10. Curva di distribuzione di probabilità dei tempi registrati a fine corsa Esercizi aggiuntivi. (A) Nel campionato di Base-Ball 1998 Mark McGuire ha vinto il trofeo quale miglior battitore realizzando 70 fuori campo (home-run). La tabella a fianco riporta la frequenza dei fuori campo misurati in piedi (feet) raggruppati per classi di 30fts. Si calcoli al distribuzione delle frequenze relative e della probabilità dei 70 lanci fuori campo. a. Dalla distribuzione delle probabilità calcolare la probabilità che preso a caso un home-run questo sia: i) ad una distanze minore di 410fts; ii) maggiore di 470fts; iii) compreso fra 410 e 470fts. Classi Frequenza 320-350 2 350-380 13 380-410 14 410-440 19 440-470 9 470-500 8 500-530 4 530-560 1 b. Calcolare la media e la varianza della popolazione utilizzando la formula per il calcolo della media e della varianza per dati raggruppati introdotte nel Capitolo 3. Verificare la correttezza dei risultati ottenuti con i valori calcolati direttamente dai raw data raccolti nel file fuoricampo.xls. (B) A partire dai raw-data contenuti nel file Excel calcolare la distribuzione delle probabilità dei fuori campo realizzati da Mark McGuire e Gimmy Sosa, I e II miglior battitore del campionato 1998, utilizzando la medesima ampiezza di classe 20fts. Si individui entro quali classe è contenuto il 25% il 50% ed il 75% degli home-run. (C) Ripetere i calcoli di punto (A) per gli home-run di Sammy Sosa. Cap.6 Pagina 4 di 21

(D) Calcolare gli indicatori di posizione centrale e di dispersione dei data set di McGuire e di Sosa per gli istogrammi delle frequenze calcolati in (B). Confrontare gli istogrammi sulla base dei parametri di popolazione calcolati. Distribuzione Normale 3. La distribuzione Normale è la più importante e più largamente utilizzata distribuzione di probabilità di una variabile casuale continua. La variabile continua x che indica l altezza o il peso di una popolazione; il punteggio ottenuto in una sessione d esame; il peso di una scatola di cereali acquistata al supermercato; il quantitativo di latte in un tetrapak del peso dichiarato di un litro; la vita media di una lampadina, il tempo impiegato per portare a termine un certo lavoro, hanno esattamente o approssimativamente una distribuzione normale. La distribuzione di probabilità normale ha una la forma di una campana, è una curva simmetrica il cui valore medio è indicato con µ e la sua varianza con σ. Una variabile casuale continua x distribuita normalmente è detta normale. Una distribuzione normale soddisfa le seguenti proprietà. 1. L area totale al di sotto della curva normale è uguale a 1 (100% di probabilità) 2. La distribuzione normale è simmetrica attorno al valore medio µ, di conseguenza metà dell area totale è a sinistra della media e l altra metà a destra della media. Il valore medio divide l area in due metà entrambe pari a 0.5. 3. Le code (tails) della normale proseguono indefinitamente in entrambe le direzioni senza mai intersecare l asse x, in termini matematici le code della normale tendono asintoticamente a x=0 per x ±. Causa il comportamento asintotico l area al disotto della curva per x < µ-3σ e x > µ + 3σ è molto piccola. 4. La media µ e la deviazione standard σ sono i parametri della distribuzione normale e la descrivono completamente. Questo significa che noti µ e σ è possibile calcolare l area al di sotto della curva normale per qualsiasi intervallo di x. 5. Esiste una famiglia di distribuzioni normali che si differenziano al variare dei parametri µ e σ. Il valore di µ determina la posizione del centro della distribuzione normale, il valor di σ indica la dispersione di x attorno al valore medio. I grafici di Fig.6.15 e 6.16 descrivono rispettivamente curve normali con il medesimo valore di µ e σ variabile, e µ variabile con il medesimo valore di σ. 3 La distribuzione normale è stata introdotta nella letteratura scientifica Cap.6 Pagina 5 di 21

6. L equazione della distribuzione di probabilità normale è f 1 σ [ ] 2 ( ) ( 1 2)( x µ x = e ) σ 2π dove e = 2.71828 è la base dei logaritmi naturali o di Nepero e π= 3.14159. La f(x) e detta funzione di densità di probabilità è calcola la distanza verticale dall asse delle ascisse nel punto x. L integrale definito della f(x) calcolato nell intervallo di x [a, b] è uguale alla probabilità che x assuma uno qualsiasi dei valori compresi nell intervallo. P ( a x b) = P( a < x < b) = f 7. I valori dell area al disotto della curva normale sono tabulati (Tabella VII) per valori della variabile casuale continua x. Dalla tabella è possibile ricavare direttamente i valori della probabilità P(a x b). Distribuzione Normale Standard La distribuzione normale standard è un caso speciale della distribuzione di probabilità normale calcolata per µ = 0 e σ = 1. La variabile casuale distribuita secondo la distribuzione normale standard è indicata con z ed è indicata anche come valore di z o z-score. I valori di z sono indicati anche come unità standard o standard score. Uno specifico valore di z indica la distanza fra il valore medio µ e il punto rappresentato da z in multipli e sottomultipli della deviazione standard. b a ( x) dx Cap.6 Pagina 6 di 21

In Figura 6-17 l asse orizzontale descrive la variabile z i cui valori a destra di µ sono positivi e a sinistra sono negativi rispetto al valore di µ = 0. Il valore di z =2 è a distanza pari 2σ a destra del valore medio mentre il valore z = -1 è a distanza pari 1 σ da µ. La tabella della distribuzione normale standard nel libro di testo è la tabella Tabella VII di Appendice D elenca i valori dell area al di sotto della curva normale standard per z compreso fra z = 0 e z = 3.09. Per ottenere l area corrispondente a z=z 0 si legge la Tabella VII a partire da z=0 che rappresenta il valore medio dell area al di sotto della normale standard. Il valore z 0 è dato dalla somma dei valori di z riportati in uno schema riga-colonna dove l intersezione fra i corrispondenti valori di riga e colonna rappresenta l area sottesa nell intervallo [0, z 0 ]. Importante. L area al disotto della curva standard fra due valori di z qualsiasi può essere interpretata come la probabilità che z assuma uno dei valori compresi nell intervallo delimitato dai valori di z scelti. Esempio 6-1. Calcolare l area al di sotto della distribuzione normale standard per valori di z = 0 e z = 1.95. Dividiamo il valore z = 1.95 in due parti: la radice 1.9 composta dal numero intero ed il primo decimale, ed il II decimale 0.09. Individuiamo 1.9 nella colonna etichettata z e seguendo la riga z=1.9 individuiamo la colonna etichettata 0.09. Il valore individuato dalla intersezione fra la riga 1.9 e la colonna 0.05 è l area sottesa nell intervallo [0, 1.95] ed è pari a 0.4744 Poiché l area al di sotto della normale standard può essere interpretata come una probabilità, la probabilità che preso un valore z qualsiasi questo sia compreso nell intervallo [0, 1.95] è pari a Importante. L area al di sotto della curva standard è uguale a 1 e poiché la curva è simmetrica rispetto al valore medio z = 0 e quindi l area sottesa dalla curva a destra e sinistra del Cap.6 Pagina 7 di 21

valore medio è pari a 0.5. Questo significa l area sottesa in un intervallo scelto per valori di z negativi, ad esempio z=0 e z=-z 0 è la medesima area sottesa dalla curva standard nell intervallo di valori [0, z 0 ]. Esempio 6-2. Calcolare l area al di sotto della distribuzione normale standard per valori di z = 0 e z = -2.17. Poiché la curva è simmetrica rispetto all origine l aera sottesa all intervallo [0, -2.17] è uguale all area delimitata dai valor di z = 0 e z = 2.17. Applicando lo schema riga-colonna dalla Tabella VII si ottiene che l area sottesa in [0, 2.17] è pari a 0.4850 Valore che corrisponde alla probabilità che preso un z qualsiasi questo sia contenuto nell intervallo di estremi [0, 2.17]; cioè, P(-2.17< z < 0) = 0.4850. Esempio 6-3. Calcolare l area al di sotto della distribuzione normale standard a. A destra di z = +2.32 b. A sinistra di z = -1.54 a. L area a destra di z = +2.32 è l area sottesa dalla coda della curva standard per valori di z > + 2.32 e si calcola in due step distinti: 1) si calcola l area sottesa in [0, 2.32] che è paria a 0.4898, e 2) poiché l area a destra del valore medio è pari a 0.5 utilizzando la sottrazione Area a destra di z = +2.32 = P(z > 2.32) = 0.5 0.4898 = 0.0102 Cap.6 Pagina 8 di 21

b. L area a sinistra di z = -1.54 è l area sottesa dalla coda della curva standard per valori di z <- 1.54. 1. area sottesa in [0, 1.54] uguale all area in [0, -1.54] pari a 0.4382 2. Area a sinistra di z = -1.54 = P(z < -1.54) = 0.5 0.4382 = 0.0618. Esempio 6-4. Trovare le seguenti probabilità utilizzando la curva normale standard 4. a. P(1.19< z < 2.12) b. P(-1.56< z < 2.31) c. P(z > -.75) a. P(1.19< z < 2.12) = 0.1000 b. P(-1.56< z < 2.31) = 0.9302 Suggerimento. La regola per il calcolo di P(-z 1 < z < z 2 ) quando i valori di z 1 e z 2 non sono simmetrici rispetto alla media è calcolare separatamente le aree rispetto a z = 0 quindi sottrarre l area minore dall area maggiore. c. P(z > -.75) = 0.7734 Importante. Fra le funzioni predefinite di Excel categoria funzioni statistiche sono presenti le funzioni DISTRB.NORM e DISTRB.NORM.ST che calcolano rispettivamente la distribuzione normale per valori dati di µ, σ e per x [x min,x max ] e la distribuzione normale standard per z [z min,z max ]. Tuttavia, contrariamente a quanto si verifica per la distribuzione binomiale, nel 4 La soluzione e proposta in forma grafica si invita lo studente ad eseguire il calcolo in dettaglio utilizzando la Tabella VII. Cap.6 Pagina 9 di 21

caso della normale standard l uso della Tabella VII risulta essere più pratico rispetto al calcolo diretto del valore di f(z) 5. Per questa ragione la Tabella VII è riprodotta in coda al presente capitolo. Significato della Deviazione Standard. Regola empirica La regola empirica introdotta nel Capitole 3 per spiegare il significati della varianza nel caso di una distribuzione simmetrica a forma di campana trova la sua spiegazione nella distribuzione normale standard. 1. L area totale sottesa entro una deviazione standard dalla media è pari al 68% dell area totale; cioè la P(-1< z <1) = 0.68. 2. L area totale sottesa entro due volte la deviazione standard dalla media è pari al 95% dell area totale; cioè la P(-2< z <2) = 0.95. 3. L area totale sottesa entro tre volte la deviazione standard dalla media è pari al 68% dell area totale; cioè la P(-3< z <3) = 0.99. Importante. L area per valori di z < -3.09 e z > 3.09 è molto piccola pertanto si è soliti approssimarla a zero. Questo comporta che valori di probabilità in cui appare un valore della variabile standard z>> - 3.09 si ottengano sempre considerando z = ± 3.09 quali estremi della normale standard. Ad esempio per un valore di z = 5.67 le probabilità P(0 < z < 5.67) = area compresa fra 0 e 5.67 = circa uguale a 0.50 P(z < - 5.67) = area a sinistra del valore - 5.67 = circa uguale a 0.5 0.5 = 0.00 5 La funzione DISTRB.NORM.ST calcola la distribuzione normale standard f(z) per un dato valore di z, dove f(z) è uguale a: f () z = 1 e 2π Cap.6 Pagina 10 di 21 z 2 2

Standardizzazione della Distribuzione Normale Data la variabile casuale continua x distribuita secondo la distribuzione normale di valore medio µ e deviazione standard σ, N(µ,σ), la distribuzione normale può esser trasformata nella distribuzione normale standard N(0,1), tramite una trasformazione della variabile x nella variabile standard z. La trasformazione di variabile prende nome di standardizzazione della distribuzione normale. Trasformazione della variabile x nella variabile z. Presa una variabile normale x, un dato valore di x può essere trasformato nel corrispondente valore di z usando la formula µ z = x σ dove µ e σ sono rispettivamente il valore medio e la varianza della variabile x. Si osservi che la trasformazione di variabile implica che per x = µ e x- µ = σ si ottiene rispettivamente z = 0 e z = 1. Esempio 6-6. Sia x una variabile continua distribuita secondo N(µ,σ) = N(50,10), si calcolino i valori di z score corrispondenti ai valori della variabile casuale: (a) x = 55 e (b) x = 35. a. Eseguendo la trasformazione di variabile si ottiene che per x = 55 lo z score è pari a x µ 55 50 z = = = 0.50 σ 10 il significato geometrico della trasformazione di variabile è esplicitato dalla Fig. 6.32. Il calcolo al numeratore della trasformazione standard è una semplice traslazione lungo l asse delle ordinate che porta all allineamento delle distribuzioni N(50,10) e N(0,1) rispetto al loro valore medio: il valore di z per x = µ è infatti uguale a zero. La divisione per σ è una operazione di scaling cioè di compressione dell asse della variabile x che porta z a variare in unità della deviazione standard: infatti, z = 1 per x = σ. x µ 35 50 b. Per x = 35 si ottiene z = = = 1. 50. Si osservi che per x>µ il valore di z è σ 10 positivo e per x<µ lo z-score è negativo. x>µ. Cap.6 Pagina 11 di 21

Esempio 6-7. Sia x una variabile continua distribuita secondo N(µ,σ) = N(25,4), si calcoli l area a. compresa fra i valori x 1 = 25 e x 2 = 32 b. compresa fra i valori x 1 = 18 e x 2 = 34 x1 µ 25 25 a. Applicando la trasformazione di variabile si ottiene z1 = = = 0. 0 e σ 4 x2 µ 32 25 z2 = = = 1.75 pertanto l area sottesa dalla normale N(25,4) nell intervallo di σ 4 x di estremi [18, 24] è la medesima sottesa dalla curva standard N(0,1) nell intervallo di estremi [0, 1.75] ed è pari a 0.4599. x1 µ 18 25 x2 µ 34 25 b. Per x 1 = 18 z 1 = = = 1. 75 e per x 2 = 34 z 2 = = = 2. 25. σ 4 σ 4 Le aree sono calcolate a partire da z=0 e poiché, come indicato dalla Fig.6.35, sono rispettivamente a destra e a sinistra del valore medio l area totale si ottiene come somma delle singole aree ed paria a Area fra x 1 e x 2 = Area fra 0 e x 1 + Area fra 0 e x 2 = 0.4599 + 0.4878 = 0.9477 Dalla definizione di probabilità come area l esempio 6-7 dimostra che a. P(25 < x <32) = 0.4599 b. P(18 < x <34) = 0.9477 Degli esempi che seguono viene data solo il risultato in forma grafica, la soluzione si può ottenere in modo analogo all Esempio 6-5. Esempio 6-8. Sia x una variabile normale distribuita secondo N(40, 5), si calcoli i valori delle probabilità. a. P(x 1 > 55) b. P(x 2 < 49) 55 40 a. z 1 = = 3. 00; P(x 1 > 55) = P(z 1 > 3.00) =.5 -.4987 = 0.0013 5 Cap.6 Pagina 12 di 21

49 40 b. z 2 = = 1. 80; P(x 2 < 49) = P(z 2 < 1.80) =.5 +.4641 = 0.9641 5 Esempio 6-9. Sia x una variabile normale distribuita secondo N(50 8), si calcoli il valore della probabilità P(30 x 39) corrispondente a un area della curva normale delimitata da valori di x entrambi minori del valore medio. P(30 x 39) = P(-2.50 z -1.38) = 0.4938 0.4162 = 0.0776 Esempio 6-10. Sia x una variabile normale distribuita secondo N(80,12), si calcoli l area delimitata dai valori di x a. da x = 70 a x = 135 b. per x minore di 27 a. Area compresa fra x = 70 a x = 135 P(70 x 135) = P(-0.83 z 4.58) = 0.2967 0.5 0. 7967 Cap.6 Pagina 13 di 21

27 80 b. Per x = 27, z = = 4. 42 12 Applicazioni della Distribuzione Normale. Esempio 6-11. Una indagine statistica sulla popolazione degli studenti, diplomati al college con curriculum informatico, neo assunti nelle aziende ha dimostrato che il loro salario è distribuito secondo la distribuzione normale con valore medio µ=41949$ lordi annui e deviazione standard pari σ=2500$. Si vuole calcolare la probabilità che preso a caso un diplomato, neo assunto presso una azienda, questo percepisca uno stipendio annuo compreso fra 38624$ e 43299$. Il valore di probabilità cercato è pari all area compresa fra gli stipendi limite di 38624$ e 43299$, area che si calcola eseguendo la standardizzazione della distribuzione normale della variabile x scelta a rappresentazione degli stipendi percepiti dai neo diplomati. I valori di ottenuti dalla standardizzazione sono rispettivamente z = -1.33 e z = 0.54, e l area risultante è data dalla somma dell area a sinistra e a destra del valore medio [-1.33, 0] e [0, 0.54], indicate nella Fig. 6-41. Dalla tabella VII si ricava che la P(38624<x<43299)= P(-1.33<x<.54)=0.4082+0.2054=0.6136, che tradotto in valore percentuale asserisce che all incirca il 61% dei neo diplomati al college con studi informatici percepiscono uno stipendio annuo lordo compreso fra 38624$ e 43299$. Cap.6 Pagina 14 di 21

Esempio 6-12. La nota fabbrica di giocattoli Mack Corporation produce un modellino di auto da corsa molto gradito dal mercato che prevede una fase terminale del montaggio eseguita da operai specializzati. Il tempo di assemblaggio del modello segue una distribuzione normale con media pari a 55 minuti e deviazione standard di 4 minuti. Poiché il lavoro termina alle 17 pomeridiane di ciascun giorno lavorativo, si vuole determinare la probabilità che se un lavoratore inizia il montaggio alle ore 16 questo sia terminato prima del termine della giornata lavorativa. Indicata con x la variabile casuale che rappresenta il tempo necessario a portare a termine il montaggio questa avrà µ=55 e σ=4, e poiché il montaggio è stato iniziato esattamente 60 minuti prima del termine della giornata lavorativa, la probabilità che questo sia terminato in tempo è pari all area sottesa dalla normale con estremo superiore pari a 60 minuti. L area è indicata in Fig. 6.42 assieme al valore di z corrispondente a x=60. Come indicato nella figura l area al sotto della curva per z compreso fra [0, 1.25] è pari a 0.3944 che sommata all area a sinistra del valore z = 0 porta ad un valore di probabilità pari a P(x < 60) = P(z < 1.25) = 0.8944 Quindi la probabilità che il montaggio sia terminato è pari a circa il 90%. Esercizio 6-13. La Coca Cola produce molte bibite analcoliche fra le quali la Sweeps, Le macchine che riempiono le lattine sono state calibrate per inserire una quantità di liquido pari a 12 once (una oncia è paria a circa 0.03 litri) per lattina; tuttavia, per le normali incertezze nel funzionamento delle macchine è stato calcolato che la quantità di liquido inserita in ciascuna lattina segue una distribuzione normale con µ = 12 once e σ = 0.015 once. Si vuole calcolare a. La probabilità che presa a caso una lattina questa contenga fra 11.97 e 11. 99 once di bibita. b. La percentuale di lattine che contengono un quantitativo di Sweeps compreso fra 12.02 e 12.07 once Entrambi i valori di probabilità si ottengono dalla distribuzione normale standard calcolata per µ = 12 e σ = 0.015 once, e dai valori della Tabella VII. a. La probabilità che P(11.97<x<11.99) = P(-2 < z < -0.67) = 0.2286 cioè il valore al di sotto della curva normale N(12,0.015) dell area indicata in Fig. 6.43. Il risultato ottenuto indica che circa il 23% delle lattine ha un contenuto di liquido compreso nell intervallo indicato. Cap.6 Pagina 15 di 21

b. La percentuale di lattine con un quantitativo di Sweeps in eccesso rispetto al valore dichiarato compreso fra 12.02 e 12.07 once è pari a circa il 9.2% della produzione totale come indicato dall area di Fig.6.44, dalla quale si calcolata l area pari al valori di probabilità P(12.02< x <12.07) = P(1.33 < z < 4.67) = 0.5 0.4082 = 0.2286 dove i valori dell area pari a 0.5 e 0.40082 sono sottesi rispettivamente dalla curva standard per z>=0 e dall intervallo 0<z<1.35. Esercizio 6-14. La vita media di un calcolatore prodotto dalla Intal Corporation ha una vita media distribuita normalmente con µ = 54 e σ = 8 mesi di ore lavorative. La compagnia garantisce che ciascun calcolatore che mostri malfunzionamenti entro 36 mesi dall acquisto siano sostituiti da una macchina nuova. Si vuole calcolare la percentuale delle sostituzione che l azienda prevede di dover effettuare (il valore atteso del numero di sostituzioni). Sia x la vita media del calcolatore con N(µ, σ)=n(54,8), la probabilità che un calcolatore si rompa dopo 36 mesi dall acquisto è pari all area al di sotto della curva normale a sinistra di x = 36 mesi, come indicato dalla Fig. 6.45. Cap.6 Pagina 16 di 21

Dal calcolo dello z-score per x= 36 si ottiene P(x < 36) = P(z < -2.25) = 0.5 0.4878 = 0.0122 Valore risultante dalla sottrazione dell area sottesa fra 2-25<z<0 dall area a sinistra del valore medio z=0. Quindi la probabilità che preso a caso un calcolatore questo debba essere sostituito perché malfunzionante entro 36 mesi dalla vendita è molto bassa ed è pari allo 1.22%. Calcolo dei valori di z e x nota l Area al di sotto della Distribuzione Normale. Procedura inversa alla precedente che permette il calcolo della variabile casuale z od x nota l area sottesa dalla curva normale. Calcolo dei valori di z nota l Area al di sotto della Normale Standard Esempio 6-15. Trovare il valore di z per il quale l area sottesa da N(0,1) e compresa fra 0 e z è pari 0.4251. Si utilizzi la Tabella VII La Tabella 6.4 illustra la procedura in modo diretto. L area nota è compresa fra i valori di z=0 e z=0.4251, area calcolata dalla Tabella VII. Pertanto, individuata all interno della tabella la posizione corrispondente al valore dell area il corrispondente valore di z si trova facilmente come intersezione della riga e della colonna in cui si trova il valore dell area nota. Poiché i valori di riga e colonna sono rispettivamente pari alla radice 1.4 e alla seconda cifra decimale 0.04 il valore cercato è pari a z=1.44, area Esempio 6-16. Trovare il valore di z per il quale l area al di sotto della coda destra della normale standard (coda per valori z>0) è pari a 0.005. L area è indicata in Fig.6.47 [R. Area fra 0 e z = 0.5 0.005 = 0.4950 per z=2.58]. Cap.6 Pagina 17 di 21

Esempio 6-17. Trovare il valore di z tale che l area al di sotto della coda di sinistra sia pari a 0.05, l area nota è indicata in Fig.6.48. [R. Area fra 0 e z = 0.5 0.005 = 0.4950 per z=-1.65]. Calcolo dei valori di x nota l Area al di sotto della Normale Standard Il valore della variabile casuale x corrispondente ad un area nota può essere calcolato a partire dal corrispondente valore di z, noti µ e σ ed eseguendo una banale trasformazione algebrica della formula che calcola lo z score. Esempio 6-17. Nell esempio 6.14 si è indicato il tempo di vita media dei calcolatori prodotti dalla Intal Corporation come una variabile normale x con µ=54 e σ=8 mesi. Vogliamo calcolare il periodo di garanzia offerto ai clienti con la clausola di sostituzione del calcolatore se l originale non funziona. La compagnia si propone di sostituire al più un numero di calcolatori pari all 1%. Nella Fig. 6.49 è indicata l area al di sotto della N(54,8) pari a 0.01 cioè al valore massimo desiderato di computer sostituiti. In prima istanza calcoliamo il valore di z corrispondente al valore di x richiesto; quindi calcoliamo l area compresa fra µ ed x Area fra valore medio e x = 0.5 0.01 = 0.4900 Cap.6 Pagina 18 di 21

Successivamente troviamo dalla Tabella VII il valore di z corrispondente all area di valore 0.4900. z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 Poiché l area pari a 0.4901 è il valore approssimato prossimo a 0.4900 scegliamo quale valore della variabile standard z = - 2.33 dove il segno negativo è dovuto al fatto che il valore di probabilità 0.01% è nella coda di sinistra della distribuzione normale. Sostituendo i valori di µ, σ e z nella formula standard inversa x = µ + σ z otteniamo x = µ + z σ = 54 + (-2.33) (8) = 54 18.64 = 35.36 Quindi se proponendo un periodo di garanzia totale pari a 35 mesi dalla data di acquisto la Intal dovrebbe sostituire al più l 1% dei calcolatori venduti. Esempio 6-19. L accesso al college da parte degli studenti della scuola media superiore prevede il superamento di un test denominato SAT, test che viene eseguito nel medesimo giorno in tutti i collage. Nel 1999 il punteggio del SAT test ottenuto da tutti gli studenti è ha mostrato una distribuzione normale con media pari a 1016 e deviazione standard di 153. Una studentessa vuole sostenere questa prova al più presto possibile e sa che per avere una elevata probabilità di accedere al college che desidera il punteggio della sua prova deve essere molto alto. Per avere un riferimento ha deciso che il punteggio da raggiungere in fase di preparazione al test deve essere tale che al più il 10% degli studenti che hanno sostenuto l esame nel 1999 deve avere un punteggio superiore al suo. Se indichiamo con x la variabile casuale che rappresenta il punteggio conseguito al test questa è distribuita secondo N(µ, σ)=n(1016, 153) e l area pari al 10% al di sotto della coda di destra della distribuzione di Fig. 6.50 è la percentuale dei punteggi che la studentessa accetta come superiori al suo. Cap.6 Pagina 19 di 21

Per ottenere il valore di x In prima istanza calcoliamo l area fra la media µ ed il valore x Area fra valore medio e x = 0.5 0.1 = 0.4000 Dalla Tabella VII troviamo che per un valore di z = 1.28 corrisponde un area di 0.3397 che accettiamo come valore approssimato dell area 0 < z < 1.28. Quindi dalla trasformazione che definisce lo z score si calcola il valore di x x = µ + z σ = 1016 + 1.28 (153) = 1016 195.84 1212 Quindi se la studentessa raggiunge in fase di preparazione al test un punteggio pari a circa 1212 è sicura che solo il 10% degli studenti ha ottenuto un punteggio superiore al suo e quindi avrà una elevata probabilità di scegliere il college che desidera per proseguire gli studi. Esercizi Aggiuntivi [R. a..3336, b..9564, c..0436, d. circa 0 ] [R. a. 0.2178, b. 0.5997] [R. a. 0.0287, b. 0.2345] [R. a. 1.65, b. 1.96, c. 2.33, d. 2.58] [R. a. 208.50, b. 242.25, c. 178.50, d. 147.75, e. 158.25, f. 251.25] [R. Circa 19 minuti] Cap.6 Pagina 20 di 21

Tabella VII. Distribuzione normale standard. I valori della tabella riportano il valore dell area sottesa dalla curva normale standard nell intervallo [0, z]. Area in [0, z] 0 z z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852 0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389 1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830 1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545 1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633 1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706 1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767 2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817 2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857 2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890 2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916 2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936 2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952 2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964 2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974 2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981 2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986 3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 Cap.6 Pagina 21 di 21