Esercitazioni di Statistica Modelli di Variabili Aleatorie Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Sulla base della passata esperienza il responsabile della produzione di un azienda ritiene che solo l 80% dei pezzi prodotti superi il controllo di qualità. Determinare la probabilità che di 8 pezzi prodotti: a cinque pezzi superino il controllo di qualità; b tutti i pezzi superino il controllo di qualità; c almeno 2 pezzi superino il controllo di qualità. Soluzione Ogni pezzo prodotto supera il controllo di qualità indipendentemente dagli altri pertanto la distribuzione di riferimento è la binomiale Bin(8, 0.8. La probabilità che cinque pezzi superino il controllo di qualità è data da: P r(x 8 = 5 = ( 8 5 (0.8 5 (0.2 8 5 = 0.1468 La probabilità che tutti i pezzi superino il controllo di qualità è data da: P r(x 8 = 8 = ( 8 8 (0.8 8 (0.2 0 = 0.167 La probabilità che almeno due pezzi superino il controllo di qualità è data da: 1 P r(x 8 2 = ( 8 0 8 P (X 8 = i = 1 i=2 (0.8 0 (0.2 8 0 + ( 8 1 1 P (X 8 = i = i=0 (0.8 1 0.2 8 1 = 0.9999 1
Esercizio 2 Determinare l area sotto la curva normale standardizzata: a tra z = 0 e z = 1.2; b tra z = 0.68 e z = 0; c tra z = 0.46 e z = 2.21; d alla destra di z = 1.28. Determinare inoltre il valore z tale che si lascia a destra una probabilità pari a 0.05. Soluzione La tavola per calcolare il valore della funzione di ripartizione di una distribuzione normale standardizzata fornisce la seguente probabilità: zα 1 F (z α = P r(z z α = exp ( 12 2π z2 dz, per valori di z α [0, 4.09]. Il problema chiede semplicemente di determinare le seguenti probabilità: a tra z = 0 e z = 1.2 P r(0 Z 1.2 = P r(z 1.2 P r(z 0 = F (1.2 F (0 = b tra z = 0.68 e z = 0 = 0.8849 0.5 = 0.3849; P r( 0.68 Z 0 = P r(0 Z 0.68 = P r(z 0.68 P r(z 0 = = F (0.68 F (0 = 0.7517 0.5 = 0.2517, dove la prima uguaglianza è giustificata dalla simmetria della normale standardizzata rispetto allo 0 (P r( a Z 0 = P r(0 Z a; c tra z = 0.46 e z = 2.21 P r( 0.46 Z 2.21 = P r( 0.46 Z 2.21 d alla destra di z = 1.28. = P r( 0.46 Z 0 + P r(0 Z 2.21 = P r(0 Z 0.46 + P r(0 Z 2.21 = F (0.46 + F (2.21 2 F (0 = = 0.6772 + 0.9864 1 = 0.6636; P r( 1.28 Z < + = P r( 1.28 Z 0 + P r(0 Z < + = = P r(0 Z 1.28 + P r(0 Z < + = = P r(0 Z 1.28 + P r( < Z 0 = = P r( < Z 0 + P r(0 Z 1.28 = = P r( < Z 1.28 = = F (1.28 = 0.8997. Il valore z tale che P r(x z = 0.05 è tale che P r(0 Z z = 0.45. Esaminando le tavole si ricava che il valore cercato è 1.64. 2
Esercizio 3 La durata delle gomme per auto segue una distribuzione normale di media 70000 km e deviazione standard 8000 km. a Qual è la proporzione delle gomme che durano meno di 60,000 km? b La pubblicità dichiara che il 90% delle nostre gomme durano più di x km. Qual è il valore di x? Soluzione Per calcolare tale proporzione (o in termini più formali, tale probabilità dobbiamo standardizzare la distribuzione delle gomme per ricondurla alla normale standardizzata. Se X N(µ = 70000; σ = 8000 allora Z = X 70000 N(0; 1, 8000 e quindi si ha che: ( X 70000 60000 70000 P r(x < 60000 = P r < = 8000 8000 ( 60000 70000 = P r Z < = P r(z < 1.25 = 0.1056 8000 Nel secondo punto dobbiamo prima trovare il percentile dalla distribuzione standardizzata e poi applicare la trasformazione inversa alla standardizzazione quindi si ha che: P r(z < q Z = 0.9 q Z 1.28 P r(z > q Z = 0.9 q Z 1.28 q Z 8000 + 70000 = 1, 28 8000 + 70000 = q X = 59760. Esercizio 4 Il tempo necessario per completare questa esercitazione segue una distribuzione normale di media 100 minuti e deviazione standard di 20 minuti. a Calcolare la percentuale di studenti che completeranno tutti gli esercizi entro 2 ore b Quanto tempo è necessario affinché il 95% degli studenti completino l esercitazione? Soluzione Se X N(µ = 100; σ = 20 allora la ( X 100 120 100 P r(x < 120 = P r < = 20 20 ( 120 100 = P r Z < = P r(z < 1 = 84.13% 20 Nel secondo punto dobbiamo prima trovare il percentile dalla distribuzione standardizzata e poi applicare la trasformazione inversa alla srandardizzazione quindi si ha che: P r(z < q Z = 0.95 q Z 1.645 P r(z < q Z = 0.95 = P r(z 20 + 100 < q Z 20 + 100 = 0.95 q Z 20 + 100 = q X = 1.645 20 + 100 = 132.9. 3
dnorm(x, mean = 0, sd = 1 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x Esercizio 5 Data la variabile (Uniforme X definita nell intervallo (0, 10 a determinare valor medio e varianza b calcolare il valore della funzione di ripartizione in corrispondenza del valore x = 6. Soluzione a La funzione di densità della variabile aleatoria uniforme in (a, b è p(x = 1 x in (a, b. (b a L 30 28 26 24 22 20 18 0 1 2 3 4 5 6 µ Risulta: V ar(x = b E(X = xf(xdx = x 2 f(xdx E(X 2 = F (6 = 6 0 10 0 10 0 1 10 dx = 1 10 x 1 10 dx = 1 x 2 10 2 10 0 = 1 2 6 0 1 10 100 = 5 x 2 1 1 x 3 dx 25 = 10 10 3 10 0 25 = 1 1000 25 = 8.33 30 dx = 1 10 x 6 0 = 6 10 = 0.6 4
F (x 0.0 0.2 0.4 0.6 0.8 1.0 0 2 4 6 8 10 x Esercizio 6 (Scozzafava Un apparecchiatura contiene 2000 componenti ugualmente affidabili, con una probabilità di guastarsi, per ognuno di essi, uguale a p = 0.0005. Sia E i questo evento. Se anche un solo componente si guasta, l apparecchiatura si ferma: valutare la probabilità di quest ultimo evento, supponendo indipendenti i 2000 eventi E i. Soluzione Con questi valori di p e n si può utilizzare la variabile aleatoria di Poisson con λ = np = 1. Allora la probabilità che nessun componente si guasti è e 1, e quindi la probabilità che l apparecchiatura si fermi è uguale a 1 e 1 = 0.632. Esercizio 7 Ad un router arrivano in media 7 pacchetti per unità di tempo. Supponendo che la variabile aleatoria X numero di pacchetti per unità di tempo si distribuisca secondo una legge di Poisson, determinare la probabilità: a che in un unità di tempo arrivino 3 pacchetti b che in un unità di tempo arrivino più di 5 pacchetti c che in tre unità di tempo arrivino esattamente 2 pacchetti. Soluzione a P (X = 7 = e 7 73 3! = 0.052 variabile aleatoria di Poisson di parametro 7 b P (X > 5 = 1 P (X 5 = 1 5 i=0 P (X = i = 1 5 e 7 7 i i=0 = 0.7 variabile i! aleatoria di Poisson di parametro 7 c P (X = 2 = e 21 212 2! = 220.5 e 21 variabile aleatoria di Poisson di parametro 21 (utilizzando la riproducibilità della distribuzione di Poisson 21 = 7 3 Esercizio 8 Un dado viene lanciato più volte fino all arrivo della faccia 1. Sapendo che sono stati già effettuati 3 lanci (senza che la faccia 1 sia uscita, calcolare la probabilità di fare al massimo altri 3 lanci. 5
p 0.02 0.04 0.06 0.08 0.10 0.12 0.14 2 4 6 8 10 k Soluzione La variabile aleatoria che descrive il fenomeno è una variabile aleatoria X geometrica di parametro p = 1 con funzione di probabilità p(x = x = (1 6 px 1 p. La probabilità di fare al massimo altri 3 lanci è la probabilità che il numero 1 esca al primo, secondo o terzo lancio. I tre eventi sono incompatibili quindi si può utilizzare la legge delle probabilità totali. Per la proprietà di assenza di memoria della distribuzione geometrica l informazione che in tre precedenti lanci il numero 1 non è uscito non influisce sulla probabilità che il numero 1 esca in successivi lanci. P (X 3 = P (X = 1 + P (X = 2 + P (X = 3 = 1 6 + 5 6 1 6 + ( 5 6 2 1 6 = 91 216 p 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0 2 4 6 8 10 k La proprietà di assenza di memoria si dimostra nel modo che segue. 6
F (k = P (X k = k (1 p x 1 p = p x=1 1 (1 pk 1 (1 p = 1 (1 pk 1 F (k = P (X > k = (1 p k P (X > s/x > t = P (X > t + s P (X > t = (1 pt+s (1 p t = (1 p s = P (X > s Esercizio 9 Due componenti hanno tempi di durata T 1 e T 2 indipendenti e con funzione di densità esponenziale con valore medio 200 ore. Determinare la probabilità che un dispositivo composto da entrambi i componenti duri almeno 100 ore. Soluzione La probabilità che il dispostivo duri almeno 100 ore è la probabilità che la durata minima di funzionamento dei due componenti sia almeno 100 ore. Ricordando la proposizione 5.6 (Ross riguardante la funzione di densità del minimo di due variabili aleatorie esponenziali indipendenti e identicamente distribuite risulta: P (min(t 1, T 2 > 100 = P ((T 1, T 2 > 100 = e 1 200 100 e 1 200 100 = e 1. dexp(x, 1/100 0.002 0.004 0.006 0.008 0.010 0 50 100 150 x Esercizio 10 Determinare la funzione generatrice dei momenti di una variabile aleatoria di Poisson di valor medio λ = 3. Soluzione ϕ(t = e 3(et 1 (per lo sviluppo si veda formula 5.2.2. del Ross 7
Esercizio 11 Siano dati due lotti, L 1 contenente 2 pezzi difettosi e 3 non difettosi ed L 2 contenente 3 pezzi difettosi e 4 non difettosi. Da L 1 si effettuano 2 estrazioni con restituzione ottenendo X pezzi non difettosi; successivamente, si effettuano 3 estrazioni con restituzione da L 2 ottenendo Y pezzi non difettosi. Sia E i la variabile casuale che vale 1 se il pezzo estratto nell i-ma prova è non difettoso, i = 1,..., 5; 0 altrimenti. Calcolare la probabilità p che almeno uno dei 5 pezzi estratti sia non difettoso. Calcolare il valore atteso e la varianza di Z = X + Y Soluzione La prima cosa da notare è che le estrazioni sono con reimmissione quindi si può applicare uno schema delle prove ripetute al problema proposto. Occorre, tuttavia, distinguere le prime due estrazioni dalle successive tre. La probabilità di avere un pezzo difettoso in una delle prime due estrazioni è 2/5 mentre nelle successive tre è 3/7. Il testo dell esercizio richiede il calcolo della probabilità dell evento almeno uno dei 5 pezzi estratti sia non difettoso. Il calcolo di questa probabilità è molto laboriosa, in particolare, se confrontata con la probabilità della negazione dell evento che è data da: { 5 } ( 2 ( 3 2 3 P r E i = 0 = = 0.013 5 7 i=1 Quindi la probabilità dell evento almeno uno dei 5 pezzi estratti sia non difettoso è semplicemente 1-0.013=0.987. Per la risoluzione della seconda parte dell esercizio occorre notare che, essendo le estrazioni l una indipendente dall altra, le variabili aleatorie X e Y sono indipendenti. Notando inoltre che le due variabili aleatorie sono due binomiali (X Bin(2, 0.6 e Y Bin(3, 0.57 si ha che: E(X + Y = E(X + E(Y e = 2 π X + 3 π Y = 2 0.6 + 3 0.57 = 2.91, Var(X + Y = Var(X + Var(Y = 2 π X (1 π X + 3 π Y (1 π Y = 2 0.4 0.6 + 3 0.43 0.57 = 1.215. Esercizio 12 Un prodotto si ottiene dall assemblaggio di tre componenti, le cui lunghezze si distribuiscono come segue: X 1 N(2, 0.01 X 2 N(4, 0.02 X 3 N(3, 0.02 Si assuma che le tre lunghezze siano tra loro indipendenti. Gli standard qualitativi del prodotto prevedono che la lunghezza sia compresa nell intervallo (8.75, 9.25. a Si determini la probabilità che il prodotto superi gli standard qualitativi; b Qual è la probabilità che il secondo pezzo sia più lungo del terzo? 8
Soluzione a Sia Y = X 1 + X 2 + X 3 la lunghezza del prodotto. Per la proprietà riproduttiva della normale, Y N(µ, σ 2 E(Y = µ = E(X 1 + E(X 2 + E(X 3 = 2 + 4 + 3 = 9 V (Y = σ 2 = V (X 1 + V (X 2 + V (X 3 + 2Cov(X 1, X 2 + 2Cov(X 1, X 3 + 2Cov(X 3, X 2 = 0.01 + 0.02 + 0.02 = 0.05 Quindi la probabilità richiesta P (8.75 < Y < 9.25 = P ( 8.75 9 < Z < 9.25 9 0.05 0.05 = P ( 1.12 < Z < 1.12 = 1 2 P (Z > 1.12 = 1 2 (1 P (Z < 1.12 = 2 P (Z < 1.12 1 = 2 0.8686 1 = 0.7372 b Vogliamo calcolare la probabilità che il secondo pezzo sia più lungo del terzo, ossia P (X 2 > X 3 = P (X 2 X 3 > 0. Sappiamo che Quindi X 2 X 3 N(E(X 2 E(X 3, V (X 2 + V (X 3 = N(1, 0.04 P (X 2 X 3 > 0 = P ( Z > 0 1 0.04 = P (Z > 5 = P (Z < 5 1 Esercizio 13 Determinare: a il valore della t di Student di parametro 24 che si lascia a destra una probabilità pari a 0.05; b i valori della t di Student di parametro 24 al di la dei quali vi è una probabilità pari a 0.05; c la probabilità che una variabile aleatoria χ 2 di parametro 3 assuma un valore maggiore o uguale di 6; d quale valore di una variabile aleatoria χ 2 di parametro 5 si lascia a destra una probabilità pari a 0.025; e il valore della F di Fisher di parametri 4 e 12 che si lascia a destra una probabilità pari a 0.05; f la probabilità che una variabile aleatoria F di Fisher di parametri 5 e 10 assuma un valore maggiore o uguale di 6.5. 9
dt(x, 24 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 x dchisq(x, 5 0.00 0.05 0.10 0.15 0 5 10 15 20 x Soluzione a 1.711; b -2.064 e 2.064; c maggiore di 0.05 esattamente 0.1116 (1-pchisq(6,3; d 12.832; e 3.26; f minore di 0.01 esattamente 0.006 (1-pf(6.5,5,10. 10
df(x, 5, 10 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 5 10 15 20 x Appendice: istruzioni di R per variabili aleatorie Discrete Bernoulli Densità dbinom(x = x, size = 1, prob = p Ripartizione pbinom(q = x, size = 1, prob = p Quantile qbinom(p = α, size = 1, prob = p Random rbinom(n, size = 1, prob = p Binomiale Densità dbinom(x = x, size = m, prob = p Ripartizione pbinom(q = x, size = m, prob = p Quantile qbinom(p = α, size = m, prob = p Random rbinom(n, size = m, prob = p Geometrica Densità dgeom(x = x, prob = p Ripartizione pgeom(q = x, prob = p Quantile qgeom(p = α, prob = p Random rgeom(n, prob = p Poisson Densità dpois(x = x, lambda = λ Ripartizione ppois(q = x, lambda = λ Quantile qpois(p = α, lambda = λ Random pois(n, lambda = λ Continue Esponenziale 11
Densità dexp(x = x, rate = λ Ripartizione pexp(q = x, rate = λ Quantile qexp(p = α, rate = λ Random rexp(n, rate = λ Normale Densità dnorm(x = x, mean = µ, sd = σ Ripartizione pnorm(q = x, mean = µ, sd = σ Quantile qnorm(p = α, mean = µ, sd = σ Random rnorm(n, mean = mean = µ, sd = σ Student Densità dt(x = x, df = k Ripartizione pt(q = x, df = k Quantile qt(p = α, df = k Random rt(n, df = k Chi Quadrato Densità dchisq(x = x, df = k Ripartizione pchisq(q = x, df = k Quantile qchisq(p = α, df = k Random rchisq(n, df = k Fisher Densità df(x = x, df1 = n1, df2 = n2 Ripartizione pf(q = x, df1 = n1, df2 = n2 Quantile qf(p = α, df1 = n1, df2 = n2 Random rf(n, df1 = n1, df2 = n2 Grafici variabili discrete k<-c(0:10 p<-dpois(k,2 plot(k,p,type= h Grafici variabili continue curve(dnorm(x, mean=0, sd=1,-5,5 12