Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n n ( Xi X ) 2 sono stimatori non distorti rispettivamente di media, varianza con media nota, e varianza. Per verificare che uno stimatore T di un parametro ψ(θ) non sia distorto deve valere che E θ [T ] = ψ(θ) Verifichiamo lo stimatore della media E θ [X] = n E θ [X i ] = n nµ = µ Verifichiamo lo stimatore della varianza con media nota E θ [σ 2 ] = n [ E θ (X i µ) 2] = σ 2 Verifichiamo lo stimatore della varianza E θ [ S 2] = n E θ [Xi 2 ] 2E θ [X X i } {{ } =nx 2 ] + ne θ [X 2 ] = = n A questo punto notiamo che dalla definizione di varianza E θ [X 2 i ] = V ar[x i ] + E θ [X i ] 2 = σ 2 + µ 2 { } E θ [Xi 2 ] ne θ [X 2 ]
e sostituendo E θ [X 2 ] = V ar[x] + E θ [X] 2 = σ2 n + µ2 E θ [ S 2] = { nσ 2 σ 2} = σ 2 n Esercizio 2 Sia {X n } n una famiglia di v.a. di media µ. Dire se i seguenti stimatori della media sono distorti. a) T = X, T = X+Xn 2, T = X 2X + X n. Nel caso in cui siano distorti trovare la costante di normalizzazione della distorsione. a) Non distorto b) Non distorto E θ [T ] = E θ [X ] = µ E θ [T ] = 2 (Eθ [X ] + E θ [X n ]) = µ c) Distorto E θ [T ] = E θ [X ] 2E θ [X ] + E θ [X n ] = 2µ La costante di normalizzazione è 2. Esercizio Sia X, X 2 un campione di numerosità 2 estratto da una popolazione con distribuzione f X (x) = 2x θ, con < x < θ. 2 a) Calcolare media e varianza della popolazione. b) Calcolare media e varianza dei due stimatori di θ: T = 2 X + X 2, T 2 = 2 X + 2 X 2 c) Quale dei due stimatori di θ è preferibile? a) E[X] = θ x 2x θ 2 dx = 2 θ 2 x θ = 2 θ V ar[x] = E[X 2 ] E[X] 2 = b) θ x 2 2x θ 2 dx 4 9 θ2 = 2 θ 2 E[T ] = 2 E[X ] + E[X 2] = 2 θ x 4 4 V ar[t ] = 4 9 V ar[t ] + 9 V ar[x 2] = 62 θ2 E[T 2 ] = 2 E[X ] + 2 E[X 2] = 2 θ θ 4 9 θ2 = = θ2 2 4 9 θ2 = θ2 8 2
V ar[t 2 ] = 4 V ar[x ] + 4 V ar[x 2] = θ2 6 c) Entrambi sono stimatori non distori della media della popolazione, tuttavia la varianza di T è maggiore di quella di T 2, quindi è preferibile il secondo stimatore. Esercizio 4 Sia X,..., X n un campione casuale semplice estratto da una v.a. N(µ, σ 2 ), con µ e σ 2 noti. Determinare la distribuzione della statistica T = 6 [T N(µ, nσ 2 /(2(n )))] X i + 2(n ) Ricordiamo che una combinazione lineare di una v.a. normale è ancora una v.a. normale. Determiniamone quindi la media e la varianza E[T ] = 6 E[X i ] + 2(n ) i=4 X i E[X i ] = 2 µ + 2 µ = µ i=4 V ar[t ] = 6 V ar[x i ] + 4(n ) 2 Quindi T N ( ) nσ µ, 2 2(n ). V ar[x i ] = 2 σ2 + i=4 4(n ) σ2 = = nσ 2 2(n ) Esercizio La durata delle telefonate urbane segue una distribuzione normale di media µ = minuti e scarto quadratico medio σ = minuti. Selezionato un c.c.s. di 2 telefonate, trovare la distribuzione della media campionaria e la probabilità che la durata media delle telefonate sia compresa fra 9. e. minuti. [N(,.4),.447] Siccome le osservazioni X i seguono una legge normale, anche la media campionaria X lo fa. La media di X è µ, mentre la varianza è data da σ2 n, quindi X N(,.4). Sia Z N(, ) { 2 9. P {9. X.} = P Z }. 2 = = P {.746 Z.4472} = Φ(.4472) Φ(.746) = = Φ(.4472) + Φ(.746) =.6764 +.777 =.4472
Esercizio 6 La resistenza al carico dei sacchetti di plastica utilizzati per contenere generi alimentari segue una distribuzione normale di media.2 kg e scarto quadratico medio Kg. Quale proporzione di sacchetti ha una resistenza al carico tra i 2.8 e i.4 Kg? Se si selezionano molti c.c.s di numerosità, quale proporzione di medie campionarie ci si aspetta tra i 2.8 e i.4 Kg? [.48,.27] Sia X N(.2, 2), la v.a. della resistenza al carico dei sacchetti di plastica. Sia inoltre Z N(.). { 2.8.2 P {2.8 X.4} = P Z }.4.2 = = P {.8 Z.4} = Φ(.4) Φ(.8) = Φ(.4) + Φ(.8) = =.9 +.88 =.478 Posto Z = X.2. Questa per il teorema del limite centrale si approssima con una N(, ). { 2.8.2 P {2.8 X.4} = P Z }.4.2 = = P {.488 Z.299} = Φ(.299) + Φ(.488) = =.876 +.67 =.279 Esercizio 7 La durata in ore delle pile prodotte da una ditta segue una distribuzione normale di media µ = ore e varianza σ 2 ignota. Osservata una varianza campionaria pari a 4 su un campione di n = pile, quale valore verrà superato con una probabilità del 9% dalla media campionaria? [88.46] Posto Z = X 4 questa si distribuisce con legge t di Student con 9 gradi di libertà. P {Z > t.9 } = P {X > t.9 4 + } = P {X > 88.46} =.9 Quindi il valore 88.46 viene superato con probabilità del 9% dalla media campionaria. Esercizio 8 Si è estratto un campione di abbonati al telefono e di questi avevano la segreteria telefonica. Si vuole stimare qual è, fra tutta la popolazione, la percentuale di segreterie telefoniche installate con un livello di confidenza di.9. [(.28,.8982)] La percentuale di abbonati con segreteria telefonica osservata è X =. Sia µ la percentuale da stimare e n =. Posto Z = n X µ si distribuisce approssimativamente con legge N(, ). X( X) 4
P { Z φ./2 } = = P X φ.97 X( X) µ X + φ.97 Un intervallo di confidenza di livello.9 per µ è quindi dato da [.28,.8982] X( X) Esercizio 9 Avendo osservato il campione (.2,.4,.6,.6) da una distribuzione normale con σ = si trovi un intervallo di confidenza di livello.9 per la media µ della popolazione. Come cambia l intervallo se non si conoscesse la varianza della popolazione? [(-.24,.64), (-.92, 6.2)] Innanzitutto calcoliamoci la media campionaria..2 +.4 +.6 +.6 X = = 2.7 4 e poniamo n = 4. Un intervallo di confidenza di livello.9 per la media della popolazione è dato da [ X φ./2 σ n, X + φ./2 σ n ] = [.299,.699] Se non si conoscesse la varianza, la stimiamo tramite S 2 = n n (X i X) 2 =.867. Dal momento che sono ignoti varianza e media, abbiamo il seguente intervallo di fiducia che fa uso della legge t di Student. [X t./2 (n ) S n, X + t./2 (n ) S n ] = [.928, 6.29] Esercizio Una ditta che produce detersivi sostiene che le sue confezioni di detersivo hanno un peso di 4.4 Kg con una deviazione standard di.7 Kg. Un dettagliante estrae un campione casuale di scatole di detersivo e rileva che il peso medio è di 4.2 Kg. Verificare se l affermazione della ditta è da rifiutare ai livelli di significativitá del % e dell % supponendo che il peso sia una variabile normalemente distribuita. [rifiuto con., accettazione con.] L ipotesi è H : µ 4.4 contro A : µ < 4.4. Posto Z = X 4.4.7 questa si distribuisce con legge N(, ) per il teorema del limite centrale. La regione critica di livello α è data da { {Z <.64484} α =. {Z < φ α } = {Z < 2.} α =. Posto X = 4.2, abbiamo che Z = 2.2. Questo valore cade nella regione critica di livello. ma non in quello di livello., quindi nel primo caso abbiamo il rifiuto dell ipotesi, mentre nel secondo l accettazione.
Esercizio Si sceglie un campione di allievi di una classe; si calcola l altezza media, che risulta di 7 cm, con uno scarto quadratico medio di 2 cm. Si vuole verificare, a livello di significatività di., se l altezza media degli allievi di tutta la popolazione scolastica con la stessa età è di 6 cm, supponendo la variabile normalmente distribuita. [accettazione] L ipotesi da verificare è H : µ = 6, contro A : µ 6. Calcoliamoci S = nσ n = 2 9 Posto Z = 9 X 6 2 questa si distribuisce con legge t di Student con 9 gradi di libertà. La regione critica di livello. è data da { Z t./2 (9)} = { Z.2499} Posto X = 7 abbiamo che Z =.2 cade fuori dalla regione critica e quindi l ipotesi è accettata. Esercizio 2 Si lancia per volte un dado e risulta che la faccia 6 si è presentata volte. Si chiede di decidere se il dado è truccato o regolare, ad un livello di significatività di.. I lanci del dado seguono una legge bernoulliana di parametro p ignoto. L ipotesi da verificare è H : p = 6, contro A : p 6. Poniamo Z = p 6 6 ( 6 ) che segue approssimativamente legge N(, ). La regione critica di livello. è data da { Z φ./2 } = { Z.99964} Posto p = abbiamo che Z =.777 cade dentro la regione critica e quindi l ipotesi è rifiutata. Esercizio Siano X, X 2 le medie di due c.c.s. di numerosità n estratti da una v.a. N(µ, σ 2 ). Determinare per quale valore di n si ha una probabilità del % che le due medie differiscano fra loro di più di σ. [n=6] Sia Y = X X 2. Questa ha legge normale di parametri µ = E[X X 2 ] = E[X ] E[X 2 ] = µ µ = e σ 2 = V ar[x X 2 ] = V ar[x ] + V ar[x 2 ] = 2σ 2 6
Sia Z = n Y µ σ allora abbiamo approssimativamente che Z N(, ) per il teorema del limite centrale. P { Z φ./2 } = P { } Y n2σ φ.9 = { = P Y φ.9 2σ n } = P { Y σ} =. Da cui φ.9 2σ n = σ n = 2φ 2.9 =.4 6 7