Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto e quale è il più efficiente:. E(S) θ +, Var(S) 3, E(T ) θ, Var(T ) 8;. E(S) θ +, Var(S) 5, E(T ) θ, Var(T ) 6; 3. E(S) θ, Var(S) 6, E(T ) θ, Var(T ) 4. Soluzione dato da: quindi si ha che In generale l errore quadratico medio di uno stimatore T (X) di θ è EQM[T (X)] Var(T (X)) + [E(T (X)) θ],. EQM(S) (θ + θ) + Var(S) 3 + 7, EQM(T ) Var(T ) 8. Lo stimatore S(X) risulta essere lo stimatore più efficiente.. EQM(S) (θ + θ) + Var(S) 5 + 9, EQM(T ) (θ θ) + Var(T ) 6 + 7. Lo stimatore T (X) risulta essere lo stimatore più efficiente. 3. EQM(S) Var(S) 6, EQM(T ) (θ θ) + Var(T ) + 4 5. Lo stimatore T (X) risulta essere lo stimatore più efficiente.
Esercizio Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π, con (0 < π < ), e sia uno stimatore di π. Determinare: T (X) X + X + X 3, 5. Se lo stimatore T è corretto. Nel caso che non lo sia, calcolare la sua distorsione.. Calcolare l errore quadratico medio di T. Soluzione Se X Ber(π), allora X, X, X 3 Ber(π) e quindi si può dedurre che E(X i ) π e Var(X i ) π( π), i,, 3.. Per verificare la proprietà di correttezza dello stimatore occorre calcolare il suo valore atteso: ( ) X + X + X 3 E(T (X)) E 5 E(X ) + E(X ) + E(X 3 ) π + π + π 4π 5 5 5. Quindi lo stimatore T (X) non è corretto e la sua distorsione d(t (X)) 4/5π π /5π.. La varianza dello stimatore è data da: Var(T (X)) ( ) X + X + X 3 Var Var(X ) + 4Var(X ) + Var(X 3 ) 5 5 π( π) + 4π( π) + π( π) 6π( π). 5 5 quindi l EQM(T (X)) sarà EQM(T (X)) d(t (X)) + Var(T (X)) 5 π + 6π( π) 5 Esercizio 3 Siano X e X due variabili aleatorie indipendenti estratte da una popolazione normale di media µ e di varianza σ, e sia T X X X uno stimatore della varianza. Determinare se lo stimatore T è corretto. Nel caso che non lo sia, calcolare la sua distorsione.
Soluzione Per verificare la proprietà di correttezza occorre calcolare il seguente valore atteso: E[T (X)] E(X X X ) E(X ) E(X X ) σ + µ µ σ. () Quindi lo stimatore T (X) risulta corretto. Da notare che nell ultima passaggio sono state usate le seguenti due proprietà:. E(X ) Var(X) + [E(X)] σ + µ.. E(X X ) E(X )E(X ) µ µ µ (indipendenza + le variabili X e X sono ugualmente distribuite). Esercizio 4 Data una popolazione con media µ e varianza σ si consideri il seguente stimatore della media T n /3X + /3X +... + /3X n. Si dica per quali valori di n lo stimatore risulta corretto, e se la sua varianza cresce al crescere di n. Soluzione Lo stimatore risulta corretto per n 3, infatti Inoltre E(T n ) E(/3X + /3X +... + /3X n ) /3nE(X) /3nµ /3nµ µ /3n Var(T n ) V ar(/3x + /3X +... + /3X n ) /9nσ quindi la varianza dello stimatore cresce con n. Esercizio 5 Data una popolazione con media µ e varianza σ, calcolare l errore quadratico medio del seguente stimatore della media della popolazione T n 4 X + 3 ( ) X +... + X n. 4 n 3
Soluzione Dato che E(T n ) E [ 4 X + 3 4 ( )] X +... + X n n ) 4 E(X ) + 3 4 E ( X +... + X n n il EQM(T) sarà uguale alla sua varianza: 4 µ + 3 4 µ µ, EQM(T ) Var(T ) 6 Var(X ) + 9 6 Var 6 σ + 9 (n ) 6 (n ) σ ( ) X +... + X n n (n + 8) 6(n ) σ Esercizio 6 Si verifichi che il seguente stimatore T n del valore medio E(X) di una variabile casuale X è consistente in probabilità 0.8 X + 0. n X + 0. n X 3 + + 0. n X n Soluzione Uno stimatore T n di un parametro θ (µ in questo caso) di una variabile casuale X è consistente in probabilità se lim P ( T n θ < ϵ). Si ricorda che n uno stimatore T n di un parametro θ (µ in questo caso) di una variabile casuale X è asintoticamente non distorto se lim E(T n θ) 0. Per la disuguaglianza di n Chebyshev condizioni sufficienti affinché uno stimatore T n di un parametro θ sia consistente in probabilità sono i) che sia asintoticamente non distorto e ii) che la sua varianza tenda a zero per n tendente ad infinito, in simboli lim E(T n θ) 0 n e lim E(T n θ) lim V ar(t n ) 0. Risulta infatti: n n P ( T n E(T n )) < ϵ) V ar(t n) ϵ ϵ > 0 Utilizzando la i) ( lim n E(T n ) θ) si ottiene: P ( T n θ) < ϵ) V ar(t n) ϵ ϵ > 0 quantità che tende ad per n tendente ad infinito essendo valida la ii). 4
Si verifica facilmente che lo stimatore T n è non distorto. E(T n ) 0.8 E(X ) + 0. n E(X ) + 0. n X 3 + + 0. n E(X n) 0.8 µ + 0. n n µ µ avendo indicato con µ il valore medio di X. La varianza di T n risulta: V ar(t n ) 0.8 V ar(x ) + 0. (n ) E(X ) + 0. (n ) X 3 + + 0. (n ) E(X n) (0.64 + 0.04 (n ) ) σ avendo indicato con σ la varianza di X. La varianza dello stimatore non tende a zero per n tendente ad infinito. Lo stimatore non è consistente in probabilità. Esercizio 7 Si estragga con rimessa da una popolazione normale di media µ e varianza un campione casuale (X, X ) di due unità. Volendo stimare il parametro µ si considerino i seguenti stimatori T, 3 X + 3 X T, X + X Verificare che tali stimatori siano corretti, determinare quello più efficiente e calcolare il rapporto di efficienza (R.: T, è più efficiente). Soluzione Visto che le unità estratte dalla popolazione sono i.i.d. il valore atteso degli stimatori si può scrivere come: ( E(T, ) E 3 X + ) 3 X 3 E(X ) + 3 E(X ) 3 µ + 3 µ µ () ( E(T, ) E X + ) X E(X ) + E(X ) µ + µ µ (3) 5
Per verificare quale sia lo stimatore più efficiente è necessario calcolare l errore quadratico medio (EQM), dato dalla somma della varianza dello stimatore più il quadrato della sua distorsione. Poiché entrambi gli stimatori sono corretti si ha che: ( EQM(T, ) Var(T, ) Var 3 X + ) 3 X 4 9 Var(X ) + 9 Var(X ) 4 9 σ + 9 σ 5 9 σ, (4) ( EQM(T, ) Var(T, ) Var X + ) X 4 Var(X ) + 4 Var(X ) 4 σ + 4 σ σ, (5) Da cui possiamo concludere che lo stimatore più efficiente è T,. Inoltre, se due stimatori sono corretti il rapporto di efficienza sarà pari al rapporto tra le varianza degli stimatori: e EQM(T,n) EQM(T,n ) Var(T,n) Var(T,n ) 5/9σ 0/9 (6) /σ Esercizio 8 Sia π la proporzione di unità che possiedono una certa caratteristica in una determinata popolazione. Consideriamo lo stimatore di π T 4 X + 3 4 X Stabilire se è uno stimatore corretto e calcolare la sua varianza per π 0.3. Determinare il valore dello stimatore (stima) se si osserva il campione (X, X 0). Soluzione Poiché la popolazione da cui è stato estratto il campione si distribuisce secondo la legge di una bernoulliana di media π, (X Ber(π)), lo stimatore è corretto, infatti E(T ) E( 4 X + 3 4 X ) 4 E(X ) + 3 4 E(X ) 4 π + 3 4 π π 6
Inoltre Var(T ) 6 Var(X ) + 9 6 Var(X ) 6 π( π) + 9 0 π( π) π( π) 6 6 quindi, per π 0.3, abbiamo Var(T ) 0.3. In corrispondenza del campione (X, X 0) lo stimatore T assume il valore: T 4 X + 3 4 X 4 + 3 4 0 4 Esercizio 9 Data una popolazione con media µ e varianza σ si consideri il seguente stimatore della media T X + 4 X + ax 3. Si dica per quali valori di a lo stimatore risulta corretto e calcolarne la varianza. Determinare il valore dello stimatore (stima) se si osserva il campione (X 4, X, X 3 6). Soluzione Sapendo che ( E(T ) E X + ) 4 X + ax 3 E(X ) + 4 E(X ) + ae(x 3 ) ( ) 3 4 + a µ e che uno stimatore corretto della media è uno stimatore T tale che E(T ) µ, ( ) 3 E(T ) 4 + a µ µ a 4 allora lo stimatore sarà corretto per a 4 0.5. Se a 4, allora ( Var(T ) Var X + 4 X + ) 4 X 3 4 Var(X )+ 6 Var(X )+ 6 Var(X 3) 6 6 σ In corrispondenza del campione (X 4, X, X 3 6) lo stimatore T assume il valore: T X + 4 X + 4 X 3 4 + 4 + 4 6 4 7
Esercizio 0 Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π, con (0 π ), e si considerino i seguenti tre stimatori del valor medio π sulla base di un campione di numerosità (X, X ): T X + X T X, X, T 3 X 4 + X 4 Determinare con riferimento a ciascuno stimatore:. la distribuzione di probabilità. la correttezza 3. l errore quadratico medio. Soluzione Se X Ber(π), allora X, X Ber(π) e quindi si può dedurre che E(X i ) π e V ar(x i ) π( π), i,.. Per determinare la funzione di probabilità dei tre stimatori si calcolano le probabilità dei campioni e i valori dei tre stimatori in ciascun campione: X +X X X +X 4 (X, X ) p(x, X ) (0, 0) ( π) 0 0 0 (, 0) π( π) 4 (0, ) ( π)π 0 4 (, ) π La funzioni di probabilità dei tre stimatori risultano: X p( X) 0 ( π) π( π) π X p(x ) 0 ( π) π X +X p( X +X ) 4 4 0 ( π) π( π) 4 π 8
Il valor medio e la varianza dei tre stimatori risultano: E(T ) E( X) E( X + X ) π + π π E(X) per esteso utilizzando la distribuzione di probabilità dello stimatore: E(T ) E( X) 0 ( π) + π( π) + π π E(X) V ar(t ) V ar( X) V ar( X + X ) π 4 + π 4 π V ar(x) EQM(T ) per esteso utilizzando la distribuzione di probabilità dello stimatore: V ar(t ) V ar( X) (0 π) ( π) + ( π) π( π) + ( π) π π( π) V ar(x) E(T ) E(X ) E(X) π V ar(t ) V ar(x ) V ar(x) π( π) EQM(T ) E(T 3 ) E ( X 4 + X ) 4 π 4 + π 4 π 9
per esteso utilizzando la distribuzione di probabilità dello stimatore: E(T 3 ) E( X 4 + X 4 ) 0 ( π) + 4 π( π) + π (7) π Quindi lo stimatore T 3 non è corretto e la sua distorsione risulta: D(T ) π π π ( X V ar(t 3 ) V ar 4 + X ) 4 π( π) 6 + π( π) 6 π( π) 8 per esteso utilizzando la distribuzione di probabilità dello stimatore: V ar(t 3 ) V ar( X 4 + X π( π) 8 quindi l EQM(T ) sarà 4 ) (0 π) ( π) + ( 4 π) π( π) + ( π) π EQM(T 3 ) V ar(t ) + D(T ) π( π) 8 + ( π π) π( + π) 8 Le rappresentazioni grafiche delle distribuzioni di probabilità dei tre stimatori sono rappresentate in figura per un valore di π 0.5. Confrontando gli errori quadratici medi dei tre stimatori risulta: EQM(T ) < EQM(T ) π Il confronto tra EQM(T ) e EQM(T 3 ) comporta il confronto tra V ar(t ) e EQM(T 3 ). Si osserva: π( + π) π( π) EQM(T 3 ) > V ar(t ) > π > 3 8 5 0.6 Quindi la scelta tra T e T 3 dipende dal valore di π. Per valori di π minori di 0.6 è più efficiente T 3, per valori di π maggiori di 0.6 è più efficiente T. Ma il valore di π è incognito e pertanto non risulta possibile scegliere tra i due stimatori. Si consideri ora la numerosità campionaria. In generale per una generica numerositià campionaria: 0
probabilità 0.0 0. 0. 0.3 0.4 0.5 probabilità 0.0 0. 0. 0.3 0.4 0.5 probabilità 0.0 0. 0. 0.3 0.4 0.5 0 0.5 T 0 T 0 0.5 0.5 T3 EQM(T, π) 0.00 0.05 0.0 0.5 0.0 0.5 T T T3 0.0 0. 0.4 0.6 0.8.0 π Risulta: T n n (X i ) X T 3 n n (X i ) E(T ) ne(x) E(X) n
L 0.00 0.05 0.0 0.5 0.0 0. 0.4 0.6 0.8.0 π EQM(T ) V ar(t ) n nv ar(x) n V ar(x) E(T 3 ) n E(X) ne(x) ; D(T 3 ) (E(X) E(X)) EQM(T 3 ) V ar(t 3 ) + D(T 3 ) 4n nv ar(x) + ( E(X)) Si osserva che mentre non risulta possibile scegliere tra T e T 3 per n finito, al crescere di n EQM(T 3 ) non tende a zero, al contrario di V ar(t ). La media campionaria T X risulta quindi la stima migliore. Esercizio Definire la funzione di verosimiglianza e determinare lo stimatore di massima verosimiglianza del parametro π di una variabile casuale di Bernoulli in presenza di un campione di ampiezza n 3. Calcolare la stima di massima verosimiglianza per il campione (X, X, X 3 0). Soluzione Si ricorda che la funzione di probabilità di una variabile casuale di Bernoulli di parametro π è πi x ( π) x i, x i 0,, (0 π ). L(π) 3 π xi ( π) x i π 3 xi ( π) 3 3 x i Lo stimatore di π di massima verosimiglianza si ottiene massimizzando la funzione di verosimiglianza. Derivare L(π) o il suo logaritmo conduce allo stesso risultato
(essendo il logaritmo una funzione monotona). La derivata prima del logaritmo della funzione di verosimiglianza rispetto a π risulta: d dπ log(l(π)) d 3 dπ 3 x i π x i log(π) + (3 (3 3 x i) ( π) Uguagliando a zero la derivata prima si ottiene: 3 x i ) log( π) ( π) 3 x i π (3 3 x i ) 0 3 x i 3 X. La derivata seconda risulta negativa nel punto in da cui risulta ˆπ cui si annulla la derivata prima pertanto il valore trovato è un punto di massimo per la funzione di verosimiglianza (escludendo i casi π 0 e ). La stima di massima verosimiglianza di π in corrispondenza del campione (X, X, X 3 0) risulta 0.67 (punto di massimo in figura). 3 Esercizio Definire la funzione di verosimiglianza e determinare lo stimatore di massima verosimiglianza del parametro µ di una variabile casuale Normale nel caso di varianza nota pari a 4 in presenza di un campione di ampiezza n 0. Calcolare la stima di massima verosimiglianza per il campione (X, X 3, X 3 4, X 4 3, X 5 4, X 6 4, X 7 3, X 8 4, X 9, X 0 3). Lo stimatore di µ di massima verosimiglianza si ottiene massimizzando la funzione di verosimiglianza. Derivare L(µ) o il suo logaritmo conduce allo stesso risultato (essendo il logaritmo una funzione monotona). La derivata prima del logaritmo della funzione di verosimiglianza rispetto a µ risulta: L(µ) 0 σ (π) e σ (x i µ) (σ π) 0 e σ 0/ (x i µ) log(l(µ)) 0 log(σ ) 0 log(π) σ 0 (x i µ) log(l(µ)) 0 log(4) 0 log(π) 4 ( ( µ) + 4 (3 µ) + 4 (4 µ) ) 3
L 30 8 6 4 0 8 0 3 4 5 6 µ n x i Uguagliando a zero la derivata prima si ottiene ˆµ X. La derivata n seconda risulta negativa nel punto in cui si annulla la derivata prima pertanto il valore trovato è un punto di massimo per la funzione di verosimiglianza. La stima di massima verosimiglianza di µ in corrispondenza del campione (X, X 3, X 3 4, X 4 3, X 5 4, X 6 4, X 7 3, X 8 4, X 9, X 0 3) risulta 3. (punto di massimo in figura). 3 0 Esercizio 3 Si estraggano con rimessa da una popolazione normale di media µ e varianza σ un campione casuale di n unità e un campione casuale di n unità (nn+n). Volendo stimare il parametro µ si considerino i seguenti stimatori T ( T (n X X+ X ) X+nX) n n x i n n, X x i n Verificare se tali stimatori siano corretti, determinare quello più efficiente e calcolare il rapporto di efficienza. Soluzione Si verifica facilmente che i due stimatori sono corretti. Visto che le unità estratte dalla popolazione sono i.i.d. le varianze degli stimatori e il rapporto di efficienza risultano: V ar(t ) σ n 4nn 4
V ar(t ) σ n V ar(t ) 4 n n V ar(t ( ) ) n n Infatti la funzione f(x) x( x) 0.5 se x varia nell intervallo (0,). I due stimatori hanno la stessa efficienza solo se n n, nel qual caso T T. Esercizio 4 Definire la funzione di verosimiglianza e determinare lo stimatore di massima verosimiglianza del parametro λ di una variabile casuale Esponenziale in presenza di un campione di ampiezza n 0. Calcolare la stima di massima verosimiglianza per il campione (X, X, X 3 3, X 4 3, X 5, X 6, X 7, X 8, X 9 4, X 0 ). Lo stimatore di λ di massima verosimiglianza si ottiene massimizzando la funzione di verosimiglianza. Derivare L(λ) o il suo logaritmo conduce allo stesso risultato (essendo il logaritmo una funzione monotona). La derivata prima del logaritmo della funzione di verosimiglianza risulta: L(λ) 0 λ e λ x i λ n e λ 0 x i 0 log(l(λ)) n log(λ) λ x i 0 log(λ) λ 0 Uguagliando a zero la derivata prima rispetto a λ si ottiene ˆλ n n X. x i La derivata seconda risulta negativa nel punto in cui si annulla la derivata prima pertanto il valore trovato è un punto di massimo per la funzione di verosimiglianza. La stima di massima verosimiglianza di λ in corrispondenza del campione (X, X, X 3 3, X 4 3, X 5, X 6, X 7, X 8, X 9 4, X 0 ) risulta 0 0.5. 0 Esercizio 5 Al capolinea della corriera che collega due centri urbani il tempo di attesa (in minuti) è una variabile aleatoria Uniforme X definita nell intervallo (0, θ). Sulla base del seguente campione (X 5, X 7, X 3 3, X 4 0, X 5 9, X 6, X 7 6, X 8 4) (a) determinare la stima di massima verosimiglianza di θ b) calcolare il valore della funzione di ripartizione in corrispondenza deil valori x 6 e x 3. 5
Soluzione a) La funzione di densità della variabile aleatoria uniforme in (a, b) è p(x) x in (a, b). La funzione di densità della variabile aleatoria uniforme (b a) in (0, θ) è p(x) x in (0, θ) θ La funzione di verosimiglianza risulta: L(θ) 8 θ θ 8 sex iin(0, θ) In tal caso non si può procedere per derivazione per ottenere la stima di massima verosimiglianza. Si osserva che la funzione di verosimiglianza è massima quando θ è minimo, sotto la condizione che θ X i i,...8. La stima desiderata risulta pertanto ˆθ b) F (6) P (X 6) F (3) P (X 3) 6 3 0.5 0.5 Esercizio 6 Al fine di valutare l opportunità di installare, in azienda, una seconda linea telefonica, si vuole determinare la probabilità p di trovare libera la linea esistente. In 7 occasioni indipendenti si è osservato il numero di prove necessarie per trovare libero il centralino, ottenendo i valori (X, X 4, X 3 7, X 4, X 5 4, X 6, X 7 5). (a) Determinare la stima di massima verosimiglianza di p. (b) Determinare la probabilità di dover fare due tentativi prima di trovare la linea libera. Soluzione (a) La variabile aleatoria che descrive il fenomeno è una variabile aleatoria X geometrica di parametro p con funzione di probabilità p(x x) ( p) x p e descrive il numero di tentativi prima di trovare la linea libera. La funzione di verosimiglianza e di log verosimiglianza risultano: L(p) 7 ( p) x i p ( p) 7 x i n p n 7 log(l(p)) ( x i n) log( p) + n log(p) 6
da cui risulta ˆp 7 7 x i X 0.8. (b) La probabilità di fare tentativi per trovare la linea libera è: P (X ) ( p) p ( 0.8) 0.8 0. 7