Campioameto casuale da popolazioe fiita (caso seza reiserimeto ) Suppoiamo di avere ua popolazioe di idividui e di estrarre u campioe di uità (co < ) Suppoiamo di studiare il carattere X che assume i valori x, x 2,, x su tutta la popolazioe, ossia X : Ω R w x w 2 x 2 w k x k w x dove ci possoo essere ache valori ripetuti Assumiamo che P (X = x k ) =, per ogi k =,, Ioltre µ = x k, k= σ 2 = (x k µ) 2 k= Ci soo due tipi di campioameto casuale: campioameto casuale semplice cioè co ripetizioe, el quale le estrazioi soo tra loro idipedeti e ogi uità può essere estratta più volte; ogi uità della popolazioe ha la stessa probabilità di essere selezioata, pari a / Questo tipo di campioameto produce gli stessi risultati ache el caso di popolazioe ifiita I questo caso i possibili campioi soo campioameto casuale seza ripetizioe, el quale ogi uità ha probabilità / di essere selezioata alla prima estrazioe, le rimaeti uità hao probabilità / ( ) alla secoda estrazioe (sapedo che cosa è stato estratto alla prima estrazioe) e così via I questo caso i possibili campioi soo ( ) se o si cota! l ordie, se si cota l ordie ( )! Aalizziamo el dettaglio il campioameto casuale seza ripetizioe Siao quidi X, X 2,, X variabili aleatorie campioarie corrispodeti alle varie estrazioi campioarie Procediamo co alcue osservazioi che servirao per dimostrare i prossimi risultati
Lemma Valgoo le segueti relazioi: i) E ( X i ) = µ; ii) E ( ) j=,i j X i X j = ( ) k= h=,h k x ( ) h x k Dimostrazioe: Abbiamo che per h k si ha che { j i ( ) P (X i = x k, X j = x h ) = 0 j = i e quidi P (X i = x k ) = h=,k h = P (X j = x h )P (X i = x k X j = x h ) ( ) = ossia P (X i = x k ) = P (X = x k ) per ogi i =,, Da questo segue che E (X i ) = = x k P (X i = x k ) k= x k P (X = x k ) = E(X) k= Ioltre si ha così che ( ) E X i = E (X i ) = E (X) = E (X) = x k = µ k= Calcolado esplicitamete la quatità E (X i X j ) = = k= h=,h k ( ) x h x k P (X i = x h, X j = x k ) k= h=,h k x h x k, si ha che E ( ) j=,i j X i X j = j=,i j E (X i X j ) = j=,i j k= h=,h k x ( ) k x h h= k=,h k x h x k = ( ) ( ) () Lemma 2 ( i a i ) 2 = i a 2 i + i,j,j i a i a j
La dimostrazioe di questo lemma è ua semplice applicazioe di procedimeti algebrici Proposizioe 3 Sia X è ua variabile aleatoria; allora X è stimatore o distorto di µ e la sua variaza è V ar ( X ) = σ2 Ua sua stima si ottiee sostituedo σ 2 co S 2 ; se X è ormale, u itervallo di cofideza per µ è ( ) X t α S ( ), X + t αs ( ) Dimostrazioe: Lo stimatore X di µ è o distorto, ifatti: E ( X ) = ( ) E X i = µ = µ Utilizzado i risultati otteuti elle osservazioi precedeti, si riesce a calcolare la variaza di X el seguete modo: V ar ( X ) ( ) = V ar X i = ( ) V ar X 2 i = V ar (X 2 i ) + 2 = V ar (X 2 i ) + 2 = V ar (X 2 i ) + 2 Ora utilizzado () e il Lemma 2, abbiamo che j=,j i j=,j i j=,j i Cov (X i, X j ) (E(X i X j ) E(X i )E(X j )) E(X i X j ) µ2 V ar ( X ) = σ2 + ( ) x h x k ( ) k= h=,h k µ2 = σ2 + ( ( ) ) 2 x 2 k + x k ( ) k= k= µ2 = σ2 + ( ) ( σ 2 µ 2 + 2 µ 2) ( ) µ2 = σ2
L itervallo di cofideza si ottiee co ua costruzioe aaloga al caso i cui X,, X soo idipedeti I questo cotesto X è acora ua va ormale, perché combiazioe di va ormali (ache se o idipedeti) Per gradi campioi la Proposizioe 3 si può estedere ache al caso i cui X o è ormale Se la umerosità della popolazioe è molto più grade di quella del campioe ( >> ), il coefficiete è circa e quidi può essere trascurato, otteedo così lo stesso risultato del caso di campioameto casuale semplice, cioè co ripetizioe Ioltre se allora V ar(x) = 0 perchè il campioe coicide co tutta la popolazioe, cosa che o può avveire el caso di campioe co ripetizioe, i cui avremo V ar(x) = σ 2 σ2 Ioltre avremo che V ar(x seza rip ) < V ar(x co rip ) i quato gli elemeti aomali el campioameto seza ripetizioe vegoo cotati solo ua volta Vediamo u applicazioe el caso dello studio della frequeza di ua caratteristica ella popolazioe, partedo da u campioe Idichiamo i questo caso co ˆx i la realizzazioe della i esima variabile campioaria X i Avremo che ˆx i sarà uguale a (si verifica il carattere) o 0 (o si verifica) ell i esima estrazioe Avremo che il parametro da stimare sarà k= x k p = e, dato u campioe X, X 2,, X, lo stimatore da utilizzare sarà P = X i Proposizioe 4 Sia X ua va co distribuzioe di Beroulli di parametro p Valgoo i segueti fatti: i) P è uo stimatore o distorto di p Si può quidi stimare p co ˆp = ˆx i ; ii) V ar (P ) = p( p) iii) U itervallo di cofideza per p è ; ua sua stima si ottiee sostituedo p co ˆp; P z α P ( P ) P ( P ), P + z α
ESEMPIO : I ua scatola ci soo 5 pallie, di cui tre ere idicate co, 2 e 3 e due biache idicate co B e B 2 La frequeza relativa di pallie ere della scatola è 3 = 0, 60 Si vuole stimare tale valore attraverso campioi di umerosità 5 = 2 Idichiamo co X la variabile aleatoria corrispodete alla prima estrazioe e co X 2 la variabile aleatoria corrispodete alla secoda estrazioe Si ha che = 5, = 2 e p = 0, 6 Si vuole cercare la stima della proporzioe, cioè ˆp Usiamo come stimatore i etrambi i campioameti P = S 2 = X + X 2 2 Costruiamo ua tabella co tutti i possibili campioi e i relativi valori della stima della proporzioe Campioameto co ripetizioe Il umero dei possibili campioi (ordiati) è = Sia S = X + X 2 e sia s il rispettivo valore campioario La tabella co tutti i possibili campioi e i relativi valori della stima della proporzioe è la seguete: umero campioe Campioe va campioarie Proporz camp Somma s (, ) (, ) 2 2 (, 2 ) (, ) 2 3 (, 3 ) (, ) 2 4 (, B ) (, 0) /2 5 (, B 2 ) (, 0) /2 6 ( 2, ) (, ) 2 7 ( 2, 2 ) (, ) 2 8 ( 2, 3 ) (, ) 2 9 ( 2, B ) (, 0) /2 ( 2, B 2 ) (, 0) /2 ( 3, ) (, ) 2 2 ( 3, 2 ) (, ) 2 3 ( 3, 3 ) (, ) 2 4 ( 3, B ) (, 0) /2 5 ( 3, B 2 ) (, 0) /2 6 (B, ) (0, ) /2 7 (B, 2 ) (0, ) /2 8 (B, 3 ) (0, ) /2 9 (B, B ) (0, 0) 0 0 20 (B, B 2 ) (0, 0) 0 0 2 (B 2, ) (0, ) /2 22 (B 2, 2 ) (0, ) /2 23 (B 2, 3 ) (0, ) /2 24 (B 2, B ) (0, 0) 0 0 (B 2, B 2 ) (0, 0) 0 0 Campioameto seza ripetizioe I questo caso il umero dei possibili campioi o ordiati è ( ( ) ) = 5 2 = e quelli ordiati è 5! = 20 La tabella co tutti i possibili 3!
campioi (ordiati) e i relativi valori della stima della proporzioe è la seguete: umero campioe Campioe va campioarie Proporz camp Somma s (, 2 ) (, ) 2 2 (, 3 ) (, ) 2 3 (, B ) (, 0) /2 4 (, B 2 ) (, 0) /2 5 ( 2, ) (, ) 2 6 ( 2, 3 ) (, ) 2 7 ( 2, B ) (, 0) /2 8 ( 2, B 2 ) (, 0) /2 9 ( 3, ) (, ) 2 ( 3, 2 ) (, ) 2 ( 3, B ) (, 0) /2 2 ( 3, B 2 ) (, 0) /2 3 (B, ) (0, ) /2 4 (B, 2 ) (0, ) /2 5 (B, 3 ) (0, ) /2 6 (B, B 2 ) (0, 0) 0 0 7 (B 2, ) (0, ) /2 8 (B 2, 2 ) (0, ) /2 9 (B 2, 3 ) (0, ) /2 20 (B 2, B ) (0, 0) 0 0 Calcoliamo ora la legge di X, cioè quate volte X vale rispetto al umero dei campioi, e la di X 2 Campioameto co ripetizioe Le leggi di X e X 2 soo rispettivamete P (X = ) = 5 = 3 5 P (X = 0) = 3 5 = 2 5 P (X 2 = ) = 5 = 3 5 P (X 2 = 0) = 3 5 = 2 5 Campioameto seza ripetizioe Le leggi di X e X 2 soo soo rispettivamete P (X = ) = 3 5 P (X 2 = ) = P (X 2 = X = 0)P (X = 0) + P (X 2 = X = )P (X = ) = 3 4 2 5 + 2 4 3 5 = 3 5 e di cosegueza P (X = 0) = 3 5 = 2 5, P (X 2 = 0) = 3 5 = 2 5
Gli stessi calcoli si otteevao utilizzado la tabella precedete; ifatti P (X = ) = 2 20 = 3 5 P (X 2 = ) = 6 8 8 20 + 6 2 2 20 = 3 5 Di cosegueza X e X 2 hao la stessa distribuzioe di probabilità Calcoliamo la distribuzioe, la media e la variaza dello stimatore P, utilizzado i dati della tabella precedete Campioameto co ripetizioe La desità di P è metre la sua media è P 0 /2 f P 4 E (P ) = 0 = 3 5 2 9 4 + 2 2 + 9 = 0, 6 = p Quidi P è stimatore o distorto di p Calcoliamo ora la variaza dello stimatore della proporzioe: Si ha che quidi V ar (P ) = E ( P 2) E 2 (P ) E ( P 2) ( ) 4 2 = 0 + 2 2 + 9 = 2, V ar (P ) = 2 ( ) 3 2 = 3 5 = 0, 2, che coicide co la formula V ar(p ) = p( p) Campioameto seza ripetizioe La desità di P è metre la sua media è: P 0 /2 f P E (P ) = 0 6 3 + 2 6 + 3 = 3 = 0, 6 = p 5
e E ( P 2) = 4 6 + 3 quidi = 9 20 V ar(p ) = 9 20 9 = 0, 09, che coicide co la formula V ar(p ) = p( p) Quidi P è acora uo stimatore o distorto di p, ma come ci aspettiamo la variaza el campioameto seza ripetizioe (0,09) è miore che el campioameto co ripetizioe (0,2) ESEMPIO 2: Ua scatola cotiee = 3 pallie di colore rosso e di colore blu Si estraggoo = pallie Idichiamo co p la proporzioe di pallie blu coteute ella scatola e co ˆp la proporzioe di pallie di colore blu coteute el campioe Determiiamo lo stimatore P di p, la media e la variaza di P, ei casi di campioameto co e seza ripetizioe Campioameto co ripetizioe Se B è il umero di pallie blu estratte, allora lo stimatore P di p è di media e variaza P = X + + X E (P ) = p e V ar (P ) = p ( p) = 0, 02p( p) e la stima putuale è B Campioameto seza ripetizioe Se B è il umero di pallie blu estratte, allora lo stimatore P di p è acora di media e variaza E (P ) = p e V ar (P ) = P = X + + X p ( p) 3 3 = 0, 07 p ( p) e la stima putuale è B Suppoiamo che il campioe cotega 30 pallie di colore blu; costruiamo l itervallo di cofideza per p a livello 95%, sempre ei casi di campioameto co e seza ripetizioe Campioameto co ripetizioe Siccome B = 30, abbiamo che ˆp = B = 30 = 0, 6
U itervallo di cofideza per p a livello di sigificatività del 95% è: 0, 6 z 0,05, 0, 6 + z 0,05 Per ua ormale stadardizzata si trova che z 0,05 =, 96, quidi l itervallo cercato è 0, 6, 96, 0, 6 +, 96 = (0, 46, 0, 74) Campioameto seza ripetizioe Per quato visto i precedeza, poiché ˆp = 0, 6 e z α =, 96, si ha che u itervallo di cofideza per p a livello di sigificatività del 95% è 0, 6, 96 300, 0, 6 +, 96 349 300 = (0, 47, 0, 73) 349 Osserviamo che i etrambi i tipi di campioameto P è uo stimatore o distorto della proporzioe p el caso di campioameto seza ripetizioe, la variaza di P è miore rispetto alla variaza di P el caso di campioameto co ripetizioe Ioltre l itervallo di cofideza el campioameto seza ripetizioe ha ampiezza miore ella pratica, l estrazioe co ripetizioe viee adottata raramete: è ituitivo che, fissata la dimesioe del campioe, l osservazioe ripetuta di ua o più uità rappreseti ua perdita di iformazioe La distizioe tra estrazioe co e seza ripetizioe perde gradualmete di importaza all aumetare della dimesioe della popolazioe di rilevazioe