N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume in un determinato anno è stata del 7,1%. L anno seguente sono state effettuate 5 rilevazioni e la concentrazione di sostanze inquinanti è risultata pari a x =7,07% con s=0,0265. A un livello di significatività α=0,05 possiamo affermare che il valore medio della concentrazione è diverso da quello riscontrato nell anno precedente? (Si supponga che la concentrazione segua un andamento normale) Soluzione Esercizio 1 Dati disponibili: μ 0 =7,1 (media di popolazione) x =7,07 (media osservata sul campione) s=0,0265 (deviazione standard del campione) n=5 (numerosità del campione) α=0,05 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 7,1 H 1 : μ 7,1 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) N.B. Il simbolo ~ (la tilde) va letto si distribuisce come. Quindi, la formula precedente va letta = si distribuisce come una di Student con n-1 gradi di libertà. 7,07 7,1 Il valore della statistica test è = = 2, 53. (0,0265 5) Dal momento che l ipotesi H 1 è di tipo bidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta dalle due code (una a destra e una a sinistra) della distribuzione considerata. Avendo scelto un livello di significatività α=0,05, le due code avranno complessivamente un area pari a 0,05 e cioè 0,025 ciascuna. Quindi, bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,975 (che è il complemento a 1 di 0,025, cioè 0,975+0,025=1). I gradi di libertà sono 4. Infatti, n=5 e i gradi di libertà sono n-1=5-1=4. Si osserva che il valore della 0,025, con 4 gradi di libertà è pari a 2,77645.
Vuol dire che la coda di destra inizia al valore 2,77645 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Però, la distribuzione è simmetrica (vale 0 al centro), e bisogna anche considerare la coda di sinistra. Questa inizia in corrispondenza del valore -2,77645 e si cade nella zona di rifiuto se con la formula otteniamo un valore inferiore (per esempio -3). Allora, la valutazione può essere fatta considerando il valore assoluto, ed essendo = -2,53 = 2,53 < 2,77645 = 0,025 (4 GdL), non si rifiuta l ipotesi nulla H 0, cioè, non possiamo affermare che il livello di concentrazione sia diverso da quello dell anno precedente. Sviluppo: Lasciando costante la deviazione standard, pari a 0,0265, quale doveva essere la concentrazione per poter rifiutare H 0, cioè per poter dire che la concentrazione era differente rispetto all anno precedente? Per cadere nella zona di rifiuto, con la formula si doveva ottenere un valore superiore a 2,77645 o inferiore a -2,77645. Per determinare a che livello di concentrazione corrispondono questi due valori si effettua il seguente calcolo: Se x μ = allora si ricava che x = + μ0 0 Considerando la coda di destra, cioè il valore 2,77645, si ottiene: x = 2,77645 (0,0265 5) + 7,1 = 7,265 Considerando invece la coda di sinistra, cioè il valore -2,77645, si ottiene: x = 2,77645 (0,0265 5) + 7,1 = 6,935 Quindi, avremmo rifiutato H 0, accettando di conseguenza l ipotesi alternativa H 1, nel caso avessimo osservato valori di concentrazione superiori a 7,265 o inferiori a 6,935.
Esercizio 2 Una fabbrica di automobili utilizza guarnizioni per i freni con una durata media pari a 20mila chilometri. ale ditta sta considerando di sostituirle con un altro tipo di guarnizioni che dovrebbe avere una durata maggiore. Le nuove guarnizioni vengono montate su 64 auto e la loro durata media risulta pari a 22mila chilometri con una varianza stimata corretta pari a 4mila. Supponendo che la durata sia approssimativamente distribuita come una Normale, possiamo concludere che le nuove guarnizioni sono migliori delle precedenti? (Si consideri un livello di significatività pari a α =0,01). Soluzione Esercizio 2 Dati disponibili: μ 0 =20000 (media di popolazione) x =22000 (media osservata sul campione) s 2 =4000 (varianza del campione) n=64 (numerosità del campione) α=0,01 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 20000 H 1 : μ > 20000 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 22000 20000 Il valore della statistica test è = = 252, 96. ( 4000 64) Dal momento che l ipotesi H 1 è di tipo unidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta da una sola coda, in questo caso quella di destra della distribuzione considerata. Avendo scelto un livello di significatività α=0,01 bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,99 (che è il complemento a 1 di 0,01, cioè 0,99+0,01=1). I gradi di libertà sono 63. Infatti, n=64 e i gradi di libertà sono n-1=64-1=63. Nella tabella non esiste la riga relativa a 63 gradi di libertà e allora si considera quella del 60. Si osserva che il valore della 0,01, con 60 gradi di libertà è pari a 2,39012. Vuol dire che la coda di destra inizia al valore 2,77645 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Dal momento che 252,96 è superiore (e di un bel po ) al valore critico 2,39012, si rifiuta H 0, si accetta di conseguenza l ipotesi alternativa H 1 e si può affermare che le nuove guarnizioni hanno una durata superiore a quelle precedenti.
Sviluppo: Lasciando costante la varianza, pari a 4000, quale poteva essere come minimo la durata delle guarnizioni per poter rifiutare H 0? Per cadere nella zona di rifiuto, con la formula si doveva ottenere un valore superiore a 2,39012. Per determinare a quale durata corrisponde questo valore si effettua il seguente calcolo: Se x μ = allora si ricava che x = + μ0 0 quindi: x = 2,39012 ( 4000 64) + 20000 = 20018,9 Quindi, avremmo rifiutato H 0, accettando di conseguenza l ipotesi alternativa H 1, nel caso avessimo osservato una durata media nel campione anche solo superiore a 20018,9.
Esercizio 3 Una macchina produce bulloni di diametro pari a 8 cm. Studi effettuati sulla distribuzione del diametro hanno portato a ritenere che questa sia approssimativamente Normale con varianza pari a 1. Si ha il sospetto che la macchina sia fuori taratura (il diametro medio sia cambiato). Per verificare tale ipotesi, si estraggono casualmente 81 bulloni e si calcola il diametro medio che risulta pari a 7 cm. Possiamo concludere che la macchina sia tarata correttamente? (Si consideri un livello di significatività pari a α =0,05). Soluzione Esercizio 3 Dati disponibili: μ 0 =8 (media di popolazione) σ 2 =1 (varianza di popolazione) x =7 (media osservata sul campione) n=81 (numerosità del campione) α=0,05 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 8 H 1 : μ 8 La varianza di popolazione è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: x μ = ~ N(0,1) ( σ n) z 0 N.B. Il simbolo ~ (la tilde) va letto si distribuisce come. Quindi, la formula precedente va letta z= si distribuisce come una Normale con media=0 e varianza=1. In particolare, la Normale con queste caratteristiche (media=0 e varianza=1) è la Normale standardizzata. 7 8 Il valore della statistica test è z = = 9. ( 1 81) Dal momento che l ipotesi H 1 è di tipo bidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta dalle due code (una a destra e una a sinistra) della distribuzione considerata. Avendo scelto un livello di significatività α=0,05, le due code avranno complessivamente un area pari a 0,05 e cioè 0,025 ciascuna. Avendo scelto un livello di significatività α=0,05 bisogna guardare la tabella della Normale standardizzata. Se si prende in considerazione la abella A.1, a un area pari a 0,025 corrisponde z=-1,96. Quindi la coda di sinistra inizia in corrispondenza di z=-1,96. Dal momento che la distribuzione è simmetrica, la coda di destra inizierà in corrispondenza di z=1,96. Perciò, l ipotesi H 0 va rifiutata, e di conseguenza accettata l ipotesi alternativa
H 1, se il valore della statistica test calcolato con la formula esce dall intervallo [-1,96;1,96]. Nel nostro caso, il valore -9 è esterno all intervallo [-1,96;1,96] e quindi l ipotesi H 0 va rifiutata e di conseguenza si può dire che la macchina non sia tarata bene. Sviluppo: Entro quali limiti deve stare la media del campione per non rifiutare H 0, cioè per poter dire che la macchina è tarata bene? Per non cadere nella zona di rifiuto, con la formula si doveva ottenere un valore superiore a compreso nell intervallo [-1,96;1,96]. Per determinare a quale diametro corrispondono i valori critici, cioè gli estremi dell intervallo, si effettua il seguente calcolo: Se x μ = allora si ricava che x = z ( σ n) + μ0 ( σ n) z 0 Quindi, facendo riferimento all estremo superiore dell intervallo, cioè 1,96, si ha che: x = 1,96 ( 1 81) + 8 = 8,329 Per l estremo inferiore, cioè -1,96, invece si ottiene: x = 1,96 ( 1 81) + 8 = 7,671 Quindi, non avremmo rifiutato H 0 nel caso il diametro medio del campione fosse compreso nell intervallo [7,671;8,329].
Esercizio 4 Un medico sportivo utilizza un particolare test per misurare la condizione fisica degli atleti. Considerato un campione casuale di giocatori di calcio costituito da 25 atleti, si rileva un punteggio medio al test pari a 47,5, con s=4,8. Supponendo che i manuali indichino che il punteggio medio nel test sia distribuito normalmente e pari a 37,5. verificare se si può dire che il punteggio medio riscontrato nel campione sia migliore di quello di popolazione (Si consideri un livello di significatività pari a α =0,05). Soluzione Esercizio 4 Dati disponibili: μ 0 =37,5 (media di popolazione) x =47,5 (media osservata sul campione) s=4,8 (deviazione standard del campione) n=25 (numerosità del campione) α=0,05 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 37,5 H 1 : μ > 37,5 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 47,5 37,5 Il valore della statistica test è = = 10, 42. (4,8 25) Dal momento che l ipotesi H 1 è di tipo unidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta da una sola coda, in questo caso quella di destra della distribuzione considerata. Avendo scelto un livello di significatività α=0,05 bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,95 (che è il complemento a 1 di 0,05, cioè 0,95+0,05=1). I gradi di libertà sono 24. Infatti, n=25 e i gradi di libertà sono n-1=25-1=24. Si osserva che il valore della 0,05, con 24 gradi di libertà è pari a 1,71088. Vuol dire che la coda di destra inizia al valore 1,71088 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Dal momento che 10,42 è superiore al valore critico 1,71088, si rifiuta H 0, si accetta di conseguenza l ipotesi alternativa H 1 e si può affermare gli atleti del campione hanno punteggio medio nel test superiore a quello di popolazione. Sviluppo: Lasciando costante la deviazione standard, pari a 4,8, qual era il punteggio medio minimo con il quale veniva rifiutata l ipotesi H 0? Per cadere nella zona di rifiuto, con la formula si doveva ottenere un valore
superiore a 1,71088. Per determinare a quale durata corrisponde questo valore si effettua il seguente calcolo: Se x μ = allora si ricava che x = + μ0 0 quindi: x = 1,71088 (4,8 25) + 37,5 = 39,14 Quindi, avremmo rifiutato H 0, accettando di conseguenza l ipotesi alternativa H 1, nel caso avessimo osservato nel campione di 25 atleti un punteggio medio nei test superiore a 39,14.
Esercizio 5 Se per un campione casuale di ampiezza n=16 estratto da una popolazione normale, si osserva x =56 e s=12, quale decisione prendo rispetto alle seguenti ipotesi? (Si consideri un livello di significatività pari a α =0,05). - H 0 : μ =50; H 1 : μ 50 - H 0 : μ =50; H 1 : μ >50 Soluzione Esercizio 5 Dati disponibili: μ 0 =50 (media di popolazione) x =56 (media osservata sul campione) s=12 (deviazione standard del campione) n=16 (numerosità del campione) α=0,05 (livello di significatività) Consideriamo il primo sistema di ipotesi: H 0 : μ = 50 H 1 : μ 50 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 56 50 Il valore della statistica test è = = 2. (12 16) Dal momento che l ipotesi H 1 è di tipo bidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta dalle due code (una a destra e una a sinistra) della distribuzione considerata. Avendo scelto un livello di significatività α=0,05, le due code avranno complessivamente un area pari a 0,05 e cioè 0,025 ciascuna. Quindi, bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,975 (che è il complemento a 1 di 0,025, cioè 0,975+0,025=1). I gradi di libertà sono 15. Infatti, n=16 e i gradi di libertà sono n-1=16-1=15. Si osserva che il valore della 0,025, con 15 gradi di libertà è pari a 2,13145. Vuol dire che la coda di destra inizia al valore 2,13145 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Però, la distribuzione è simmetrica (vale 0 al centro), e bisogna anche considerare la coda di sinistra. Questa inizia in corrispondenza del valore -2,13145 e si cade nella zona di rifiuto se con la formula otteniamo un valore inferiore (per esempio -3). Allora, la valutazione può essere fatta considerando il valore assoluto, ed essendo = -2 = 2 < 2,13145 = 0,025 (15 GdL), non si rifiuta l ipotesi nulla H 0, cioè, non possiamo affermare che il valore medio osservato nel
campione sia differente dal valor medio di popolazione. Consideriamo il secondo sistema di ipotesi: H 0 : μ = 50 H 1 : μ > 50 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 56 50 Il valore della statistica test è = = 2. (12 16) Dal momento che l ipotesi H 1 è di tipo unidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta da una sola coda, in questo caso quella di destra della distribuzione considerata. Avendo scelto un livello di significatività α=0,05 bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,95 (che è il complemento a 1 di 0,05, cioè 0,95+0,05=1). I gradi di libertà sono 15. Infatti, n=16 e i gradi di libertà sono n-1=16-1=15. Si osserva che il valore della 0,05, con 15 gradi di libertà è pari a 1,75305. Vuol dire che la coda di destra inizia al valore 1,75305 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Dal momento che 2 è superiore al valore critico 1,75305, si rifiuta H 0, si accetta di conseguenza l ipotesi alternativa H 1 e si può affermare che il valore medio osservato nel campione è superiore al valor medio di popolazione.