Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203
Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli viene consegnata da una determinato fornitore. Su un campione casuale di n=0 consegne si sono osservati i seguenti valori: 2, 6,7,6 0,9 3, 5,8 0,6 2,2 6,4, a) Ipotizzando la normalità della distribuzione, si vuole verificare se il livello medio di impurità di tutta la merce si mantiene entro lo standard previsto (stabilito ad un livello di 2,9) oppure lo supera. Condurre la verifica di ipotesi al livello α=0,05 b) Sulla base dell esito del test, è possibile commettere un errore di I tipo o di II tipo?
a) Volendo verificare se il livello medio di impurità di tutta la merce si mantiene entro il valore standard di 2,9 oppure lo supera, specifichiamo il sistema di ipotesi nel modo seguente: 0 : µ : µ > 2,9 2,9 Test unilaterale con la regione di rifiuto sulla destra Sapendo che la popolazione segue una distribuzione Normale con varianza non nota ed avendo estratto un campione piccolo (n=0), la statistica test (condizionata ad assumere vera 0 ) è: X 2,9 ~ T n s n Dato α =0,05 il valore soglia è il valore della distribuzione t di Student con n-=9 gradi di libertà che lascia alla sua destra un area pari a α =0,05 t 0,05 =,833 α =0,05 t=,833
Dai dati campionari dobbiamo stimare la media e la varianza. La stima puntuale della media è: 0 x = x i = 3,05 0 i= La stima della varianza (utilizzando lo stimatore corretto s 2 ) è data da: 0 2 2 s = ( x i x ) = 5, 585 9 i= Il valore osservato della statistica test si ottiene da: ( ) 3,05 2,9 t = = 0,2 5,585 0 Poiché 0,2 <,833 (il valore osservato cade nell area di accettazione), l ipotesi nulla non può essere rifiutata al livello di significatività del 5% b) Poiché la conclusione del test ci porta ad accettare l ipotesi nulla, è possibile commettere un errore di II tipo (l errore che consiste nell accettare un ipotesi nulla falsa)
Esercizio 2 In un campione casuale di 20 partite del campionato di calcio di serie A, 52 sono terminate con un punteggio di parità. (a) Verificare l ipotesi nulla che oltre la metà degli incontri finisca con un pareggio contro l alternativa che la maggioranza delle partite finisca con la vittoria di una delle due squadre. Utilizzare il livello di significatività α=0,0. (b) La conclusione si modifica se, lasciando tutto il resto invariato, il livello di significatività si abbassa a α=0,05?
(a) Indicando con l evento successo il pareggio e come evento insuccesso la vittoria di una delle due squadre, vogliamo verificare se la proporzione di successi nella popolazione (pareggi) è maggiore di 0,5 oppure no. Le ipotesi si specificano nel modo seguente: 0 : π : π < 0,5 0,5 Test unilaterale con la regione di rifiuto sulla sinistra Il campione è sufficientemente numeroso (n=20) per poter utilizzare la distribuzione Normale come approssimazione. La statistica test (condizionata ad assumere vera 0 ) è: X 0,5 z = 0,5 ( 0,5 ) n Dato α =0,0 il valore soglia è il valore della distribuzione z che lascia alla sua α =0,0 sinistra un area pari a α =0,0 z=-,28 z=-,28
Dai dati campionari dobbiamo stimare la proporzione di pareggi. La stima puntuale è: 52 p = x = = 0,433 20 Il valore osservato della statistica test si ottiene da: z = 0,433 0,5 0,5 20 ( 0,5 ) =,47 Poiché -,47 < -,28 (il valore osservato cade nell area di rifiuto) si rifiuta l ipotesi nulla a favore dell ipotesi alternativa. Dai dati campionari, al livello α =0,0 si conclude che la maggioranza delle partite non finisce in parità, ma con la vittoria di una delle due squadre
(b) Con α =0,05 il valore soglia diventa z=-,64. In questo caso -,47 (valore osservato) è maggiore di -,64 (valore soglia). Quindi la conclusione si modifica rispetto a prima. L ipotesi nulla non può essere rifiutata al livello di significatività del 5%. In questa situazione, ci aspettiamo che il p-value assuma un valore compreso tra 0,05 e 0,0. Perché? Il p-value rappresenta il livello di significatività osservato, che calcoliamo (in questo caso, per un test unilaterale con regione critica a sinistra) come la probabilità di osservare un valore Z inferiore a quello effettivamente osservato. p value = P(Z < zcamp.) = P(Z <,47) = Φ(,47) = 0,07 Dal p-value notiamo subito che l ipotesi nulla deve essere rifiutata se fissiamo un livello di significatività α maggiore di 0,07 (il p-value, in questo caso, è minore di α e dà quindi scarso supporto all ipotesi nulla). Viceversa, se fissiamo un livello di significatività α minore di 0,07 l ipotesi nulla non può essere rifiutata (il p-value, in questo caso, supera α).
Esercizio 3 In un fast food nell ora di punta si è calcolato che il tempo medio di attesa per un ordinazione è di 3,5 minuti. In corrispondenza del lancio di un nuovo prodotto si ha il sospetto che il tempo medio di attesa nell ora di punta possa significativamente aumentare. In tal caso il manager deciderà di aprire un altra cassa. Quando comincia la vendita del nuovo prodotto, su un campione di n=49 clienti si osserva un tempo medio di attesa pari a 4, minuti. La distribuzione dei tempi di attesa nella popolazione non è nota, ma conosciamo da esperienze passate che la deviazione standard della popolazione è pari a 2,2 minuti. Verificare l ipotesi nulla che il tempo medio di attesa sia rimasto invariato contro l alternativa che sia aumentato, al livello di significatività α=0,05
Il sistema di ipotesi è così definito: 0 : µ 3,5 : µ > 3,5 Test unilaterale con la regione di rifiuto sulla destra Non conoscendo la distribuzione della popolazione, poiché il campione è sufficientemente numeroso (n=49), per il Teorema del Limite Centrale la statistica test (condizionata ad assumere vera 0 ) è: Z = X σ 3,5 n σ=2,2 Dato α =0,05 il valore soglia è il valore della distribuzione z che lascia alla sua destra un area pari a α =0,05 z=,64 α =0,05 z=,64
La media campionaria è pari a x = 4, Il valore osservato della statistica test si ottiene da: ( 4, 3,5 ) z = 2,2 =,9 49 Poiché,9 >,64 (il valore osservato cade nell area di rifiuto) si rifiuta l ipotesi nulla al livello di significatività del 5%. Si conclude che il tempo di attesa è significativamente aumentato. Rifiutando 0, si può incorrere nell errore di I tipo: il costo di questo errore è rappresentato dal dover aprire un altra cassa nell ora di punta quando non è necessario.