STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla H 0 viene accettata quando essa è falsa Esercizio 1 Supponiamo che la spesa mensile per l'affitto di un locale commerciale ( ) si distribuisce come una Normale con con. Selezionando n = 40 locali si osserva che euro. Verifichiamo che euro. Accettiamo H 0 con? Soluzione Il sistema di ipotesi é: Calcoliamo Siccome rifiutiamo l'ipotesi nulla In maniera equivalente: 1
Visto che rifiutiamo H 0. Utilizziamo anche l'approccio basato sul p-value. Ora l'ipotesi nulla H o viene rifiutata se Vediamo che e dunque rifiutiamo H o. Esercizio 2 (Cicchitelli) Per la generica voce di un inventario di un impresa mercantile sia X la variabile casuale valore inventariato - valore certificato. Un certificatore contabile estrae a sorte un campione di 120 voci ottenendo = 25,3 e = 13240. Sia µ la media di X nella popolazione. a) Si sottoponga a verifica l ipotesi che µ = 0 contro l alternativa µ > 0, cioè che l inventario è gonfiato, con α = 0.01; b) Si calcoli la probabilità dell errore di I tipo; c) Si calcoli la probabilità di errore di II tipo nel caso di ipotesi alternativa H 1 : µ = 27 d) Si calcoli la potenza del test; e) Senza fare i calcoli, e considerando i risultati del punto d) spiegare come cambierebbe la potenza del test se l ipotesi alternativa è H 1 : µ = 27. 2
Soluzione a) 1. Definizione del sistema di ipotesi: 2. Livello di significatività α = 0,01 3. Costruzione della statistica test Trattandosi di un campione di dimensione elevata, per il Teorema del Limite Centrale si può ricorrere all approssimazione normale e considerare S 2 una buona stima della varianza della popolazione. 4. Definizione della regola di decisione (regione di rifiuto) Il livello di significatività è α = 0.01, il test è a una coda, quindi Se rifiutiamo l ipotesi nulla o equivalentemente (1) 5. A partire dal campione calcolo il valore della statistica sotto l ipotesi nulla 6. Decisione Siccome rifiuto l ipotesi nulla. b) la probabilità dell errore di I tipo è α = 0.01 c) Si definisce errore di II tipo la probabilità di non rifiutare l ipotesi nulla quando è vera l ipotesi alternativa, ossia nel nostro caso: 3
A partire dall ipotese alternativa proposta µ 1 = 27 (che da quindi luogo ad una distribuzione alternativa), la probabilità dell errore di II tipo è data da: d) La potenza del test è la probabilità di rifiutare correttamente, in pratica la probabilità di prendere la decisione giusta e può essere espressa, in termini standardizzati, come: dove β è la probabilità di non rifiutare anche se è vera. Potenza del test Nota: un test ha potenza maggiore se la dimensione campionaria è grande, se la discrepanza vera dall ipotesi nulla è grande e se la variabilità nella popolazione è bassa. e) Specificando = 28 la probabilità dell errore di II tipo si riduce e aumenta la potenza del test. Esercizio 3 (ANOVA confronto tra medie) Applicare l'analisi della varianza ai dati in tabella e effettuare il test per il confronto tra medie. X Y A 17,4 10,4 20,0 B 57,1 25,7 19,9 C 20,5 12,8 22,3 4
Soluzione Medie parziali Scarti quadratici medi parziali Media generale Devianza tra gruppi Devianza entro gruppi Devianza totale 5
Definizione del sistema di ipotesi: Fonte di variazione Dev(SQ) gdl VAR(MQ) F Tra i gruppi (Dev EST ) 588,15 2 Entro i gruppi (Dev INT ) 30,01 6 Totale 618,16 8 Siccome rifiutiamo H 0. Esercizio 4 (ANOVA per regressione) Y X 2,3 7 4 11 3,3 10,4 5 9 1) Stimare i coefficienti di regressione; 2) Calcolare l'indice di bontà di adattamento del modello di regressione; 6
3) Costruire la tabella ANOVA della regressione; 4) Verificare la significatività del modello usando il test sul coefficiente di regressione e il test F a partire dalla tabella ANOVA. Soluzione Fonte Variabilità Dev(ss) gdl Var(MS) Statistica F Regressione Dev(R) 1 Dev(R) Errore Dev(E) n - 2 Totale Dev(Y) n - 1 1) 2) 7
3) Ora sapendo che Per cui: Quindi da cui: A questo punto calcoliamo T n : La statistica F si ottiene: Fonte Variabilità Dev(ss) gdl Var(MS) Statistica F Regressione 0,89 1 0,89 3,83 Errore 2,99 2 1,49 Totale 3,88 3 8
4) Sistema di ipotesi: con Sappiamo che Siccome allora accettiamo H 0. Esercizio 5 Il valore dell'indice di connessione del chi-quadrato per i dati in tabella è 8,95. Condizione Vaccino Sani Malati Totale Si 43 7 50 No 86 14 100 Totale 129 21 150 Effettuare un test del chi-quadrato per l'indipendenza con un livello di significatività del 10%. Soluzione Sappiamo che 9
Il sistema di ipotesi è: Il valore dell'indice di connessione va confrontato con, considerando anche il livello di significatività, nel nostro caso Utilizzando le tavole Rifiutiamo H 0 se Siccome Rifiutiamo H 0, e possiamo affermare che vi è relazione significativa con probabilità del 90%. 10