Test di ipotesi. Test

Documenti analoghi
Test di ipotesi su due campioni

Il Test di Ipotesi Lezione 5

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

La verifica delle ipotesi

Esercitazione 8 del corso di Statistica 2

Test d Ipotesi Introduzione

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Corso di Statistica Esercitazione 1.8

Gli errori nella verifica delle ipotesi

Test delle Ipotesi Parte I

ESAME. 9 Gennaio 2017 COMPITO B

05. Errore campionario e numerosità campionaria

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Quanti soggetti devono essere selezionati?

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

Approssimazione normale alla distribuzione binomiale

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Distribuzione Gaussiana - Facciamo un riassunto -

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Teoria e tecniche dei test

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA ESERCITAZIONE

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

Esercizi di statistica

Distribuzioni campionarie

Prova di recupero di Probabilità e Statistica - A * 21/04/2006

Capitolo 9 Verifica di ipotesi: test basati su un campione

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

standardizzazione dei punteggi di un test

Capitolo 8. Probabilità: concetti di base

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Casa dello Studente. Casa dello Studente

Statistica Inferenziale

STATISTICA ESERCITAZIONE 13

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Distribuzione normale

Distribuzioni campionarie

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Analisi della varianza: I contrasti e il metodo di Bonferroni

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

STIMA DELLA VARIANZA CAMPIONARIA

Contenuti: Capitolo 14 del libro di testo

Teorema del limite centrale TCL

Distribuzioni e inferenza statistica

Teorema del Limite Centrale

Test delle ipotesi sulla media.

ISTOGRAMMI E DISTRIBUZIONI:

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Statistica Metodologica

Esercitazione 8 maggio 2014

Esercizi riassuntivi di Inferenza

Intervalli di confidenza

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

5.5 Procedura generale per la formulazione di un test

Esercizi di Probabilità e Statistica

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Distribuzione Normale

ESERCIZIO 1. b) E' necessario formulare ipotesi per procedere al test richiesto al punto a? (motivare brevemente la risposta)

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Analisi della regressione multipla

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Tipi di variabili. Indici di tendenza centrale e di dispersione

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Il campionamento e l inferenza. Il campionamento e l inferenza

Statistica Inferenziale

LEZIONI DI STATISTICA MEDICA

Proprietà della varianza

Confronto tra due popolazioni Lezione 6

PROBABILITÀ ELEMENTARE

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

UNIVERSITÀ DEGLI STUDI DI PERUGIA

b) Calcolare le probabilità dell'errore di I e II specie e la potenza del test per le seguenti ipotesi alternative: IPOTESI ALTERNATIVA α β 1 β

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

LE DISTRIBUZIONI CAMPIONARIE

Note sulla probabilità

Distribuzione Normale

STATISTICA A K (60 ore)

Prova scritta di Complementi di Probabilità e Statistica. 7 Dicembre 2012

Prova scritta Affidabilità dei sistemi stocastici e controllo statistico di qualità 28 Marzo 2013

Transcript:

Test di ipotesi Test E una metodologia statistica che consente di prendere una decisione. Esempio: Un supermercato riceve dal proprio fornitore l assicurazione che non più del 5% delle mele di tipo A dell ultima fornitura ha un peso inferiore a 150 gr. In un controllo basato su un campione casuale di 80 esemplari, si trova che la frazione di mele sottopeso (cioè con un peso inferiore a 150gr) è 0,06. L affermazione del fornitore è vera? Popolazione generatrice: forniture di mele Parametro di interesse: frazione di mele con peso inferiore o uguale a 150 gr. Esempio: Si consideri la sperimentazione di un nuovo fertilizzante A, del quale si intende confrontare l efficacia rispetto ad un fertilizzante tradizionale B. Lo sperimentatorestudierà l effetto di A su un insieme di lotti di terreno e da queste osservazioni trarrà evidenze per concludere se l efficacia di A è equivalente a quella di B o superiore. Se 85 è la resa media (in quintali per ettaro) di un terreno, con l uso del fertilizzante B, e da campionamenti effettuati su terreni coltivati con il fertilizzante A, la resa media campionaria è risultata pari a 84,3, cosa si può concludere circa l efficacia del nuovo fertilizzante? Popolazione generatrice: raccolta cereali Parametro di interesse: resa del terreno uguale o superiore a 85 1

Ipotesi Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazione standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc. Il processo è in controllo statistico? Una ipotesi statistica è una proposizione circa uno o più parametri di una popolazione o circa la distribuzione di probabilità della variabile aleatoria che descrive la popolazione Ipotesi nulla: il contenuto medio delle bottiglie di Coca-Cola è 33cc. : = =33 Ipotesi alternativa: il contenuto medio delle bottiglie di Coca-Cola è diverso da 33cc. : =33 Nelle applicazioni, si cerca di provare che l ipotesi alternativa è sostenuta dalle osservazioni. L ipotesi nulla ha valore strumentale. A 2 code A 1 coda : >85 : 33 : =85 : =33 Ipotesi composte Ipotesi semplici : 85 :>0,05 Ipotesi composte Test di Ipotesi Si chiama test di ipotesi una procedura che consente di prendere una decisione circa una particolare ipotesi (nulla) a partire dalle informazioni contenute in un campione casuale estratto dalla popolazione in esame. Se questa informazione è consistente con l ipotesi nulla Se questa informazione non è consistente con l ipotesi nulla è è Una ipotesi non potrà mai essere accettata con certezza, ma il risultato del test sarà sempre accompagnato da una valutazione della possibilità di commettere un errore accettando o rigettando l ipotesi. Procedura del test Formulare l ipotesi che si vuole sottoporre a verifica Selezionare un campione casuale Calcolare il valore di una statistica del campione utile alla verifica dell ipotesi Usare il valore calcolato per prendere una decisione sulla validità dell ipotesi. 2

Procedura per il test Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazione standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc. Il processo è in controllo statistico? Formulare l ipotesi che si vuole sottoporre a verifica : = =33 Selezionare un campione casuale Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie Calcolare il valore di una statistica del campione utile alla verifica =32,87 Usare il valore calcolato per prendere una decisione sulla validità dell ipotesi. Come? Usando la stima puntuale? Usando gli intervalli di confidenza? Regione di accettazione Il valore trovato di 32,87cc è sufficientemente vicino a 33cc per stabilire che il processo è in controllo statistico? 32,87? 32 =33 34 Stabilire la distanza massima tale che il valore calcolato per la media campionaria è ritenuto «sufficientemente vicino» al valore teorico assegnato al parametro media. La regione critica di un test di ipotesi è quel sottoinsieme (di numeri reali) tale che si rigetta l ipotesi nulla, se il valore calcolato della statistica test appartiene a tale regione si accetta, se il valore calcolato della statistica test non appartiene a tale sottoinsieme. Si chiama regione di accettazione,, il complementare della regione critica. Esempio: (32,34) è la regione di accettazione,32 34, è la regione critica Per evitare che la scelta della regione sia soggettiva, è necessario valutare quali tipi di errori vengono indotti da questa procedura scegliere la regione critica che minimizzi tali errori 3

Errori Un test di ipotesi può condurre a due tipi di errori Errore di I tipo Errore di II tipo vera falsa Test rigetta Errore I tipo Nessun errore Test non rigetta Nessun errore Errore di II tipo In termini di probabilità: vera falsa Test rigetta =P(Errore I tipo) Nessun errore Test non rigetta Nessun errore =P(Errore di II tipo) Errore di I tipo = è Lo sperimentatore rigetta l ipotesi nulla (a posteriori e sulla base dei dati) A priori, l ipotesi nulla è vera = " " " è " 1 = " " " è " La probabilità di non rigettare l ipotesi nulla, quando è vera, rappresenta la probabilità di prendere una decisione corretta. 4

Errore di II tipo = è Lo sperimentatore non rigetta l ipotesi nulla (a posteriori e sulla base dei dati) = " " " è " = " " " è " A priori, l ipotesi nulla è falsa Se l ipotesi nulla è falsa, allora è vera l ipotesi alternativa 1= " " " è " La probabilità di rigettare l ipotesi nulla, quando è falsa, rappresenta la probabilità di prendere una decisione corretta. 1 Errore II tipo Quale errore? = " " " è " = " " " è " Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazione standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc. Il processo è in controllo statistico? Regione di accettazione: (32;34) Quale dei due errori è possibile calcolare? Errore I tipo : = =33 " " " è " = 32;34 =33 = 3234 =33 = 32 34 =33 = 3233333433 = 3233 1,5/ 16 33 3433 1,5/ 16 1,5/ 16 = 3233 3433 1,5/ 16 1,5/ 16 Se = 2,672,67 = 0,9962-0,0038=0,9898 1% 5

Modificando la regione di accettazione, cambia P(errore di I tipo). In base ai dati dell esempio: La regione di accettazione: ~ 33; 1,5 16 3234 =33 =98,9% Modificando la regione di accettazione, cambia P(errore di I tipo). In base ai dati dell esempio: La regione di accettazione: ~ 33; 1,5 16 3234 =33 =98,9% Se si sceglie una regione di accettazione diversa, cosa cambia? 32,533,5 =33 Standardizzando ed usando l ipotesi =33 1,331,33 =0,9082 0,0918 82% 6

Modificando la regione di accettazione, cambia P(errore di I tipo). In base ai dati dell esempio: La regione di accettazione: ~ 33; 1,5 16 3234 =33 =98,9% Se si sceglie una regione di accettazione diversa, cosa cambia? 32,533,5 =33 Standardizzando ed usando l ipotesi =33 1,331,33 =0,9082 0,0918=81% Se la regione di accettazione viene ulteriormente ampliata: 31,534,5 =33 = 44 = 100% per la legge dei 3 sigma. Modificando la taglia campionaria, cambia P(errore di I tipo). In base ai dati dell esempio: La regione di accettazione: 3234 =33 ~ 33; 1,5 16 A parità di regione di accettazione cosa accade al crescere della taglia? 3234 =33 =30 La precisione della media campionaria decrementa da 0,375 a 0,273. Standardizzando: 3,653,65 =0,9999-0,0001=99% Per taglia 16 è 98,9% 7

Modificando la taglia campionaria, cambia P(errore di I tipo). In base ai dati dell esempio: La regione di accettazione: 3234 =33 ~ 33; 1,5 16 A parità di regione di accettazione cosa accade al crescere della taglia? 32,533,5 =33 =30 La precisione della media campionaria decrementa da 0,375 a 0,273. Standardizzando: 1,831,83 =0,9664-0,0336=93% P(errore di I tipo) decrementa al crescere della taglia campionaria. Per taglia 16 è 81% Per fissare un criterio oggettivo, è possibile fissare la probabilità di commettere l errore di I tipo e determinare la regione di accettazione associata a aquella probabilità. Significatività La probabilità P(errore di I tipo) viene denominata significatività del test. Assegnare un valore al livello di significatività del test equivale ad assegnare un valore alla probabilità di commettere un errore di I tipo. Assegnare un valore alla probabilità di commettere un errore di I tipo equivale a determinare gli estremi della regione di accettazione del test. Come? =0,05 1=0,95 1,961,96 = 0,95 1,96 1,96 = 0,95,/, 1,96 1,96, = 0,95 1,96, +1,96, = 0,95 1,96, +1,96, = 0,95 Se l ipotesi : = =33 è vera Intervallo di confidenza 331,96, 33+1,96, = 0,95 La regione di accettazione è (32,27; 33,74) 8

Come concludere il test: errore di I tipo La regione di accettazione è (32,27; 33,74) Osservato un valore per la media campionaria, si può avere: 32,27;33,74 L ipotesi che la media della popolazione è 33cc si rigetta. Se l ipotesi nulla è falsa non si commette alcun errore. Se l ipotesi nulla è vera, si commette un errore di I tipo. 32,2733,74 =33 = 0,95 Nel concludere che la popolazione non ha media 33cc, si commette un errore solo nel 5% dei casi, ossia 5 volte su 100 tale conclusione è errata. Come concludere il test: errore di II tipo La regione di accettazione è (32,27; 33,74) Osservato un valore per la media campionaria, si può avere: 32,27;33,74 L ipotesi che la media della popolazione è 33 non si rigetta. Se l ipotesi nulla è vera non si commette alcun errore. Se l ipotesi nulla è falsa, si commette un errore di II tipo. Quanto vale la probabilità di commettere un errore di II tipo? Ossia con quale probabilità si prende una decisione errata? = " " " è " Quali sono i valori del parametro nell ipotesi alternativa? 9

~ 33; 1,5 16 ~ 33,5; 1,5 16 Errore di II tipo Probabilità di commettere un errore di I tipo Regione critica 32,2733,74 =33 = 0,95 32,2733,74 =33,5 = Probabilità di commettere un errore di II tipo Bisogna calcolare l area in blu 32,2733,74 =33,5 =?,, =33,5 =,/,/,/,,,,,/,/,/ = 3,280,64 = 0,7422-0,0005 = 74% In generale, l ipotesi alternativa è una ipotesi composta. Quale valore scegliere? 10

Regione di accettazione Taglia : =, : = 32,2733,74 16 1-0,95=0,05 0,729 0,236 32,533,5 16 1-0,81=0,19 0,497 0,091 32,2733,74 30 1-0,99=0,01 0,8 0,169 32,533,5 30 1-0,93=0,07 0,5 0,033 La probabilità P(errore di I tipo) è in relazione con la probabilità P(errore di II tipo). Se una aumenta l altra diminuisce e viceversa. Al crescere della taglia del campione casuale, la probabilità P(errore di II tipo) diminuisce, mentre per la probabilità P(errore di II tipo) questo non è sempre vero. La probabilità P(errore di II tipo) diminuisce se il valore assegnato al parametro si allontana da quello assegnato nell ipotesi nulla. Lo statistico seleziona l errore di I tipo e quindi la regione critica. Rigettare : = =33 L errore di II tipo dipende dal vero valore del parametro in esame, che in genere è incognito. Pertanto si procede per tentativi. Accettare : = =33 Esempio: Si ipotizza che l età media dei frequentatori di una biblioteca sia 39 anni con una varianza di anni. Per verificare tale ipotesi vengonocampionati 100 frequentatori e la loro età media risulta essere 38 anni. Si verifichi l ipotesi iniziale assumendo che la popolazione generatrice è normale. Identificare il parametro di interesse: il parametro media Formulare l ipotesi nulla := =39. Formulare l ipotesi alternativa : =39. Scegliere un opportuno errore di I tipo: =0,05. Scegliere un opportuna statistica test:. Costruire la regione di accettazione: =39 100 100 =39 39 100 39 100 39 100 = / 39 100 = / 11

39 100 39 100 = / =1,96 = / =1,96 =391,96 100 =38,37 =39+1,96 100 =39,62 Determinare un campione casuale e valutare una stima puntuale della statistica test: =38. Decidere se rigettare o meno l'ipotesi nulla, verificando se tale stima puntale appartiene o meno alla regione di accettazione: 38 38,37;39,62. Poiché 38 non appartiene alla regione di accettazione, l ipotesi nulla si rigetta. La decisione comporta un errore di I tipo con livello di significatività del 5%, ossia nel 5% dei casi la decisionepresa è errata. Non si può ritenere pari a 39 il numero medio di anni dei frequentatori della biblioteca. E possibile effettuare un secondo test, scegliendo tra le due ipotesi: 39 >39. Quale? :> =39. Poiché la media campionaria è 38, è verosimile che 39. L obbiettivo è rigettare l ipotesi nulla. Ipotesi nulla composta Esempio: Si ipotizza che l età media dei frequentatori di una biblioteca sia 39 anni con una varianza di anni. Per verificare tale ipotesi vengonocampionati 100 frequentatori e la loro età media risulta essere 38 anni. Si verifichi l ipotesi iniziale assumendo che la popolazione generatrice è normale. Identificare il parametro di interesse: il parametro media Formulare l ipotesi nulla :> =39. Formulare l ipotesi alternativa : =39. Scegliere un opportuno errore di I tipo: =0,05. Scegliere un opportuna statistica test:. Costruire la regione di accettazione: Regione critica a una coda Regione critica a due code Quale eliminiamo? Se si osserva un valore della media campionaria minore di allora è verosimile ritenere l ipotesi nulla falsa. Quindi la regione di accettazione ha la forma,. Come calcolare il valore di? 12

Il valore di è tale che > 39 = 0,95 dove ~ 39; 100 =? La linea blu rappresenta la pdf di ~ 39,3; 100 L area blue è minore dell area sottesa dalla II curva > =39 > =39,3 P(errore di I tipo con=39) P(errore di I tipo con=39,3) La regione di accettazione calcolata con =39corrisponde al massimo errore di I tipo richiesto per il test, cioè 0,05. Come calcolare il valore? Standardizzando si ha: > =39 100 = Il valore di è tale che > 39 100 > =39 = 0,95 39 100 =, = -1,64 =391,64 100 =38,48 Per ritenere vera l ipotesi nulla :> =39 è necessario osservare un valore per la media campionaria superiore a 38,48. Poiché il valore osservato 38 38,48;, l ipotesi nulla viene rigettata in favore di quella alternativa. L età media dei frequentatori della biblioteca è inferiore a 39 anni con una significatività del 5%. 13

Impossibile visualizzare l'immagine. Impossibile visualizzare l'immagine. Impossibile visualizzare l'immagine. 26/05/2015 P-value Il p-value rappresenta l area a destra per il valore osservato della statistica test, assumendo vera l ipotesi nulla. (NB: Il suo calcolo dipende però dall ipotesi alternativa). Esempio: Si ipotizza che l età media dei frequentatori di una biblioteca sia 39 anni con una varianza di anni. Per verificare tale ipotesi vengonocampionati 100 frequentatori e la loro età media risulta essere 38 anni. Si verifichi l ipotesi iniziale assumendo che la popolazione generatrice è normale. Se l ipotesi nulla := =39è vera, allora ~ 39; 100 Un valore osservato appartenente al range di è 38. Il p-value è l area in rosso nel grafico. L area in rosso è inferiore alla somma dell area in rosso e dell area blu, poiché 38 non appartiene alla regione di accettazione. E un altro modo per verificare se l ipotesi nulla va rigettata. Se è vera l ipotesi nulla, allora ~ 39; 100 P-value= 38 =39 + >40 =39 = 38 =39 + 100 40 > =39 100 = = 3839 100 + > 4039 3,13 + >3,13 = 100 Si noti l uguaglianza delle due probabilità 0,0008+(1-0,9992)=2*0,0008=0,0016 Poiché p-value< =0,05 38 14

Se il valore osservato per la media campionaria è ad esempio 40, il calcolo del p-value resta immutato. Se > =2 > = := > := Se =2 = := > := Cosa accade se si effettua un test a una coda? Regione di accettazione nel caso :> =39. Poichè =38 =39 p= = P-value= 38 =39 = 0,0008<0,05 Potenza del test Per migliorare la performance di un test di ipotesi, l altro parametro su cui è possibile fare leva è la taglia campionaria. Visto che il livello di significatività di un test è fissato dallo sperimentatore, è possibile scegliere una taglia campionaria che diminuisca la probabilità di commettere un errore di II tipo, ossia aumenti il suo complementare, anche detto potenzadi un test. 1= " " " è " n Errore campionario Regione accettazione =, =, =, 30 0,58 (37,86;40,14) 0,23 0,11 0,05 60 0,41 (38,19;39,81) 0,40 0,16 0,06 100 0,32 (38,37;39,63) 0,59 0,24 0,06 150 0,26 (38,49;39,51) 0,76 0,34 0,07 170 0,24 (38,52;39,48) 0,81 0,37 0,07 200 0,23 (38,56;39,44) 0,87 0,43 0,07 Se si rigetta l ipotesi nulla Se non si rigetta l ipotesi nulla Calcolo della potenza del test Calcolo dell errore di II tipo del test 15

Sul formulario Test sulla media, popolazione gaussiana, varianza nota Regione di accettazione : = : : > : ; + ; : : ; + Test sulla media, popolazione gaussiana, varianza incognita Quale dei parametri presenti nella regione di accettazione va modificato? Scegliere un opportuna statistica test:. Costruire la regione di accettazione: In questa costruzione. Mentre con la varianza nota, la standardizzazione comporta l uso di una gaussiana standard = = con la varianza incognita, la standardizzazione comporta l uso di una v.a. T-Student = = Regione di accettazione : = : ; ; + ; La regione di accettazione può essere costruita a partire dall intervallo di confidenza : > : ; : : ; + ; NB: Intervallo di confidenza ; ; + ; In che modo? 16

Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc e una deviazione standard campionaria di 1,5 cc. Stabilire se il contenuto medio delle bottiglie è variato al livello di significatività del 5%. Identificare il parametro di interesse: il parametro media Formulare l ipotesi nulla := =33. Formulare l ipotesi alternativa : =33. Scegliere un opportuno errore di I tipo: =0,05. Scegliere un opportuna statistica test:. Costruire la regione di accettazione (formulario): ; ; + ; =0,05 1/2=0,975,; =2,1314 =1,5 =16 332,1314 1,5 1,5 ;33+2,1314 16 16 32,21;33,8 Prendere una decisione circa l ipotesi nulla: 32,87 32,21;33,8 Decidere se rigettare o meno l'ipotesi nulla, verificando se 32,87 appartiene o meno alla regione di accettazione: 32,21;33,8 Poiché 32,87 appartiene alla regione di accettazione, l ipotesi nulla non si rigetta. 0,95 = " " " è " " " " è " =? Errore II tipo Calcolare l errore di II tipo per vari valori di " " =32,5 = 32,2133,8 =32,5 = 32,21 1,5 33,8 1,5 =32,5 16 16 32,2132,5 1,5 33,832,5 1,5 16 16 = 0,77 3,46 0,990,25=0,74 17

Sul formulario Test sulla media, popolazione non gaussiana, varianza nota : = : Regione di accettazione / ; + / Per il teorema del limite centrale : > : ; : : ; + Test sulla media, popolazione non gaussiana, varianza incognita : = : Regione di accettazione / ; + / Per il teorema del limite centrale + approssimazione con una v.a. T-student : > : ; : : ; + Esempio: Alle ultime elezioni politiche, in un certo seggio hanno votato 1000 persone. Si sa che nelle precedenti elezioni, il partito A aveva ricevuto il 51% delle preferenze. A 100 cittadini all uscita dal seggio elettorale viene chiesto per quale partito hanno votato. Risulta che il partito A ha ricevuto il 52,3% delle preferenze. E possibile ritenere che anche nelle ultime elezioni le preferenze per il partito A prevalgano su quelle agli altri partiti? Identificare il parametro di interesse: il parametro percentuale Formulare l ipotesi nulla : =0,51. Formulare l ipotesi alternativa : =0,51. Scegliere un opportuno errore di I tipo: =0,05. Scegliere un opportuna statistica test: Costruire la regione di accettazione: Test sulle percentuali Se si considera l intervallo di confidenza la regione di accettazione (a due code) si ottiene da e sostituendo al posto di il valore del parametro =0,51. La regione di accettazione a una coda per il test proposto è dunque:, con 1,64=0,95 =0,51+1,64,, =0,5919 18

Decidere se rigettare o meno l'ipotesi nulla, verificando se 0,523 appartiene o meno alla regione di accettazione: ;0,5919 Poiché 0,523 appartiene alla regione di accettazione, l ipotesi nulla non si rigetta. 0,95 = " " " è " " " " è " =? Errore II tipo Per quale valore di n l ipotesi nulla verrebbe rigettata? =0,51+1,64 0,5110,51 0,523 0,2499 0,5230,51 1,64 Test sulla percentuale > 0,2499/ 0,013 1,64 Regione di accettazione 0,5110,51 =3978 0,5230,51 1,64 := : :> : / 1 ; + / 1 1 ; Test sulla varianza Esempio: L osservazione della durata (in ore) della batteria per cellulare di una data marca in 24 esemplari di prodotto ha dato luogo ai seguenti risultati: 58,7 64,9 76,9 67,8 41,7 56,7 64,5 69,7 82,1 82,5 40,8 74,9 71,5 75,4 67,3 73,0 70,4 104 82,3 90,4 86,8 72,8 71,8 54,5 La varianza campionaria risulta 203,45. E possibile ritenere valida l ipotesi che la variabilità della durata delle batterie sia 200? Identificare il parametro di interesse: la varianza Formulare l ipotesi nulla : = =200 Formulare l ipotesi alternativa : =200. Scegliere un opportuno errore di I tipo: =0,05. Scegliere un opportuna statistica test:. Costruire la regione di accettazione: Poichè 19

=11,68 =38,07 24, 203,45 Decidere se rigettare o meno l'ipotesi nulla, verificando se 203,47 appartiene o meno alla regione di accettazione: 101,56;331,04 Poiché 203,47 appartiene alla regione di accettazione, l ipotesi nulla non si rigetta. 0,95 = " " " è " " " " è " =? Errore II tipo Test sulla varianza Regione di accettazione : = : : > : : : 20