Gli errori nella verifica delle ipotesi

Documenti analoghi
Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

STATISTICA ESERCITAZIONE 13

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

La verifica delle ipotesi

Test d Ipotesi Introduzione

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Elementi di Psicometria con Laboratorio di SPSS 1

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Test di ipotesi. Test

Esercitazione 8 del corso di Statistica 2

Approssimazione normale alla distribuzione binomiale

05. Errore campionario e numerosità campionaria

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Analisi della regressione multipla

Distribuzioni e inferenza statistica

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

Proprietà della varianza

Il test (o i test) del Chi-quadrato ( 2 )

Metodi statistici per le ricerche di mercato

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Capitolo 8. Probabilità: concetti di base

Esercitazione 8 maggio 2014

Test d ipotesi: confronto fra medie

Elementi di Psicometria con Laboratorio di SPSS 1

Test delle ipotesi sulla media.

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

5.5 Procedura generale per la formulazione di un test

Esercizi di Probabilità e Statistica

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Analisi della varianza: I contrasti e il metodo di Bonferroni

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Statistica Inferenziale

Quanti soggetti devono essere selezionati?

Esercizi riassuntivi di Inferenza

Distribuzione Normale

Dal disegno a due campioni indipendenti al confronto per dati appaiati

Schema lezione 5 Intervalli di confidenza

Statistica Metodologica

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Statistica Matematica A - Ing. Meccanica, Aerospaziale II prova in itinere - 2 febbraio 2005

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

STATISTICA A K (63 ore) Marco Riani

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Capitolo 9 Verifica di ipotesi: test basati su un campione

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Statistical Process Control

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Gestione ed Analisi Statistica dei dati

Distribuzione Normale

Z-test, T-test, χ 2 -test

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Caratterizzazione dei consumi energetici (parte 3)

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

ESAME. 9 Gennaio 2017 COMPITO B

Concetti principale della lezione precedente

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA AZIENDALE Modulo Controllo di Qualità

FENOMENI CASUALI. fenomeni casuali

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Distribuzioni campionarie

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

UNIVERSITÀ di ROMA TOR VERGATA

Corso di Psicometria Progredito

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

L indagine campionaria Lezione 3

Dal campione alla popolazione

Capitolo 10 Test delle ipotesi

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

L AFFIDABILITA NELLA FASE DI PRODUZIONE

Casa dello Studente. Casa dello Studente

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

DISTRIBUZIONI DI CAMPIONAMENTO

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Il test statistico e le ipotesi Regione di accettazione e rifiuto Test con ipotesi nulla semplice Il p-value Errori di I e II tipo Funzione di potenza

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;

Parte 1 : Inferenza. *(richiami), **(parte 2), ***(cenni) ! Test d'ipotesi* ! Intervalli di confidenza* ! Test parametrici* ! Calcoli di potenza**

È possibile trovare la popolazione di origine conoscendone un campione? o meglio. partendo dalla conoscenza di n, x e d.s.?

TUTORATO 2 Test di significatività e intervalli di confidenza

TEST NON PARAMETRICO DI MANN-WHITNEY

Tipi di variabili. Indici di tendenza centrale e di dispersione

Verifica di ipotesi. Parte VI. Verifica di ipotesi

Verifica di ipotesi: approfondimenti

La valutazione dei rischi. Corso di risk management Prof. Giuseppe D Onza

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Minimi quadrati vincolati e test F

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

Transcript:

Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E chiaro però che esiste comunque la possibilità di giungere a conclusioni errate, appunto perché i miei dati rappresentano solo una parte dell evento che sto analizzando Formalizziamo brevemente il concetto, in parte già visto, di errore (di errori) nel processo di verifica delle ipotesi Premessa (riassunto di argomenti già trattati) PRIMA di effettuare un test statistico viene scelto un livello di significatività, α Questo livello di significatività determina i valori critici della statistica test (z, t, chi-quadro, ecc). I valori critici definiscono nella distribuzione teorica della statistica, distribuzione attesa nel caso sia vera l ipotesi nulla (la distribuzione nulla, appunto), le regioni di accettazione e di rifiuto Il livello di significatività prescelto viene anche utilizzato come confronto se si segue l approccio del p-value: il p-value calcolato viene confrontato con α

Supponiamo ora di aver scelto α =0.05 (scelta tipica), e supponiamo di condurre un test bidirezionale (a due code) La regione di rifiuto nella distribuzione nulla include il 5% dei valori più estremi della statistica (2,5% dalla parte dei valori molto grandi, e 2,5% dalla parte dei valori molto piccoli) Questi sono valori estremi che comunque possiamo otterremmo, con una probabilità del 5%, anche se fosse vera l ipotesi nulla Se ripetessimo tante volte il test su campioni diversi, e l ipotesi nulla fosse sempre vera, il 5% dei test porterebbe ad un valore della statistica test all interno della zona di rifiuto (e ad un p-value inferiore a 0.05) Quindi, nel 5% di questi test, rifiuteremmo l ipotesi nulla vera Distribuzione nulla per la statistica test z. Se è vera l ipotesi nulla, e ripetessi il test molte volte su campioni diversi, α x 100 delle volte quest ipotesi vera verrebbe erroneamente rifiutata

In pratica, se la statistica calcolata in un singolo test cade nella regione di rifiuto, o il p-value <α, la conclusione del test è quella di rifiutare l ipotesi nulla. Ma, per quello che abbiamo appena detto, l ipotesi nulla potrebbe anche essere vera ma per puro effetto del caso (errore di campionamento) i dati portano ad una statistica test significativa (che cade cioè nella regione di rifiuto e che ha un p-value <α) L errore che si compie rifiutando un ipotesi nulla vera si chiama o errore di prima specie, o errore do tipo I Errore di primo tipo La probabilità di compiere un errore di primo tipo è data dal livello di significatività α prescelto E la frazione di volte che viene rifiutata un ipotesi nulla vera se ripetessi tante volte il test su campioni diversi (presi dalla stessa, o dalle stesse, popolazione/i) Scegliendo in anticipo α, definiamo il rischio che siamo disposti ad accettare di compiere un errore di primo tipo Alla fine del test, se le evidenze saranno a favore dell ipotesi alternativa, non sapremo ovviamente se avremo commesso un errore di primo tipo oppure no. Potremo solo dire che la probabilità di averlo commesso, se fosse vera l ipotesi nulla, sarebbe molto bassa (e pari ad α)

La probabilità complementare (1- α) viene chiamata livello di protezione di un test, ed è appunto la probabilità di non rifiutare l ipotesi nulla quando l ipotesi nulla è vera. Un test con un altro livello di protezione è detto conservativo Un test molto conservativo può essere visto come un test che vuole rischiare molto poco di fare un errore di primo tipo, che sappiamo essere un errore molto grave perché rifiutare l ipotesi nulla è una decisione forte (come condannare un imputato) mentre non rifiutarla non significa in realtà accettarla (ma solo dire che i dati sono compatibili con essa) Da notare che nel calcolo degli intervalli di confidenza (utilizzati nella stima di un parametro, non nella verifica di ipotesi), il termine 1- α prende il nome di grado di confidenza Riassumendo, se l ipotesi nulla è vera, può succedere che:

Vediamo ora un altro tipo di errore che si può commettere nella verifica delle ipotesi Se l ipotesi nulla è falsa, cioè per esempio la media nella popolazione 1 è diversa dalla media nella popolazione 2, giungerò sempre al suo rifiuto analizzando due campioni? Ovviamente no, e anche intuitivamente è facile capirne un motivo: se le medie nelle due popolazioni sono diverse ma molto vicine, è possibile che i dati non siano sufficienti a escludere l ipotesi nulla, visto che l ipotesi nulla viene rifiutata solo in presenza di forti evidenze L errore che si compie quando un ipotesi alternativa è vera ma la conclusione del test è quella che non è possibile escludere l ipotesi nulla, ovvero, l errore che si compie non rifiutando un ipotesi nulla falsa, si chiama Errore di secondo tipo o errore di seconda specie, o errore do tipo II

La probabilità di commettere un errore di secondo tipo viene generalmente indicato con il simbolo β La probabilità complementare, (1- β), ossia la probabilità di rifiutare correttamente un ipotesi nulla falsa, si chiama potenza del test Maggiore è la potenza di un test, maggiore sarà la possibilità del test di identificare come corretta l ipotesi alternativa quando questa è effettivamente vera La probabilità di fare un errore di secondo tipo, ovvero il rischio di non rifiutare un ipotesi nulla falsa, e di conseguenza la potenza di un test, non si può stabilire a priori Dipende infatti dalla distanza tra ipotesi nulla e alternativa (per esempio, la differenza tra µ 1 e µ 2 ), distanza che è ignota Dipende dalla varianza delle variabili in gioco, che non può essere modificata La probabilità di fare un errore di secondo tipo, però, dipende anche dal numero di osservazioni e dal livello di significatività α prescelto. Quindi: è possibile ridurre l errore di II tipo (e quindi aumentare la potenza) aumentando la dimensione campionaria è possibile ridurre l errore di II tipo (e quindi aumentare la potenza) aumentando il livello di significatività α (ma questa scelta ci espone a maggiori rischi di errore di tipo I) E possibile studiare la potenza di un test attraverso l analisi della potenza

Completiamo intanto la tabella degli errori Cerchiamo ora di capire graficamente l errore di secondo tipo Supponiamo di svolgere un test z a una coda per verificare le seguenti ipotesi H 0 : µ = µ 0 = 1.5 H 1 : µ µ 0 Abbiamo già visto cosa succede quando l ipotesi nulla è effettivamente vera (si rischia di commettere un errore di primo tipo) Vediamo ora cosa succede quando l ipotesi nulla non è vera In questo caso, per capire e calcolare l errore di secondo tipo è necessario assumere che sia vera una ipotesi alternativa precisa. Assumiamo che sia vera l ipotesi alternativa µ = 1.45

Concentriamoci per ora sulla parte inferiore della figura, specifica per un campione con n = 36 osservazioni con σ =0.1 e α = 0.01 Le due distribuzioni a campana rappresentano le distribuzioni delle medie campionarie secondo l ipotesi nulla (in viola) e secondo l ipotesi alternativa (in blu) Le due linee rosse verticali rappresentano i limiti dell intervallo all interno del quale una media campionaria verrebbe considerata compatibile con l ipotesi nulla Quei limiti, standardizzati, porterebbero ai valori critici nella tabella di z di - 2.576 e 2.576 L area ombreggiata in giallo è la probabilità di commettere un errore di tipo II Infatti, quando è vera l ipotesi alternativa, la media campionaria ha una probabilità pari all area in giallo di cadere nella regione di accettazione (stabilità ovviamente sulla base della distribuzione nulla) L area ombreggiata in verde è quindi il potere del test, ovvero la probabilità di rifiutare correttamente l ipotesi nulla quando questa è falsa (come nel caso considerato)

E facile capire da questo grafico che 1. Maggiore è la distanza tra ipotesi alternativa (che stiamo considerando vera) e l ipotesi nulla (che stiamo considerando falsa), maggiore sarà la potenza del test Logico: se l ipotesi alternativa è molto diversa da quella nulla ipotizzata, sarà facile scoprirlo 2. Minore è la dispersione della variabile, minore sarà la varianza della media campionaria, più strette saranno le corrispondenti distribuzioni, e maggiore sarà la potenza del test Logico: se gli individui sono tutti molto simili, anche pochi sono sufficienti per stimare bene la media della popolazione e verificare se è diversa da µ 0 3. Maggiore è l α prescelto, maggiore sarà la potenza del test Logico: se per rifiutare l ipotesi nulla mi accontento di moderate differenze tra i dati e quanto predetto dall ipotesi nulla, tenderò a rifiutarla maggiormente quando è vera l ipotesi nulla ma anche quando è vera l ipotesi alternativa 4. Maggiore è la dimensione campionaria, minore sarà la varianza della media campionaria, più strette saranno le corrispondenti distribuzioni, e maggiore sarà la potenza del test Logico: con molti dati scovo meglio un ipotesi alternativa vera

Attenzione: per ogni dato test statistico, possiamo aumentare la potenza solo agendo su sul punto 3 (ma ciò comporta un aumento del rischio di errore di tipo I) e sul punto 4. I punti 1 e 2 non sono sotto il nostro controllo In realtà, poiché per ogni tipo di problema statistico esistono generalmente più test diversi a disposizione (con caratteristiche diverse), e i test che fanno più assunzioni (per esempio sulla distribuzione della variabile) sono di solito più potenti, è anche possibile aumentare la potenza di un test scegliendo il test più potente (ovviamente se le condizioni imposte da quel test sono soddisfatte dai dati) Provate voi stessi come varia il potere di semplice un test in funzione di α, n, σ, e la distanza tra la µ vera e la µ 0 ipotizzata dall ipotesi nulla: http://bcs.whfreeman.com/ips4e/cat_010/applets/power_ips.html

Cosa si poteva vedere nella parte superiore della figura discussa in precedenza?

L analisi della potenza e la sua importanza Fare un analisi della potenza significa essenzialmente determinare la potenza di un test in diverse condizioni, ovvero in funzione di α, n, σ, e della distanza tra ipotesi alternativa e ipotesi nulla Nel test appena visto, il calcolo della potenza è semplice (si fa con il calcolatore ma si poteva fare anche a mano). In altri casi è molto più complesso E molto importante perché ci permette di capire quale probabilità abbiamo di accettare erroneamente l ipotesi nulla quando invece è vera una specifica ipotesi alternativa Supponiamo per esempio di avere la possibilità di determinare una certa variabile fisiologica in un gruppo di 5 pazienti, per poterne confrontare la media con l ipotesi nulla che la media nella popolazione sia pari ad un certo valore medio standard, diciamo 12 (sospettando per esempio che la patologia dei pazienti possa aver alterato la variabile fisiologica che vogliamo analizzare). Supponiamo anche di conoscere la deviazione standard della variabile (così che sia possibile applicare un test z) e che questa sia pari a 3

Dopo aver fatto l analisi in laboratorio e il test statistico, e aver trovato che l ipotesi nulla non può essere rifiutata, o meglio ancora prima di cominciare le analisi, potremo chiederci: qual è la probabilità di non accorgerci (con un certo α = 0.05) che la media della popolazione da cui abbiamo estratto il campione non è quella specificata dall ipotesi nulla (µ 0 = 12), ma é invece pari ad valore specifico di interesse, per esempio di interesse perché indice di una grave patologia? Ci interessa cioè capire se, nell ipotesi che i pazienti abbiano per esempio un media della variabile studiata alta in maniera preoccupante, per esempio µ = 14, tale differenza verrebbe identificata con il campione a disposizione in generale, la scelta del valore di µ da analizzare nell analisi della potenza dovrebbe identificare un valore di media particolarmente anomalo, che se fosse veramente la media della popolazione dalla quale abbiamo estratto il campione che stiamo analizzando vorremmo che venisse evidenziata con alta probabilità Utilizzando l applet al calcolatore con α = 0,05 n = 5 σ = 3 µ 0 = 12 (valore standard previsto dall ipotesi nulla) µ = 14 (valore ipotizzato per l ipotesi alternativa)

La potenza è pari a 0.316 Questo significa che se la media della popolazione fosse 14, avrei circa il 32% di probabilità di identificare con un campione di 5 individui questa deviazione dall ipotesi nulla. Ma avrei anche una probabilità molto alta (il 68% circa) che pur con una notevole deviazione della popolazione rispetto a quanto previsto dall ipotesi nulla (14 rispetto a 12), questa deviazione non verrebbe identificata Una situazione pericolosa, quindi, ci potrebbe sfuggire con alta probabilità (il 68%), suggerendoci per esempio di aumentare la dimensione campionaria (e aumentare quindi la potenza del test)