Test di significatività

Documenti analoghi
Inferenza su una popolazione

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Basi metodologiche della ricerca in ambito sportivo

STATISTICA A K (60 ore)

Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

Metodi statistici per lo studio dei fenomeni biologici

Gli errori nella verifica delle ipotesi

Modelli descrittivi, statistica e simulazione

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005

Esercizi riassuntivi di Inferenza

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Elementi di Psicometria (con laboratorio software 1)

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

LEZIONI DI STATISTICA MEDICA

Statistica 1- parte II

Laboratorio di Probabilità e Statistica

Test d Ipotesi - Esempi

Teoria della stima dei parametri:

Capitolo 9 Verifica di ipotesi: test basati su un campione

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Esercitazione 8 del corso di Statistica 2

Capitolo 9 Verifica di ipotesi: test basati su un campione

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Statistica inferenziale

INTERVALLI DI CONFIDENZA

Corso di Statistica Esercitazione 1.8

Test d Ipotesi Introduzione

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

Verifica delle ipotesi. Verifica delle ipotesi

Verifica delle ipotesi

Argomenti della lezione:

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

Parametri statistici

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

DISTRIBUZIONI DI CAMPIONAMENTO

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

Analisi della varianza

Brevi cenni all intervallo di confidenza

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Laboratorio di Probabilità e Statistica

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA A K (60 ore)

Test di ipotesi. Test

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

ESERCITAZIONE N. 7 corso di statistica

ESAME. 9 Gennaio 2017 COMPITO B

Contenuti: Capitolo 14 del libro di testo

ESAME. 9 Gennaio 2017 COMPITO A

Approssimazione normale alla distribuzione binomiale

Teorema del Limite Centrale

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA. Esercitazione 5

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

PROVE (TEST) DI IPOTESI VERIFICA DI IPOTESI (TEST DI IPOTESI)

Esercizi di Probabilità e Statistica

Introduzione alla verifica d ipotesi

Metodi statistici per le ricerche di mercato

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

Test di ipotesi (a due code, σ nota)

Inferenza nel caso di un conteggio 21-2

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Elementi di Psicometria con Laboratorio di SPSS 1

OD TEST DI IPOTESI 50

Esame di Statistica A-Di Prof. M. Romanazzi

Soluzione Esercizio 1 (pag 1):

lezione 4 AA Paolo Brunori

Cenni all interpretazione di un Test d ipotesi

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Metodi statistici per le ricerche di mercato

Occorre trovare la distribuzione di DM

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

1. Quali sono i possibili campioni di numerosità 2 senza reimmissione? X 1 e X 2 sono indipendenti?

Statistica Inferenziale

Metodi statistici per le ricerche di mercato

Statistica inferenziale per variabili quantitative

STATISTICA ESERCITAZIONE 13

05. Errore campionario e numerosità campionaria

Metodi statistici per le ricerche di mercato

Dr. ssa Elena Schievano Statistico c/o Sistema Epidemiologico Regionale SER Regione Veneto

Statistica I. Ingegneria Gestionale. Scritto del 20/07/2010

Esercizi di statistica inferenziale

Test d ipotesi: confronto fra medie

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Metodi statistici per le ricerche di mercato

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Esercizi di statistica

Fondamenti statistici : Test d Ipotesi (1)

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Intervallo di confidenza

Transcript:

Test di significatività

I test di significatività hanno come scopo quello di comprendere se la rilevazione da noi fatta sul campione può essere considerata un evento straordinario o la norma. Quantificare l'evidenza fornita dai dati nei confronti di una certa ipotesi riguardante la popolazione. Osservare un risultato che si verifica molto raramente se una certa affermazione fosse vera indica che in realtà è falsa.

Si afferma che la popolazione abbia una certa caratteristica e si verifica se i dati rappresentano una prova evidente contro questa affermazione.

I produttori di bibite dietetiche utilizzano dolcificanti artificiali al posto dello zucchero. E' noto che queste sostanze perdono gradualmente il loro potere dolcificante e, per questo motivo, i produttori misurano la perdita di dolcezza prima di immettere il prodotti sul mercato. Alcuni assaggiatori professionisti provano la bevanda e ne misurano la dolcezza sulla base di una scala che va da 1 a 10. Dopo un mese ogni assaggiatore dà un secondo punteggio alla bevanda. Questo è un tipico esperimento con dati appaiati; infatti i dati da analizzare sono le differenze (ad un mese di sistanza) nei punteggi assegnati dagli assaggiatori alla stessa bevanda. Supponiamo che, per ogni tipo di bibita, la perdita di dolcezza si distribuisca normalmente con deviazione standard σ=1 e media μ diversa da bibita a bibita. I seguenti dati si riferiscono alla perdita di dolcezza segnalata da 10 assaggiatori professionisti per una nuova bibita da immettere sul mercato: 2.0 ; 0.4 ; 0.7 ; 2.0 ; -0.4 ; 2.2 ; -1.3 ; 1.2 ; 1.1 ; 2.3

La maggior parte dei valori sono positivi, ciò significa che molti assaggiatori hanno riscontrato una perdita di dolcezza. Tuttavia le differenze sono piuttosto contenute e due assaggiatori hanno riscontrato un aumento della dolcezza della bevanda. La perdita di dolcezza è quantificabile attraverso la media campionaria: x m = 2.0 0.4... 2.3 10 =1.02 Questo prova che la bibita perde dolcezza? Si afferma che la popolazione abbia una certa caratteristica e si vede se i dati rappresentano una prova evidente contro questa affermazione. Nel nostro caso, vogliamo vedere se vi è evidenza di perdita di dolcezza, per cui l'affermazione che verifichiamo è che non ci sia perdita. In questo caso, la perdita media riscontrata nella popolazione di tutti gli assaggiatori professionisti sarebbe μ = 0

Se μ = 0 fosse vero, la distribuzione campionaria della media x(m) relativa a campioni di 10 assaggiatori sarebbe Normale con media x(m) = μ = 0 e deviazione standard pari a: n = 1 10 =0.316 Supponiamo che 10 assaggiatori diano una perdita media di dolcezza pari a x(m) = 0.3. Questo valore non è incompatibile con una distribuzione di media μ = 0. Il fatto di avere osservato una media x(m) = 0.3 non rappresenta una prova evidente che ci sia perdita di dolcezza. In realtà, la media osservata è x = 1.02. Questo valore è molto lontano dal centro della distribuzione, così lontano che raramente potremmo osservare un valore ancora più grande. Il valore osservato è una prova evidente che la media della popolazione è diversa da 0.

L'importanza delle ipotesi Bisogna, innanzitutto, individuare qual'é l'affermazione contro cui cerchiamo prove evidenti. Ad esempio: non vi è alcuna perdita di dolcezza In un test statistico si verifica l'ipotesi nulla H 0, quanto sono forti le evidenze sperimentali contro l'ipotesi nulla?

L'ipotesi per cui stiamo cercando prove a favore si chiama ipotesi alternativa H a. Nell'esempio precedente esiste una perdita di dolcezza della bevanda. Le ipotesi si riferiscono a modelli teorici od ad intere popolazioni non a risultati particolari. Le ipotesi siano nulle o alternative vanno formulate sulla popolazione.

Statistica test Una statistica test: Confronta il valore del parametro secondo l'ipotesi nulla con la stima del parametro ottenuta con i dati osservati. Con valore elevato indica che la stima è lontana dal valore del parametro specificato sotto H 0. Valori elevati della statistica test rappresentano quindi delle prove evidenti contro H 0.

Nell'esempio della bevanda l'ipotesi nulla era H 0 : μ = 0 e la stima di μ è x(m) = 1.02. La statistica test per l'ipotesi sulla media μ in una popolazione Normale è la versione standardizzata della media campionaria x(m): z= x m / n La statistica z esprime quanto è lontana la media campionaria x(m) da μ, la media della popolazione, assumendo la deviazione standard campionaria come unità di misura. z= 1.02 0 1/ 10 =3.23

Dal momento che z è più grande della media μ di 3 deviazioni standard abbiamo un segnale evidente che la perdita media nel grado di dolcezza della bevanda non è nulla.

Se la statistica test assume valori elevati, nella direzione suggerita dall'ipotesi alternativa, allora non è verosimile che i nostri dati provengano da una popolazione in cui l'ipotesi nulla è vera. P La probabilità, calcolata assumendo H 0 vera, che la statistica test assuma un valore tanto estremo o anche più estremo di quello osservato nel campione, è il valore P associato al test statistico. Più è piccolo il valore di P, più forte sarà l'evidenza fornita dai dati contro H 0. Cioè il risultato osservato si può ottenere raramente in una popolazione in cui H 0 è vera.

I 10 assaggiatori dell'esempio sulle bevande hanno trovato una perdita media di dolcezza pari a x(m) = 1.02. Questo valore è piuttosto lontano dal valore μ = 0, infatti la statistica test z, che misura esattamente quanto x(m) sia lontano da μ risulta pari a z = 3.23. Poiché x(m) segue una distribuzione Normale Standard e z ne è una versione standardizzata anche z seguirà una distribuzione Normale Standard. La probabilità P esprime la probabilità che z assuma valori superiori a 3.23. Si utilizza la tavola della probilità di una Normale Standard per calcolare P.

Significatività statistica Il confronto del valore di P ottenuto con un valore di riferimento ci consente i individuare un livello di significatività. Generalmente i livelli di significatività si indicano con la lettera greca α e sono individuati a 0.05 e 0.01; rispettivamente al 5% ed all'1%. Se P ha un valore pari o minore del livello di significatività stabilito allora diremo che i dati sono statisticamente significativi al livello di α. Un risultato con P = 0.03 è significativo per α = 0.05 ma non lo è per α = 0.01.

Esempio Il laboratorio dell'esempio sulla concentrazione del principio attivo vuole valutare se la concentrazione del principio attivo del campione è pari allo 0,86. x(m) = 0.8404 e μ = 0.0068. La significatività è accettata per P < 0.01. L'ipotesi è che la [ ] è diversa da 0.86. Quindi l'ipotesi nulla assume che la [ ] sia uguale a 0.86. La statistica test: z= 0.8404 0.86 0.0068/ 3 = 4.99= 4.99

Puntualizzazioni Requisito fondamentale per rendere efficace un processo di inferenza è l'applicazione delle leggi della probabilità per la raccolta dei dati. Gli intervalli di confidenza ed i test statistici non possono rimediare ad errori commessi durante la raccolta dati, come campioni a risposta volontaria o esperimenti senza randomizzazione. In questi casi bisogna affidarsi alla conoscenza della materia specifica. Può comunque capitare di fare inferenza su dati che non sono stati ottenuti casualmente in questi casi bisogna verificare se i dati siano rappresentativi per il parametro per cui si sono raccolti.

Un'emittente televisiva effettua un sondaggio a risposta volontaria ponendo ai telespettatori la seguente domanda: Secondo la sua opinione, quanto dovrebbe guadagnare annualmente un consigliere comunale? rispondono 958 telespettatori, dando origine ad una media x(m) = 8740 euro l'anno con una deviazione standard s = 1125 euro. Per un campione di queste dimensioni s = σ quindi σ = 1125 euro. L'emittente calcola un intervallo di confidenza al 95% per lo stipendio medio μ. Tale intervallo va da 8669 a 8811 euro. I calcoli effettuati dall'emittente sono corretti? Le conclusioni sono rappresentative per l'intera popolazione degli abitanti della città?

Condizioni per utilizzare intervalli di confidenza e test I dati devono essere un CCS della popolazione. In ogni caso devono essere rappresentativi. Metodi diversi sono necessari per disegni diversi Gli outlier possono distorcere il risultato La distribuzione della popolazione deve essere Normale. (anche se il teorema del limiti centrale).

Il margine di errore in un intervallo di confidenza tiene conto solamente degli errori campionari. Difficoltà pratiche, come la sotto-compertura e la mancata risposta, sono spesso molto più gravi degli errori campionari, e il margine di errore degli intervalli di confidenza non prende in considerazione questi aspetti. Quanto deve essere piccolo P per risultare convincente? Quanto è plausibile H 0 Quali sono le conseguenze del rifiuto di H 0.

Errori Si commette un Errore di I specie quando si rifiuta l'ipotesi nulla quando questa in realtà è vera. Si commette un Errore di II specie non rifiutando l'ipotesi nulla quando l'ipotesi alternativa è vera.