Test di significatività
I test di significatività hanno come scopo quello di comprendere se la rilevazione da noi fatta sul campione può essere considerata un evento straordinario o la norma. Quantificare l'evidenza fornita dai dati nei confronti di una certa ipotesi riguardante la popolazione. Osservare un risultato che si verifica molto raramente se una certa affermazione fosse vera indica che in realtà è falsa.
Si afferma che la popolazione abbia una certa caratteristica e si verifica se i dati rappresentano una prova evidente contro questa affermazione.
I produttori di bibite dietetiche utilizzano dolcificanti artificiali al posto dello zucchero. E' noto che queste sostanze perdono gradualmente il loro potere dolcificante e, per questo motivo, i produttori misurano la perdita di dolcezza prima di immettere il prodotti sul mercato. Alcuni assaggiatori professionisti provano la bevanda e ne misurano la dolcezza sulla base di una scala che va da 1 a 10. Dopo un mese ogni assaggiatore dà un secondo punteggio alla bevanda. Questo è un tipico esperimento con dati appaiati; infatti i dati da analizzare sono le differenze (ad un mese di sistanza) nei punteggi assegnati dagli assaggiatori alla stessa bevanda. Supponiamo che, per ogni tipo di bibita, la perdita di dolcezza si distribuisca normalmente con deviazione standard σ=1 e media μ diversa da bibita a bibita. I seguenti dati si riferiscono alla perdita di dolcezza segnalata da 10 assaggiatori professionisti per una nuova bibita da immettere sul mercato: 2.0 ; 0.4 ; 0.7 ; 2.0 ; -0.4 ; 2.2 ; -1.3 ; 1.2 ; 1.1 ; 2.3
La maggior parte dei valori sono positivi, ciò significa che molti assaggiatori hanno riscontrato una perdita di dolcezza. Tuttavia le differenze sono piuttosto contenute e due assaggiatori hanno riscontrato un aumento della dolcezza della bevanda. La perdita di dolcezza è quantificabile attraverso la media campionaria: x m = 2.0 0.4... 2.3 10 =1.02 Questo prova che la bibita perde dolcezza? Si afferma che la popolazione abbia una certa caratteristica e si vede se i dati rappresentano una prova evidente contro questa affermazione. Nel nostro caso, vogliamo vedere se vi è evidenza di perdita di dolcezza, per cui l'affermazione che verifichiamo è che non ci sia perdita. In questo caso, la perdita media riscontrata nella popolazione di tutti gli assaggiatori professionisti sarebbe μ = 0
Se μ = 0 fosse vero, la distribuzione campionaria della media x(m) relativa a campioni di 10 assaggiatori sarebbe Normale con media x(m) = μ = 0 e deviazione standard pari a: n = 1 10 =0.316 Supponiamo che 10 assaggiatori diano una perdita media di dolcezza pari a x(m) = 0.3. Questo valore non è incompatibile con una distribuzione di media μ = 0. Il fatto di avere osservato una media x(m) = 0.3 non rappresenta una prova evidente che ci sia perdita di dolcezza. In realtà, la media osservata è x = 1.02. Questo valore è molto lontano dal centro della distribuzione, così lontano che raramente potremmo osservare un valore ancora più grande. Il valore osservato è una prova evidente che la media della popolazione è diversa da 0.
L'importanza delle ipotesi Bisogna, innanzitutto, individuare qual'é l'affermazione contro cui cerchiamo prove evidenti. Ad esempio: non vi è alcuna perdita di dolcezza In un test statistico si verifica l'ipotesi nulla H 0, quanto sono forti le evidenze sperimentali contro l'ipotesi nulla?
L'ipotesi per cui stiamo cercando prove a favore si chiama ipotesi alternativa H a. Nell'esempio precedente esiste una perdita di dolcezza della bevanda. Le ipotesi si riferiscono a modelli teorici od ad intere popolazioni non a risultati particolari. Le ipotesi siano nulle o alternative vanno formulate sulla popolazione.
Statistica test Una statistica test: Confronta il valore del parametro secondo l'ipotesi nulla con la stima del parametro ottenuta con i dati osservati. Con valore elevato indica che la stima è lontana dal valore del parametro specificato sotto H 0. Valori elevati della statistica test rappresentano quindi delle prove evidenti contro H 0.
Nell'esempio della bevanda l'ipotesi nulla era H 0 : μ = 0 e la stima di μ è x(m) = 1.02. La statistica test per l'ipotesi sulla media μ in una popolazione Normale è la versione standardizzata della media campionaria x(m): z= x m / n La statistica z esprime quanto è lontana la media campionaria x(m) da μ, la media della popolazione, assumendo la deviazione standard campionaria come unità di misura. z= 1.02 0 1/ 10 =3.23
Dal momento che z è più grande della media μ di 3 deviazioni standard abbiamo un segnale evidente che la perdita media nel grado di dolcezza della bevanda non è nulla.
Se la statistica test assume valori elevati, nella direzione suggerita dall'ipotesi alternativa, allora non è verosimile che i nostri dati provengano da una popolazione in cui l'ipotesi nulla è vera. P La probabilità, calcolata assumendo H 0 vera, che la statistica test assuma un valore tanto estremo o anche più estremo di quello osservato nel campione, è il valore P associato al test statistico. Più è piccolo il valore di P, più forte sarà l'evidenza fornita dai dati contro H 0. Cioè il risultato osservato si può ottenere raramente in una popolazione in cui H 0 è vera.
I 10 assaggiatori dell'esempio sulle bevande hanno trovato una perdita media di dolcezza pari a x(m) = 1.02. Questo valore è piuttosto lontano dal valore μ = 0, infatti la statistica test z, che misura esattamente quanto x(m) sia lontano da μ risulta pari a z = 3.23. Poiché x(m) segue una distribuzione Normale Standard e z ne è una versione standardizzata anche z seguirà una distribuzione Normale Standard. La probabilità P esprime la probabilità che z assuma valori superiori a 3.23. Si utilizza la tavola della probilità di una Normale Standard per calcolare P.
Significatività statistica Il confronto del valore di P ottenuto con un valore di riferimento ci consente i individuare un livello di significatività. Generalmente i livelli di significatività si indicano con la lettera greca α e sono individuati a 0.05 e 0.01; rispettivamente al 5% ed all'1%. Se P ha un valore pari o minore del livello di significatività stabilito allora diremo che i dati sono statisticamente significativi al livello di α. Un risultato con P = 0.03 è significativo per α = 0.05 ma non lo è per α = 0.01.
Esempio Il laboratorio dell'esempio sulla concentrazione del principio attivo vuole valutare se la concentrazione del principio attivo del campione è pari allo 0,86. x(m) = 0.8404 e μ = 0.0068. La significatività è accettata per P < 0.01. L'ipotesi è che la [ ] è diversa da 0.86. Quindi l'ipotesi nulla assume che la [ ] sia uguale a 0.86. La statistica test: z= 0.8404 0.86 0.0068/ 3 = 4.99= 4.99
Puntualizzazioni Requisito fondamentale per rendere efficace un processo di inferenza è l'applicazione delle leggi della probabilità per la raccolta dei dati. Gli intervalli di confidenza ed i test statistici non possono rimediare ad errori commessi durante la raccolta dati, come campioni a risposta volontaria o esperimenti senza randomizzazione. In questi casi bisogna affidarsi alla conoscenza della materia specifica. Può comunque capitare di fare inferenza su dati che non sono stati ottenuti casualmente in questi casi bisogna verificare se i dati siano rappresentativi per il parametro per cui si sono raccolti.
Un'emittente televisiva effettua un sondaggio a risposta volontaria ponendo ai telespettatori la seguente domanda: Secondo la sua opinione, quanto dovrebbe guadagnare annualmente un consigliere comunale? rispondono 958 telespettatori, dando origine ad una media x(m) = 8740 euro l'anno con una deviazione standard s = 1125 euro. Per un campione di queste dimensioni s = σ quindi σ = 1125 euro. L'emittente calcola un intervallo di confidenza al 95% per lo stipendio medio μ. Tale intervallo va da 8669 a 8811 euro. I calcoli effettuati dall'emittente sono corretti? Le conclusioni sono rappresentative per l'intera popolazione degli abitanti della città?
Condizioni per utilizzare intervalli di confidenza e test I dati devono essere un CCS della popolazione. In ogni caso devono essere rappresentativi. Metodi diversi sono necessari per disegni diversi Gli outlier possono distorcere il risultato La distribuzione della popolazione deve essere Normale. (anche se il teorema del limiti centrale).
Il margine di errore in un intervallo di confidenza tiene conto solamente degli errori campionari. Difficoltà pratiche, come la sotto-compertura e la mancata risposta, sono spesso molto più gravi degli errori campionari, e il margine di errore degli intervalli di confidenza non prende in considerazione questi aspetti. Quanto deve essere piccolo P per risultare convincente? Quanto è plausibile H 0 Quali sono le conseguenze del rifiuto di H 0.
Errori Si commette un Errore di I specie quando si rifiuta l'ipotesi nulla quando questa in realtà è vera. Si commette un Errore di II specie non rifiutando l'ipotesi nulla quando l'ipotesi alternativa è vera.