Test di Ipotesi. La distribuzione gaussiana delle medie consente anche di sottoporre ad esame critico ipotesi effettuate su una popolazione.

Documenti analoghi
Test d Ipotesi Introduzione

Facoltà di Farmacia Corso di Matematica con elementi di Statistica Docente: Riccardo Rosso. Cenni di statistica

Teorema del Limite Centrale

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

Campionamento casuale da popolazione finita (caso senza reinserimento )

STATISTICA INFERENZIALE

VERIFICA DI IPOTESI SULLA DIFFERENZA TRA DUE MEDIE. Psicometria 1 - Lezione 12 Lucidi presentati a lezione AA 2000/2001 dott.

Test d Ipotesi Esercizi

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

TEST STATISTICI. indica l ipotesi che il parametro della distribuzione di una variabile assume il valore 0

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Statistica I - A.A

Titolo della lezione. Dal campione alla popolazione: stima puntuale e per intervalli

Appunti di STATISTICA

6 Stima di media e varianza, e intervalli di confidenza

TECNICA DELLE MISURAZIONI APPLICATE 17 OTTOBRE 2012

Tecnica delle misurazioni applicate LM - Esame del 26 febbraio 2013

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Distribuzione Normale

APPROSSIMAZIONE NORMALE. 1. Si tirano 300 dadi non truccati. Sia X la somma dei punteggi. Calcolare approssimativamente le probabilità seguenti.

Esercitazione 6 del corso di Statistica 2

Esercitazioni di Statistica

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità B - Soluzione

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

Costo manutenzione (euro)

Statistica. Lezione 5

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità A - Soluzioni

Distribuzione normale

Probabilità e Statistica (cenni)

n=400 X= Km; s cor =9000 Km Livello di confidenza (1-α)=0,95 z(0,05)=1,96

Test Statistici. In termini statistici, agli eventi appena indicati viene attribuita una probabilità ed una specifica definizione:

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità C

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Anemia. Anemia - percentuali

AM110 - ESERCITAZIONI V - VI. Esercizio svolto 1. Dimostrare che ogni insieme finito ha un massimo ed un minimo.

Esercizi di Calcolo delle Probabilità e Statistica Matematica

LE MISURE DI TENDENZA CENTRALE

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

La validazione delle prove dei gruppi disciplinari (TECO-D)

Analisi Matematica Soluzioni prova scritta parziale n. 1

Tracce di soluzioni di alcuni esercizi di matematica 1 - gruppo 42-57

Argomenti trattati: Stima puntuale e stimatore Proprietà degli stimatori Stima puntuale della media della

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

STATISTICA 1 ESERCITAZIONE 5

Esame di Statistica A-Di Prof. M. Romanazzi

Appunti complementari per il Corso di Statistica

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 6

PROBLEMI DI INFERENZA SU MEDIE

Università di Napoli Federico II, DISES, A.a , CLEC, Corso di Statistica (L-Z) Lezione 22 La verifica delle ipotesi. Corso di Statistica (L-Z)

ESERCIZI SULLE SERIE

ANALISI VETTORIALE COMPITO IN CLASSE DEL 22/11/2013. = a 24 24! log(1 + x) = ( 1) = (24!) 1 24 = 23!. e x2 dx. x 2n

Matematica con elementi di Informatica

14. TEORIA DEI TEST STATISTICI

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

= ed è: n. 2 2 x. tra ns x

Fonti e strumenti statistici per la comunicazione

Soluzioni degli esercizi del corso di Analisi Matematica I

Esercitazioni del corso: ANALISI MULTIVARIATA

REGRESSIONE LINEARE E POLINOMIALE

2,3, (allineamenti decimali con segno, quindi chiaramente numeri reali); 4 ( = 1,33)

II Esonero - Testo A

Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

Esercitazioni di Geometria II

4. Proprietà degli stimatori

Esercizi sull estremo superiore ed inferiore

L INTERVALLO DI CONFIDENZA

Popolazione e Campione

TEORIA DELLE MATRICI. dove aij K. = di ordine n, gli elementi aij con i = j (cioè gli elementi a 11

LA VERIFICA DELLE IPOTESI SUI PARAMETRI

Tutorato di Probabilità 1, foglio I a.a. 2007/2008

Lezione 14. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 14. A. Iodice. disuguaglianza di Markov

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2009/10

Corso di Laurea Triennale in Matematica Calcolo delle Probabilità I (docenti G. Nappo, F. Spizzichino)

Legge Gamma e Legge Chi quadro

Esercizi con R. Corso Statistica corso avanzato A. A. 2013/2014

Principio di induzione: esempi ed esercizi

0.1 Esercitazioni V, del 18/11/2008

Popolazione e Campione

STUDIO DEL LANCIO DI 3 DADI

Appunti di Probabilità e Statistica. a.a. 2014/2015 C.d.L. Informatica Bioinformatica I. Oliva. 1 Statistica Inferenziale.

Lezione 4 Corso di Statistica. Domenico Cucina

Stima della media di una variabile X definita su una popolazione finita

LE MISURE DI SINTESI (misure di tendenza centrale)

Daniela Tondini

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

STATISTICA A K (63 ore)

Confronto di due misure Campioni indipendenti

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 5 luglio 2012

Gli Indici di VARIABILITA

Le principali procedure inferenziali: nozioni, schemi di procedimento ed esempi di applicazione

Statistica Inferenziale

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

SOLUZIONE DI ESERCIZI DI ANALISI MATEMATICA IV ANNO 2015/16, FOGLIO 2. se x [n, 3n]

(sqm ottenuto dividendo per n-1 ) =

Transcript:

La distribuzioe gaussiaa delle medie cosete ache di sottoporre ad esame critico ipotesi effettuate su ua popolazioe. Si suppoe che vega fatta ua affermazioe che localizzi la media µ della popolazioe (ipotesi zero). Per verificare l attedibilità dell ipotesi, si selezioa u campioe casuale sufficietemete grade ( > 30) di cui si calcola la media campioaria x e lo scarto quadratico medio campioario s. A questo puto si misura la distaza i termii di scarti quadratici medi di µ dalla media osservata sul campo x. Quato più x si allotaa da µ, tato più divetiamo sospettosi circa la validità dell ipotesi riguardate la media e siamo codotti a rigettare l ipotesi.

Così facedo ci assumiamo u rischio, quello che il campioe scelto avesse media x realmete molto lotaa da µ e che la media µ fosse accettabile. Il livello di rischio di predere ua decisioe sbagliata che siamo disposti a correre dipede dalle circostaze. Solitamete si accetta u rischio dell 1% o del 5%. Il rischio di predere la decisioe sbagliata sulla scorta dei dati del campioe è detto livello di sigificatività del test.

Esempio È stato affermato che il peso medio degli idividui adulti di ua certa azioe è µ = 68.5 kg. Voledo sottoporre questa ipotesi a verifica, si cosidera u campioe casuale di 625 idividui che vegoo pesati. Come esito della misura, si ottiee u valor medio campioario x = 69.1 kg co uo scarto quadratico medio campioario s = 7 kg. Se il livello di sigificatività del test è del 5%, quale sarà la coclusioe? Si rispoda alla stessa domada se il livello di sigificatività del test è dell 1%.

Misuriamo la distaza x µ = 0.6 kg della media campioaria dalla stima per µ coteuta ell ipotesi i termii di scarti quadratici medi. Poiché σ x = σ s = 25 7, il umero u di scarti quadratici di cui x si allotaa da µ risolve l equazioe 0.6 = 7 25 u, cioè vale u = 2.14. Sappiamo che ell itervallo [µ 1.96 s,µ + 1.96 s ] cade il 95% delle medie campioarie. La media campioaria aalizzata cade fuori da questo itervallo, oi siamo autorizzati a rigettare l ipotesi su µ, assumedoci u rischio del 5%.

Se però siamo disposti ad assumerci solo l 1% di rischio di predere la decisioe sbagliata, l esito del test è diverso. Ifatti, x appartiee all itervallo [µ 2.58 s,µ+2.58 s ] i cui cade il 99% delle medie campioarie. Quidi, l ipotesi su µ è compatibile co il risultato otteuto dal campioe casuale, se il livello di sigificatività è dell 1%, cioè se il rischio che siamo disposti a correre di predere ua decisioe sbagliata è soltato l 1%.

Esempio Ua compagia aerea afferma che il peso medio del bagaglio dei passeggeri dei suoi voli di liea è µ = 19.8 kg. Per sottoporre a verifica tale ipotesi si cosidera u campioe casuale di 324 passeggeri da cui emerge il peso medio campioario x = 20.3 kg, co scarto quadratico medio campioario s = 3.6 kg. Quali soo le coclusioi del test al livello di sigificatività dell 1%? Se si suppoe che i valori di x ed s siao stati otteuti da u campioe di 400 passeggeri, come cambiao le coclusioi del test?

Nel primo caso abbiamo s = 3.6 18 = 0.2 per cui, scrivedo x µ = 0.5 = (0.2)u si vede che u = 2.5: la media campioaria dista da quella coteuta ell ipotesi zero 2.5 scarti quadratici medi e duque è acora itera all itervallo [µ 2.58 s,µ+2.58 s ] etro cui cade il 99% dei dati: l esito del test è che o esistoo elemeti sufficieti per rigettare l ipotesi su µ, al livello di sigificatività richiesto.

Quado il campioe è formato da 400 passeggeri abbiamo s = 3.6 20 = 0.18 che corrispode ad ua distaza tra x e µ pari a 2.78 scarti quadratici medi che fa cadere x fuori dall itervallo [µ 2.58 s,µ + 2.58 s ]: la coclusioe del test è il rigetto dell ipotesi formulata su µ, co u margie di rischio dell 1%.

Osservazioe Nell esempio precedete erao preseti i due tipi di errore possibili i u test. Quado il campioe era composto da 324 passeggeri, l errore possibile era di rifiutare la media (errore di tipo II) quado questa era attedibile, almeo co i dati i possesso, metre co il campioe di 400 passeggeri l errore possibile era di riteere valida l ipotesi, quado questa si rivelava poco attedibile (errore di tipo I). L esempio ioltre mostra il ruolo giocato dalla gradezza del campioe ell esito del test.

Suppoiamo ora che l ipotesi zero da vagliare sia formulata i questi termii: il reddito medio di ua famiglia che abita i ua certa regioe o supera i 12500 Euro. Come si vede l ipotesi sulla media è più sfumata rispetto ai casi precedeti i quato si limita ad imporre u limite superiore alla media, o u valore preciso. Se si vuole sottoporre a verifica l ipotesi si può adottare ua procedura simile alla precedete: si cosidera la media otteuta da u campioe sufficietemete ampio e la si cofrota co il limite superiore per µ, 12500 Euro. È chiaro che, se x risulta iferiore a 12500 Euro o si ha alcu elemeto per rigettare l ipotesi e che i dubbi sulla botà dell ipotesi comiciao ad affiorare quado x supera i 12500 Euro. Se il test ha u livello di sigificatività del 5%, si avrao elemeti per rigettare l ipotesi quado x si lascia a siistra almeo il 95% dei dati, il che succede o appea si esce dall itervallo (,µ + 1.64σ x ].

Similmete, se il test ha u livello di sigificatività dell 1%, l ipotesi diveta rigettabile (co u margie di rischio dell 1%) o appea x esce dall itervallo (,µ +2.33σ x ] etro il quale cade il 99% dei dati. Test come quello i esame, ei quali l ipotesi sulla media è formulata i termii di disuguagliaze uilaterali, soo detti test ad ua coda. Se l ipotesi cotiee u affermazioe etta sulla media, come ei casi esamiati i precedeza, il test è a due code.

Suppoiamo di esamiare u campioe di 100 famiglie proveieti dalla regioe da studiare e che il reddito medio campioario sia risultato pari a 12550 Euro, co uo scarto quadratico medio campioario di 300 Euro. Cosa possiamo cocludere al livello di sigificatività del 5%? E al livello dell 1%? Poiché s = 30, la soluzioe dell equazioe 12550 12500 = 30u è u = 3 5 1.67. Duque, la media campioaria dista 1.67 scarti quadratici medi dal massimo valoreµ max = 12500 Euro di µ ammesso dall ipotesi ed è così estera all itervallo (,µ+1.64σ x ]: al livello del 5% l esito del test mi spige a rigettare l ipotesi formulata. Al cotrario, se si vuole adare icotro al rischio di errore dell 1% o possiamo rigettare l ipotesi i quato la media campioaria rietra ell itervallo (,µ+2.33σ x ].

Esempio U ricercatore itede saggiare, co livello di sigificatività del 5%, l affermazioe di ua ditta farmaceutica secodo la quale il tempo che itercorre tra l assuzioe di u farmaco e la maifestazioe dei primi effetti è al più di 4 miuti. A questo scopo cosidera u campioe casuale di 100 pazieti e trova che i media il tempo ecessario per riscotrare efficacia el farmaco è x = 4 miuti e 6 secodi, co scarto quadratico medio s = 0.6 miuti. Quali soo le coclusioi del test? Cambia qualcosa se i dati sperimetali hao scarto quadratico medio s = 0.64 miuti?

Covertiamo il tempo di reazioe del farmaco i forma decimale osservado che 4 miuti 6 secodi = 4.1 miuti. Si tratta di u test ad ua coda i quato avremo ragioe di dubitare della affermazioe della ditta solo se si misurao, come i questo caso, tempi di reazioe superiori al tetto massimo dichiarato dal produttore. Troviamo allora il valore di u che risolve l equazioe x µ = 0.1 = u s = 0.06u, cioè u = 1.67. Duque, x si trova a destra di µ, all estero della regioe (,µ+1.64σ x ]: al livello di sigificatività richiesto, l ipotesi sulla media è da respigere. Se s = 0.64, il valore di u diveta

u = 1.56: al livello di sigificatività richiesto l ipotesi o è rigettabile. I questo esempio si evidezia l importaza dell accuratezza della verifica sperimetale. Lo scarto quadratico medio misura ifatti la dispersioe dei dati attoro al valor medio e, crescedo, idica ua maggiore imprecisioe elle misure. Come si è visto, le coclusioi tratte dall esame dei dati soo state difformi ei due casi.