Esercitazioni di probabilità e statistica Test ipotesi

Documenti analoghi
Test delle Ipotesi Parte I

Approssimazione normale alla distribuzione binomiale

Esercizi di statistica inferenziale

Esercizi di statistica

STATISTICA. Esercitazione 5

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

Esame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Esercitazione 8 maggio 2014

STATISTICA E MODELLI DI DATI SPERIMENTALI

Statistica. Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Cognome: Tema C

STATISTICA ESERCITAZIONE 13

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

Gli errori nella verifica delle ipotesi

Distribuzioni campionarie

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

Fondamenti statistici : Test d Ipotesi (1)

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

SOLUZIONI DEL 2 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

Esame di Statistica del 16 aprile 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

TEST DI AUTOVALUTAZIONE TEST CHI-QUADRO. 1 Parte A In un test χ 2 di adattamento viene verificato

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Esercitazione 8 del corso di Statistica 2

lezione 4 AA Paolo Brunori

Argomenti della lezione:

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Parametri statistici

L Analisi della Varianza (ANOVA)

Contenuti: Capitolo 14 del libro di testo

Elaborazione statistica di dati

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

ESERCITAZIONE N. 7 corso di statistica

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Confronto tra due popolazioni Lezione 6

Analisi della varianza: I contrasti e il metodo di Bonferroni

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

Esame di Istituzioni di Matematiche II del 20 giugno 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

Elementi di Psicometria (con laboratorio software 1)

Elementi di Probabilità e Statistica - 052AA - A.A

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Università degli Studi di Cassino. Esercitazione di Statistica 2 dell Simona Balzano

La distribuzione normale

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Elementi di Psicometria con Laboratorio di SPSS 1

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Note sulla probabilità

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Soluzione Esercizio 1 (pag 1):

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 8/04/2016

Metodi statistici per le ricerche di mercato

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Esame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Il test (o i test) del Chi-quadrato ( 2 )

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

un elemento scelto a caso dello spazio degli esiti di un fenomeno aleatorio;

Caratterizzazione dei consumi energetici (parte 3)

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Casa dello Studente. Casa dello Studente

Metodi statistici per le ricerche di mercato

Statistica (parte II) Esercitazione 4

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Elementi di Probabilità e Statistica, A.A

Ulteriori Conoscenze di Informatica e Statistica

PROBABILITA. Distribuzione di probabilità

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 1-20/01/2010: A. Matricola: Corso:

9 - Esercizi su Test di Ipotesi e Media Pesata

Definizione della variabile c 2 Distribuzione della variabile c 2

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Il Test di Ipotesi Lezione 5

COMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti

Vedi: Probabilità e cenni di statistica

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

Corso di Laurea in Ingegneria Informatica Anno Accademico 2012/2013 Calcolo delle Probabilità e Statistica Matematica

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Materiale didattico per il corso di Statistica I Quarta esercitazione SOLUZIONI

Teorema del Limite Centrale

CP110 Probabilità: Esame 13 settembre Testo e soluzione

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Metodi statistici per lo studio dei fenomeni biologici

Transcript:

Esercitazioni di probabilità e statistica Test ipotesi Esercizio 2.: Due ditte producono un certo tipo di macchinario. La ditta A ne ha prodotti 6 e venduto, la ditta B ne ha venduti 4 su 9. Si formuli una opportuna ipotesi statistica e sulla base di questa si esegua un opportuno test, determinandone il livello di significatività, per determinare se si può affermare che la ditta B ha maggior probabilità di vendita rispetto alla ditta A. Per affrontare questi problemi è conveniente mettere in tabella di contingenza: A questo A B V 4 5 V 5 5 0 6 9 5 punto formalizziamo le ipotesi H 0 è l ipotesi nulla da verificare, mentre H è l ipotesi alternativa (da considerarsi valida quando H 0 viene rifiutata): H 0 A e V sono s-indipendenti H A e V sono s-dipendenti, quindi Pr{A V } < Pr{B V } A questo punto si definisce una variabile Y n con distribuzione nota quando H 0 risulta vera. Si suddivide lo spazio in due insiemi disgiunti uno in cui H 0 viene accettata (C) e uno in cui viene rigettata (C). La decisione di accettare o rifiutare l ipotesi nulla in seguito alle osservazioni è sempre affetta da due tipi di errore: a) l errore di prima specie α, quello che commettiamo se rigettiamo l ipotesi nulla H 0 quando essa è vera: α Pr{H H 0 } Pr{Y n C H 0 vera} b) l errore di seconda specie β, quello che commettiamo se accettiamo H 0 mentre è vera H : Quindi in questo caso posso scrivere che: e l errore di prima specie si può scrivere come: β Pr{H 0 H } Pr{Y n C H vera} Y 5 #(A V ) α Pr{Y 5 H 0 }

Usando il test esatto di Fisher (stiamo considerando numeri piccoli e non si può usare il χ 2 ) per testare l ipotesi posso dire che: α Pr{Y 5 H 0 } Pr{#(A V ) H 0 } Pr{#(A V ) 0 H 0 } + Pr{#(A V ) H 0 } ) ( 9 ) ( 9 4) 5) ( 6 ( 6 0 ( 5 ) + ( 5 ) 5 5 0.252 + 0.042 29.4% Questo è un risultato a rischio, il livello di significatività si ottiene facendo: α 70.6% Il test risulta negativo, non si può dire che si riesce a rigettare H 0 con abbastanza certezza. Esercizio 2.2: Un gruppo di medici ha trovato un possibile vaccino contro il comune raffreddore. Ne viene verificata l efficacia su un gruppo di 24 volontari divisi in 2 gruppi di 2 persone, uno sperimentale e uno di controllo. I membri del gruppo sperimentale vengono vaccinati, mentre quelli del gruppo di controllo no. Dopo sei mesi a tutte le 24 persone si chiede se abbiano avuto raffreddori durante il periodo trascorso. I risultati sono in tabella. vaccinati raffreddati SI NO SI 2 0 NO 7 5 a) Si formuli una ipotesi statistica per la verifica dell efficacia del vaccino. b) Sulla base di questa si esegua il test esatto di Fisher, determinandone il livello di significatività. c) Si può affermare che il vaccino contro il raffreddore è significativamente efficace? a) Come abbiamo fatto in precedenza mettiamo in tabella i dati, chiamiamo R il caso in sui si sia presentato il raffreddore e R il suo complemento, V il caso in cui sia stato somministrato il vaccino V il suo complemento. e formuliamo le ipotesi: R R V 2 0 2 V 7 5 2 9 5 24 H 0 il vaccino è inefficace ossia V e R sono s-indipendenti H il vaccino è efficace ossia V e R sono s-dipendenti In generale i problemi di questo tipo seguono uno schema semplice: b) Il test di Fisher in generale può essere scritto nei seguenti modi: Pr{Y a+b a} ( a+c) ( b+d ) a( b n ) notare che usiamo a perchè cerchiamo l intersezione R V a+b 2

v.a. Casi R R V a b a+b V c d c+d a+c b+d n a+b+c+d Tabella : Tabella generale per eseguire il test esatto di Fisher oppure in alternativa Quindi in questo caso: Pr{Y a+b a} (a + b)! (c + d)! (a + c)! (b + d)! n! a! b! c! d! α Pr{#(R V ) 2} Pr{Y 2 2 H 0 } Pr{Y 2 2 H 0 } + Pr{Y 2 H 0 } + Pr{Y 2 0 H 0 } ( 9 ( 5 ) ( 9 ( 5 ) ( 9 ( 5 ) 2) 0 ) + ) ) + 0) 2 ) ( 24 2 ( 24 2 ( 24 2 0.03998 + 0.0054 + 0.0007 0.045 c) In questo caso il livello di significatività è sempre α α 95.5% dal momento che α 5% il test esatto di Fisher è positivo, ovvero l assunzione H 0 comporta un evento improbabile. H 0 può essere rigettata. Esercizio 2.3: Per sperimentare un fertilizzante, un giardiniere sceglie 4 coppie di piante simili e tratta una pianta di ciascuna coppia con il fertilizzante. Dopo due mesi, 2 delle 4 piante trattare son più rigogliose delle corrispondenti non trattare (per i rimanenti due casi accade l opposto). a) Se il fertilizzante fosse inefficace quale sarebbe la probabilità che un puro caso abbia portato a 2 o più successi? b) I 2 successi forniscono indicazioni riguardo l efficacia del fertilizzante? In questo caso possiamo individuare due possibili esiti distinti: H il fertilizzante ha funzionato H 0 il fertilizzante non è efficace Siamo in un caso in cui l ipotesi che le due categorie possano occorrere ugualmente è nulla, quindi il test da usare è quello della binomiale. Chiamiamo y la v.a. numero di successi su 4 prove. Pr{y} ( 4 y ) 2 y 2 4 y 2 4 ( ) 4 y 3

a) Valutiamo quindi il fattore di rischio o errore di prima specie α: α Pr{y 2 H 0 } Pr{2} + Pr{3} + Pr{4} ( ) ( ) 4 4 2 2 4 + 3 2 4 + 2 4 5.55 0 3 + 8.54 0 4 + 6. 0 5 0.6% Questa è la probabilità che il risultato del fertilizzante sia stato un puro caso. b) Per valutare quanto i 2 successi ci dicano sull efficacia del fertilizzante basta valutare la significatività del test: Esercizion 2.4: α 99.4% In una certa scuola 420 studenti su un totale di 600 superano un test standardizzato di matematica per il quale il tasso nazionale di promozione è del 60%. a) Se gli studenti della scuola non hanno particolare attitudine per la matematica (né in positivo né in negativo), quanti studenti dovrebbero superare l esame mediamente? b) Qual è la probabilità che alemno 420 studenti superino l esame? c) Si può affermare che la scuola impartisce un buona preparazione agli studenti? In questo caso ho due soli esiti che possono uscire da questa analisi, inoltre uno è mutualmente esclusivo con l altro quindi il test da usare sarà quello della binomiale. Definiamo la probabilità che il test standardizzato venga passato come p 0.6. a) La media degli studenti che si si aspetta passino l esame è: A questo punto possiamo formulare le ipotesi: 600 p 360 H 0 probabilità di superamento uguale alle altre scuole, H probabilità di superamento più alta delle altre scuole. b) Usando il test della binomiale possiamo scrivere che: α Pr{Y 420} 600 y420 ( ) 600 0.6 y 0.4 600 y y Dobbiamo porre l attenzione sul fatto che la sommatoria spazia su n grandi, in questo caso sappiamo che la distribuzione binomiale si riduce ad una gaussiana con stessa media e varianza. Quindi: Possiamo quindi riscrivere: µ 360, σ 2 npq 600 0.6 0.4 44, σ 2 α Pr{Y 420} 600 2 2π (Y 360)2 e 2 2 2 dy 420 facciamo un cambio di variabile u Y 360, dy 2du 2 4

Quindi: α 20 2π 3 0.7 0 5 e u2 2 du c) Il livello di rischio è nullo, quindi si può affermare che il livello si istruzione fornito dalla scuola è buono senza alcun dubbio. Esercizion 2.5: Su un numero ridotto di cavie si sono sperimentati due pesticidi per verificare se quello di nuova produzione B abbia effetti più letali di quello usato in precedenza A. Il risultato dell esperimento si può vedere in tabella. Sopravvissute cavie Non sopravvissute Pesticida A 7 Pesticida B 3 6 a) Si formuli una ipotesi statistica per la verifica dell efficacia del pesticida. b) Sulla base di questa si esegua il test esatto fi Fisher, determinandone il livello di significatività. c) Si può affermare che il pesticida di nuova generazione è più efficace del pesticida A? Costruiamo la tabella di contingenza per quanto riguarda l esperimento in considerazio- ne: A B S 7 3 0 S 6 7 8 9 7 a) Formuliamo le ipotesi statistiche tenendo a mente che H 0 e H devono essere mutualmente esclusive: H 0 A e B hanno la stessa efficacia, H A e B hanno efficacia diversa Pr{S B} > Pr{S A}. b) Eseguiamo il test di Fisher considerando la variabile #(B S): α Pr{#(B S) 6} Pr{#(B S) 6} + Pr{#(B S) 7} ) ( 8 ) ( 8 ) 0) ( 9 ( 9 6 7 ( 7 ) + ( 7 ) 7 7 0.036 3.6% c) Calcolando la significatività del test: α 96.4% si può concludere che l ipotesi H 0 viene rigettata e si considera attendibile l ipotesi H. 5

Esercizion 2.6: Su due campioni indipendenti sono stati registrati le seguenti frequenze di valori eccedenti (+) e non eccedenti (-) la mediana comune (ossia calcolata sull insieme dei due campioni): + I 3 6 9 II 5 2 7 8 8 6 Si verifichi se i due campioni appartengono a popolazioni diverse. Iniziamo formulando le ipotesi: H 0 I e II hanno la stessa mediana, H I e II hanno mediane diverse. poi valutiamo α sull intersezione tra i casi ( ) e il campione II. α Pr{#( II) 2} Pr{#( II) 2} + Pr{#( II) } + Pr{#( II) 0} ) ( 8 ) ( 8 ) ( 8 5) 6) 7) ( 8 ( 8 ( 8 2 0 ( 6 ) + ( 6 ) + ( 6 ) 7 7 7 0.37 + 0.02 + 0.00 0.58 5.7% Il test di Fisher risulta negativo. Non riusciamo infatti a scartare l ipotesi H 0 con l adeguata significatività: α 84.3% Si può procedere anche nel seguente modo, senza nessuna differenza: I II + 3 5 8 6 2 8 9 7 6 e poi procedere con il test di Fisher seguendo la medesima procedura: α Pr{#(II ) 2} Pr{#(II ) 2} + Pr{#(II ) } + Pr{#(II ) 0} ) ( 9 ) ( 9 ) ( 9 6) 7) 8) ( 7 2 ( 7 ( 7 0 ( 6 ) + ( 6 ) + ( 6 ) 8 8 8 0.37 + 0.02 + 0.00 0.58 5.7% 6