Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Documenti analoghi
Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Esercitazione 8 del corso di Statistica 2

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

STATISTICA AZIENDALE Modulo Controllo di Qualità

Intervalli di confidenza

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Esercizi di Probabilità e Statistica

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Casa dello Studente. Casa dello Studente

Esercizi riassuntivi di Inferenza

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Statistica. Alfonso Iodice D Enza

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Premessa: la dipendenza in media

Capitolo 11 Test chi-quadro

Analisi della varianza

Approssimazione normale alla distribuzione binomiale

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Statistica. Alfonso Iodice D Enza

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Test di ipotesi su due campioni

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Matematica II: Calcolo delle Probabilità e Statistica Matematica

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio Lanzotti

Note sulla probabilità

Statistica. Alfonso Iodice D Enza

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Distribuzioni campionarie

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Analisi della varianza a una via

Test d Ipotesi Introduzione

Corso di Psicometria Progredito

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Esercitazione 4 del corso di Statistica (parte 2)

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Esercitazione 4 del corso di Statistica 2 Prof. Domenico Vistocco

Statistica. Alfonso Iodice D Enza

Capitolo 9 Verifica di ipotesi: test basati su un campione

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Il confronto fra medie

Il test (o i test) del Chi-quadrato ( 2 )

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

Test delle ipotesi sulla media.

Statistica. Alfonso Iodice D Enza

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

Gli errori nella verifica delle ipotesi

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

Esercizi di Calcolo delle Probabilità

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Esercitazione di Statistica Indici di associazione

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Statistica Applicata all edilizia Lezione: carte di controllo

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Gestione ed Analisi Statistica dei dati

Caratterizzazione dei consumi energetici (parte 3)

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica. Alfonso Iodice D Enza

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Schema lezione 5 Intervalli di confidenza

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

Z-test, T-test, χ 2 -test

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica descrittiva II

Esercitazione: La distribuzione NORMALE

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Proprietà della varianza

LAUREA SPECIALISTICA IN FARMACIA - Prova scritta di MATEMATICA - 24/01/03 ANNI PRECEDENTI. 1. (Punti 10) Si consideri la funzione

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

DISTRIBUZIONE NORMALE (1)

ESERCIZIO 1. b) E' necessario formulare ipotesi per procedere al test richiesto al punto a? (motivare brevemente la risposta)

5. Test per proporzioni: confronto tra campioni e associazione

STATISTICA. Esercizi vari

Scanned by CamScanner

STATISTICHE DESCRITTIVE Parte II

Test per la correlazione lineare

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Vedi: Probabilità e cenni di statistica

Transcript:

Esercitazione 14 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 14

Ex.1: Verifica Ipotesi sulla media (varianza nota) Le funi prodotte da un certo macchinario hanno una resistenza media alla rottura pari a µ = 1800N con una variabilità (scarto quadratico medio) σ = 100N. In seguito ad una modifica nel processo produttivo, si ritiene che la resistenza alla rottura delle funi prodotte sia migliorata. Per verificare tale miglioramento è stato analizzato un campione di n = 50 funi di nuova produzione. La resistenza nuova osservata è stata X = 1850N. Verificare ad un livello di significatività del α = 0.01 che il vi sia un effettivo miglioramento nella resistenza delle funi. L effetto del nuovo processo produttivo è positivo se si traduce in un aumento della resistenza media alla rottura delle funi prodotte. Formalmente, H 0 : µ = 1800 H 1 : µ > 1800 () 2 / 14

Ex.1: Verifica Ipotesi sulla media (varianza nota) Il test è unidirezionale, si è interessati a che la statistica test costruita in base alla media osservata. In particolare la statistica di interesse è Z oss = X µ σ/ 1850 1800 = n 100/ = 3.55 50 Per verificare se l nulla sia da rifiutare o meno è necessario confrontare il valore della statistica osservata con il valore critico Z c = Z 1 α = Z 0.99 = 2.33. Poichè risulta Z oss > Z c(3.55 > 2.33), si rifiuta l nulla e si può concludere che il nuovo processo produttivo abbia effetto sulla resistenza delle funi. () 3 / 14

Ex.1.1: Verifica Ipotesi sulla media Si consideri di voler applicare la stessa modifica del processo produttivo ad un macchinario che produce funi caratterizzati da una resistenza media µ = 1830N. Si supponga che la variabilità sia uguale a quella del macchinario precedente σ = 100. Calcolare il p.value sapendo che anche in questo caso il campione di 50 unità osservato ha una resistenza media di X = 1850. nota Il p.value è il più piccolo livello di significatività tale da indurre al rifiuto dell H 0 sulla base dei dati osservati. In altre parole rappresenta la probabilità che i dati non compatibili con l nulla siano stati osservati quando in realtà H 0 era vera. Di conseguenza un p.value molto piccolo è un forte indicatore del fatto che H 0 non è vera. () 4 / 14

Ex.1.1: Verifica Ipotesi sulla media Si consideri di voler applicare la stessa modifica del processo produttivo ad un macchinario che produce funi caratterizzati da una resistenza media µ = 1830N. Si supponga che la variabilità sia uguale a quella del macchinario precedente σ = 100. Calcolare il p.value sapendo che anche in questo caso il campione di 50 unità osservato ha una resistenza media di X = 1850. svolgimento Z oss = X µ σ/ n = n σ ( ) 50 X µ = 1850 1830 = 1.41 100 si vuole P (Z > 1.41) = 1 P (Z < 1.41) = 1 0.9207 = 0.0793 dunque il p.value =.0793: questo vuol dire che ad un livello di significatività del 5% H 0 non sarebbe da rifiutare(z 1 0.05 = 1.645, dunque 1.41 < 1.645), mentre un test al 10% di significatività indurrebbe a rifiutare H 0 (Z 1 0.1 = 1.285, dunque 1.41 > 1.285). () 5 / 14

Ex.2: Verifica Ipotesi sulla media (varianza non nota) Un gruppo di volontari tra i pazienti ricoverati in ospedale per colesterolo alto (almeno 240ml per ogni dl decilitro di sangue) è stato selezionato per testare l efficacia di un farmaco anti-colesterolo. Dunque a 40 volontari è stato somministrato il farmaco per 60 giorni ed stato poi misurato nuovamente il livello di colesterolo. Il livello medio di colesterolo nel campione si è ridotto di 6.8, mentre la deviazione standard campionaria riscontrata è 12.1. Utilizzare un livello di significatività pari al 5%. Per testare che la variazione del livello di colesterolo riscontrata dopo il trattamento occorre considerare le seguenti H 0 : µ = 0 H 1 : µ 0 dove µ rappresenta il decremento di colesterolo. () 6 / 14

Ex.2: Verifica Ipotesi sulla media (varianza non nota) La statistica test da utilizzare in questo caso è T oss = X µ n S/ n = S ( ) 40 X µ = 6.8 = 3.554 12.1 il valore critico è t n 1,α/2 = t 39,0.025 = 2.02. Poichè T oss > T c allora si rifiuta H 0. Esiste dunque un effetto non casuale sul livello di colesterolo, non si può tuttavia sostenere che il farmaco abbia avuto effetto: potrebbero essere state altre le cause del miglioramento dello stato dei pazienti (effetto placebo). E dunque prassi operativa separare i pazienti in due gruppi: solo ad uno dei due gruppi si somministra realmente il farmaco, dopo di che si analizzano le eventuali variazioni nel livello di colesterolo tra i due gruppi. Il p.value = 2P (T 39 > 3.554) = 0.0001. () 7 / 14

Ex.3: Verifica Ipotesi sulla proporzione In un esperimento per verificare eventuali capacità extrasensoriali di un soggetto A si procede nel seguente modo: si consegna un mazzo di 50 carte di colore rosso e blu. La prova per il soggetto A consiste nell indovinare il colore della carta scelta da un soggetto B che si trova in un altra stanza. Se il soggetto A indovina 32 carte, è possibile sostenere che si tratta di un fenomeno paranormale, ad un livello di significatività del 5%? La probabilità che un soggetto indovini se la carta è blu o rossa è p = 0.5. L nulla è che il soggetto A provi semplicemente ad indovinare le scelte di B; l alternativa e che il soggetto A abbia effettivamente delle capacità extrasensoriali. Formalmente, H 0 : p = 0.5 H 1 : p > 0.5 Il test è unidirezionale dal momento che si è interessati a che il soggetto A abbia prestazioni superiori al semplice tirare ad indovinare. Sotto nulla, vale a dire per p = 0.5, media e scarto quadratico medio valgono rispettivamente µ = Np = 50 0.5 = 25 e σ = Np(1 p) = 50 0.5 0.5 = 12.5 = 3.54. () 8 / 14

Ex.3: Verifica Ipotesi sulla proporzione Ad un livello di significatività del 5% bisogna scegliere z c tale che P (Z z c) = 0.95. Pertanto z c = 1.645. In base ai risultati dell esperimento, il valore osservato z o corrisponde z oss = 32 25 3.54 = 1.98 poichè risulta essere z oss > z c (1.98 > 1.645), si rifiuta l nulla per la quale il soggetto A ha tirato ad indovinare. () 9 / 14

Ex.4: Verifica Ipotesi sulla Varianza Un macchinario produce batterie al lithio che hanno una durata di vita media di 3 anni con uno scarto quadratico medio di 1 anno. Estratto il seguente campione di n = 5 batterie caratterizzate da una durata pari a 1.9, 2.4, 3, 3.5, 4.2 si vuole verificare, ad un livello di significatività del 5%, se la varianza dichiarata per le batterie prodotte dal macchinario sia effettivamente pari ad 1. Le possono essere formalizzate nel seguente modo H 0 : σ 2 = 1 H 1 : σ 2 1 La statistica a cui fare riferimento è la seguente: n y = Ŝ2 σ 2 (n 1) dove Ŝ2 i=1 = x i x n 1 Tale statistica si distribuisce come una variabile casuale χ 2 con n 1 gradi di libertà. () 10 / 14

Ex.4: Verifica Ipotesi sulla Varianza Essendo n 1 = 4 e il test bidirezionale, gli estremi della regione di accettazione sono χ 2 1 α 2,4 = χ2 0.975,4 = 0.48 e χ 2 α 2,4 = χ2 0.025,4 = 11.14 Per decidere se rigettare o meno l nulla bisogna verificare se il valore osservato della statistica sia compreso o meno nei limiti della regione di accettazione. In particolare, dai dati campionari risulta essere y o = Ŝ2 σo 2 (n 1) = 0.9 1 4 = 3.6 Poichè il valore osservato è compreso nei limiti della regione di accettazione, ovvero 0.48 < 3.6 < 11.14, si accetta l nulla e, di conseguenza, si attesta che la varianza della durata delle batterie prodotte non si discosta significativamente da 1. () 11 / 14

Ex.5: Verifica Ipotesi sulla indipendenza tra mutabili Per testare l efficacia di un farmaco nella cura di una malattia si considera un campione di 200 pazienti, li si suddivide in due gruppi (A e B). Al gruppo A viene somministrato il farmaco, al gruppo B no; si osserva poi, per ciascun gruppo, il numero di pazienti guariti. I risultati della prova sono riassunti nella seguente tabella guariti non guariti tot. gruppo A 75 25 100 gruppo B 65 35 100 tot 140 60 200 Table: Appartenenza ai gruppi vs. guariti (non guariti). A partire da tale esperimento, si costruisca un test per valutare l efficacia del farmaco nella cura della malattia. Per stabillire se il farmaco sia o meno curativo si può sottoporre la verifica di che le due variabili gruppo di appartenenza e guarigione dalla malattia siano o meno indipendenti: se così dovesse risultare, ovvero che la guarigione dalla malattia non è influenzata dalla assunzione del farmaco, si potrebbe concludere che il farmaco è inefficace. () 12 / 14

Ex.5: Verifica Ipotesi sulla indipendenza tra mutabili Formalmente H 0 : le variabili considerate sono indipendenti. H 1 : le variabili considerate non sono indipendenti. Al fine di calcolare l indice quadratico di connessione è necessario calcolare le frequenze che ci si attenderebbe se, fissati i marginali di tabella, le variabili fossero indipendenti. guariti non guariti tot. gruppo A 70 30 100 gruppo B 70 30 100 tot 140 60 200 Table: Frequenze attese sotto l di indipendenza () 13 / 14

Ex.5: Verifica Ipotesi sulla indipendenza tra mutabili Si passa a calcolare l indice quadratico di connessione χ 2 = + h k i=1 j=1 (35 30)2 30 (n ij nˆ ij ) 2 (75 70)2 (25 30)2 = + + nˆ ij 70 30 = 2.38 (65 70)2 + 70 La statistica appena calcolata si distribuisce secondo una v.c. chi-quadro χ 2 con (h 1) (k 1) = 1 grado di libertà (h e k sono rispettivamente il numero di modalità delle mutabili considerate). Ad un livello di significatività del 5% e con 1 g.d.l. il valore critico è χ 2 0.95,1 = 3.84. Poichè il valore osservato della statistica è minore del valore critico (2.38 < 3.84), non si può rifiutare l nulla: di conseguenza non si può sostenere che il farmaco abbia effetti sulla cura della malattia. () 14 / 14