Verifica di ipotesi: approfondimenti

Documenti analoghi
Esercizi di statistica

Contenuti: Capitolo 14 del libro di testo

Corso di Statistica Esercitazione 1.8

La verifica delle ipotesi

Fondamenti statistici : Test d Ipotesi (1)

Test d ipotesi Introduzione. Alessandra Nardi

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Esercitazione 8 del corso di Statistica 2

Intervalli di confidenza

Test per una media - varianza nota

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Test per l omogeneità delle varianze

Analisi della varianza

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Esercizi di Probabilità e Statistica

Test di Ipotesi (su una singola popolazione)

Verifica di ipotesi. Parte VI. Verifica di ipotesi

Introduzione alla verifica d ipotesi

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

La probabilità. f n. evidentemente è 0 ( E)

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

I appello di calcolo delle probabilità e statistica

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Analisi della varianza: I contrasti e il metodo di Bonferroni

STATISTICA A K (60 ore)

Test F per la significatività del modello

Statistica Metodologica

Test delle ipotesi sulla media.

Esercitazione 8 maggio 2014

Test delle Ipotesi Parte I

Teoria della stima dei parametri:

Statistica 1- parte II

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

STATISTICA ESERCITAZIONE

Gli errori nella verifica delle ipotesi

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

Note sulla probabilità

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

STATISTICA A K (60 ore)

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

LABORATORIO DI PROBABILITA E STATISTICA

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

PROBLEMI DI INFERENZA SU PERCENTUALI

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

P ( X n X > ɛ) = 0. ovvero (se come distanza consideriamo quella euclidea)

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Schema lezione 5 Intervalli di confidenza

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Analisi delle componenti principali

Minimi quadrati vincolati e test F

ESAME. 9 Gennaio 2017 COMPITO B

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Confronto tra due popolazioni Lezione 6

STATISTICA ESERCITAZIONE 13

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Corso di Psicometria Progredito

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Statistica Inferenziale

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

CALCOLO DELLE PROBABILITÀ. 1. La probabilità che una candela accesa si spenga è p = 1, perché è assolutamente certo che si esaurirà.

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

> RSS <- c(rs,ss) Per avere un idea di come sono distribuiti i dati (simmetria, dispersione... ):

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

STATISTICA A K (63 ore) Marco Riani

Test di ipotesi su due campioni

Esame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

INFERENZA STATISTICA I (CANALE B)

Test d ipotesi: confronto fra medie

Verifica delle ipotesi: Binomiale

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Statistica Applicata all edilizia: il modello di regressione

Cognome e Nome:... Corso di laurea:...

Z-test, T-test, χ 2 -test

Statistica economica

Quanti soggetti devono essere selezionati?

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

INFERENZA STATISTICA I (CANALE B)

Note sulla Definizione Assiomatica della Probabilita

05. Errore campionario e numerosità campionaria

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Statistica Inferenziale

VERIFICA DELLE IPOTESI

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

Statistica Inferenziale

Cognome e Nome:... Matricola e corso di laurea:...

5.5 Procedura generale per la formulazione di un test

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Transcript:

1. Il -value Verifica di iotesi: arofondimenti Il test si uò effettuare: Determinando reventivamente le regioni di accettazione di H 0 e H 1 er lo stimatore considerato (sulla base del livello α e osservando a quale delle due aartiene la stima x ottenuta nel camione Calcolando il -value della stima x e confrontandolo con α. Che cos è il -value? È la robabilità sotto H 0 di ottenere un valore camionario iù lontano dall iotesi rinciale e iù vicino all alternativa di quello ottenuto effettivamente nel camione x Sia la forma della regione di rifiuto di H 0 sia il -value diendono dal tio di iotesi alternativa si considera: unilaterale destra, unilaterale sinistra, bilaterale. / µ 0 H accettata 0 0 H rifiutata H accettata 1 1 µ 0 / α H rifiutata I grafici recedenti si riferiscono a diversi test sul valore atteso di X. H 0 : µ = µ 0 H 1 : µ > µ 0 oure H 1 : µ < µ 0 oure H 1 : µ µ 0 Il -value deve essere confrontato con il livello di significatività del test. Se è minore di α l iotesi rinciale è rifiutata. Esemi Consideriamo due test sul valore atteso di una variabile aleatoria X con distribuzione normale e varianza nota uguale a 4. Si utilizza come statistica test la variabile aleatoria X. Test unilaterale sinistro H 0 : µ = 10 H 1 : µ < 10 La regione di rifiuto dell iotesi rinciale è del tio (, c. Sulla base di 36 osservazioni camionarie si ottiene un valore camionario x = 9.4 Il -value è: ( 0 X < 9.4 ( X 10 /6 A livello di significatività del 5% si rifiuta l iotesi rinciale. Test bilaterale < 9.4 10 (Z < 1.8 = 3593 /6 H 0 : µ = 10 H 1 : µ 10 1

La regione di rifiuto dell iotesi rinciale è del tio (, c 1 (c,. Sulla base di 36 osservazioni camionarie si ottiene un valore camionario x = 10.4. La distanza, in valore assoluto, dall iotesi rinciale è: δ = 10.4 10 = 0.4. Il -value è: ( X 10 < 0.4 + P ( X 10 > 0.4 ( X 10 > 0.4 ( X 10 = P /6 < 0.4 /6 = P (Z < 1. = /0.507 = 0.3014 Alle soglie usuali di livello di significatività si accetta l iotesi rinciale.. La otenza di un test La otenza di un test è una funzione del arametro P (θ: è la robabilità di accettare l iotesi alternativa H 1. Indichiamo con Θ 0 l insieme a cui aartiene il arametro quando H 0 è vera e con Θ 1 l insieme a cui aartiene il arametro quando H 1 è vera. - Se θ Θ 1, P (θ è la robabilità di effettuare la scelta corretta: P (θ = 1 β(θ - Se θ Θ 0, P (θ è la robabilità di effettuare la scelta sbagliata: P (θ = α(θ Il grafico a fianco raresenta la otenza del test: β H 0 : µ 1 H 1 : µ > 1 0.5 1-α dove µ è il valore atteso di una v.a. con legge normale di varianza nota ari a. È evidenziato il valore della otenza e dell errore di seconda secie in corrisondenza del valore di µ uguale a 13.5. 1-β(13.5 α 1 13 14 iotesi alternativa H 1 15 La robabilità di accettare l iotesi alternativa, quando questa è vera, aumenta all aumentare della numerosità camionaria. Se nella oolazione è vera l iotesi alternativa e se i valori del arametro sotto H 1 e sotto H 0 sono molto vicini, solo con grandi camioni si riesce ad avere una robabilità alta di effettuare la scelta corretta. I grafici a fianco raresentano la otenza del test: H 0 : µ 1 H 1 : µ > 1 0.5 er due diverse numerosità camionarie. Ad esemio, in corrisondenza di un valore atteso µ uguale a 13.5 si ha: 1 13 1-β(13.5 14 15 P n1 (13.5 0.70 e P n (13.5 0.95 con n 1 < n iotesi alternativa H 1 Confrontiamo ora la otenza di due test sul valore atteso di una v.a. con legge normale di varianza nota ari a, uno unilaterale e uno bilaterale.

I grafici a fianco raresentano la otenza dei due test: H 0 : µ 1 H 1 : µ > 1 a linea tratteggiata e H 0 : µ 1 H 1 : µ 1 a linea continua. 0.8 0.6 0.4 0. Osserviamo che il test unilaterale è iù otente (ma non di molto nell insieme (1, +, mentre quello bilaterale è molto iù otente nell insieme (, 1. 3. Determinazione della numerosità camionaria fissati α e β Consideriamo un test sul valore atteso di una variabile con legge normale di varianza nota σ del tio: H 0 : µ = µ 0 H 1 : µ = µ 1 Vogliamo determinare la numerosità camionaria che assicura determinate robabilità di errore di rima e seconda secie. Indicando con s la soglia della regione di rifiuto di H 0, se µ 1 > µ 0 si ha: α ( ( X µ0 X > s µ = µ 0 σ/ n > s µ 0 σ/ n β ( ( X µ1 X < s µ = µ 1 σ/ n < s µ 1 σ/ n Dalle due equazioni: si ottiene: s µ 0 σ/ n = z α e n = (z α + z β σ (µ 0 µ 1 s µ 1 σ/ n = z β 10 ( X µ0 σ/ n > z α ( X µ1 σ/ n < z β e questo vale anche nel caso µ 1 < µ 0. Osserviamo che la numerosità camionaria deve essere tanto maggiore quanto iù: - è minore la distanza fra i valori attesi sotto le due iotesi; - è maggiore la varianza; - sono minori i due errori (e quindi z α e z β maggiori. 1 13 14 4. Test di uguaglianza delle medie di due v.a. Normali sulla stessa oolazione Consideriamo le variabili casuali X 1 e X definite su una stessa oolazione con distribuzione normale risettivamente N (µ 1, σ 1 e N (µ, σ. Si vuole verificare se i valori attesi delle due variabili sono uguali. 3

Essendo X 1 e X definite sulla stessa oolazione, si uò considerare la variabile aleatoria D, differenza fra X 1 e X su ogni elemento della oolazione: D(ω i = X 1 (ω i X (ω i Tale variabile aleatoria ha distribuzione normale N (µ D, σ D ; il valore atteso è µ 1 µ e la varianza è σ 1 + σ Cov(X 1, X, in genere sconosciuta. Il test sull uguaglianza dei valori attesi di X 1 e X si riconduce al test sulla nullità del valore atteso di D, che viene effettuato tramite la quantità ivotale: D µ D S D / n Esemio L effetto di due sonniferi A e B è stato rovato nei riguardi di uno stesso gruo di 10 ersone sofferenti d insonnia. Nella tabella sono riortate, indicandole con x A e x B le variazioni nelle ore di sonno rovocate in ciascun aziente dalla somministrazione del sonnifero A e del sonnifero B. Si assume che le variazioni di ore di sonno siano modellabili con variabili aleatorie normali. Si vuole verificare l iotesi che i due sonniferi abbiano uguale efficacia. Nell ultima colonna è riortata la differenza fra x A e x B. az. x A x B d 1 1.9 0.7 1. 0.8-1.6.4 3 1.1-0. 1.3 4 0.1-1. 1.3 5-0.1-0.1 6 4.4 3.4 7 5.5 3.7 1.8 8 1.6 0.8 0.8 9 4.6 4.6 10 3.4.0 1.4 La media camionaria di D è 1.58 e la varianza camionaria è 1.513, quindi la realizzazione camionaria della quantità ivotale sotto l iotesi di uguaglianza dell effetto dei 1.58 sonniferi vale: = 4.06 er cui viene rifiutata l iotesi di uguaglianza dell effetto. 0.389 5. Test di uguaglianza delle varianze di due v.a. Normali Consideriamo le variabili casuali X 1 e X indiendenti con distribuzione normale risettivamente N (µ 1, σ 1 e N (µ, σ. Si vuole verificare, sulla base di informazioni tratte da due camioni di X 1 e X, se le varianze delle due variabili sono uguali. Più recisamente le iotesi del test sono: H 0 : σ 1 = σ e H 1 : σ 1 σ Indichiamo risettivamente con n 1 e n le numerosità dei due camioni di X 1 e X. Consideriamo le variabili casuali S 1 e S, varianze camionarie di X 1 e X. Si ha: S 1(n 1 1 σ 1 χ [n 1 1] e S (n 1 σ χ [n 1] Inoltre tali variabili sono indiendenti, essendo X 1 e X indiendenti e così S 1 e S. Ricordiamo che il raorto di due variabili aleatorie indiendenti, ciascuna con legge chi-quadro divise er i loro gradi di libertà è una variabile aleatoria con legge F di Fisher. Consideriamo la quantità ivotale: S1 S σ σ1 4

Se H 0 è vera, la statistica F : F = S 1 S ha legge F [n1 1,n 1]. Il test è bilaterale e la regione di rifiuto dell iotesi rinciale è: [0, c 1 ] [c, + con α 1 (F < c 1, α (F > c e α 1 + α = α Per un test unilaterale del tio: H 0 : σ 1 = σ e H 1 : σ 1 > σ allora la regione di rifiuto dell iotesi rinciale è: [c, + con α (F > c e simmetricamente er un test unilaterale sinistro. Determinazione dei quantili sinistri di una v.a. di Fisher Le tavole della legge di Fisher tiicamente forniscono i valori dei quantili destri, cioè ermettono di determinare, er α fissato (al 5% e all 1%, il valore di c tale che α (F > c Se F F [n1 1,n 1] allora: ( 1 α (F > c F < 1 c con 1 F F [n 1,n 1 1] quindi sulle tavole si legge il valore 1/c e si calcola c. 6. Confronto fra intervalli di confidenza e test Si ha: Consideriamo una variabile aleatoria X di valore atteso µ. Indichiamo con: - k B = z α σ n semi amiezza dell intervallo di confidenza bilaterale - k U = z α σ n Tio Intervallo di confidenza Regione di accettazione di H 0 bilaterale (x k B, x + k B (µ 0 k B, µ 0 + k B unilaterale destro (, x + k U (, µ 0 + k U unilaterale sinistro (x k U, + (µ 0 k U, + Osserviamo che l intervallo di confidenza er µ diende da x, mentre la regione di accettazione di H 0 diende da µ 0. 5