CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7



Documenti analoghi
Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Statistica. Lezione 6

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Corso di Psicometria Progredito

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Statistiche campionarie

Esercitazione n.2 Inferenza su medie

Inferenza statistica. Statistica medica 1

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

3. Confronto tra medie di due campioni indipendenti o appaiati

Metodi statistici per le ricerche di mercato

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

VERIFICA DELLE IPOTESI

Istituzioni di Statistica e Statistica Economica

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

LEZIONE n. 5 (a cura di Antonio Di Marco)

STATISTICA IX lezione

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Verifica di ipotesi

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Esercitazione n.4 Inferenza su varianza

Esercitazioni di Statistica

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Corso di Psicometria Progredito

La logica statistica della verifica (test) delle ipotesi

Concetto di potenza statistica

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Temi di Esame a.a Statistica - CLEF

Elementi di Psicometria con Laboratorio di SPSS 1

VERIFICA DELLE IPOTESI

Analisi di dati di frequenza

Capitolo 11 Test chi-quadro


Test statistici di verifica di ipotesi

Il confronto fra proporzioni

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Lineamenti di econometria 2

Elementi di Psicometria con Laboratorio di SPSS 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Istituzioni di Statistica e Statistica Economica

GRUPPO QUATTRO RUOTE. Alessandro Tondo Laura Lavazza Matteo Scordo Alessandro Giosa Gruppo Quattro Ruote 1

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Capitolo 12 La regressione lineare semplice

Metodi statistici per le ricerche di mercato

ELEMENTI DI STATISTICA

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale

Capitolo 4 Probabilità

Analisi dei rischi in un investimento immobiliare. (aumento/diminuzione di prezzi/canoni/rendimenti, velocità di

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Facoltà di Psicologia Università di Padova Anno Accademico

STATISTICA INFERENZIALE

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 3 Piani a fattore singolo e relativi test di interpretazione

Rapporto dal Questionari Insegnanti

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Il coefficiente di correlazione di Spearman per ranghi

Indici di dispersione

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Titolo della lezione. Analisi dell associazione tra due caratteri: indipendenza e dipendenza

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST

Calcolo delle probabilità

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazioni del corso di Statistica Prof. Mortera a.a. 2010/2011. Esercizi di stima puntuale, intervalli di confidenza e test T 2 = 1 2 X

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Grafici delle distribuzioni di frequenza

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

E naturale chiedersi alcune cose sulla media campionaria x n

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Servizi di consulenza specialistica per IGRUE

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

IL TEST CHI QUADRATO χ 2

SPC e distribuzione normale con Access

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Relazioni statistiche: regressione e correlazione

Sistemi di Servizio e Simulazione

Problema pratico: Test statistico = regola di decisione

= 1, = w 2 x σ 2 x + (1 w x ) 2 σ 2 x 2 w x (1 w x ) σ x σ y, = w x 0.2. = 0,

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Facoltà di Psicologia Università di Padova Anno Accademico

Dott.ssa Caterina Gurrieri

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

IL FATTORE DI RISCHIO ALCOL NEGLI STILI DI VITA DEI LAVORATORI : I RISUL- TATI DI UN INDAGINE

Corso di Psicometria Progredito

Transcript:

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Test delle ipotesi per la media (varianza nota), p-value del test Il manager di un fast-food è interessato a valutare se il tempo di attesa per effettuare un ordine da parte dei clienti è cambiato negli ultimi 6 mesi rispetto allo scorso anno. E noto, dall esperienza passata, che il tempo medio di attesa prima di ordinare è di 4.5 minuti con una deviazione standard di 1.2 minuti. Inoltre il manager può ragionevolmente supporre che la distribuzione del tempo sia normale. A tale proposito, viene selezionato a caso un campione di 25 ordini effettuati in un ora da cui risulta un tempo medio di attesa di 5.1 minuti. Il manager può affermare con un livello di significatività del 5% che il tempo medio di attesa per ordinare è significativamente cambiato rispetto al passato? Calcolare inoltre il livello di significatività osservato (p-value) del test. Sol. 1. Definizione del sistema di ipotesi: :=4.5 : 4.5 =0.05 3. Costruzione della statistica test Siccome la varianza della popolazione è nota, allora: = ~(0,1) Il livello di significatività è =0.05, il test è bidirezionale, quindi i quantili della distribuzione Normale standard da individuare sono: ± ( ) ossia:. = 1.96 +. =+1.96 4. Definizione della regola di decisione (regione di rifiuto) Se 1.96 oppure +1.96 allora rifiutiamo l ipotesi nulla

5. A partire dal campione calcolo il valore della statistica sotto l ipotesi nulla 6. Decisione = 5.1 4.5 1.2 25 =2.50 Poichè =2.50>1.96 allora rifiutiamo l ipotesi nulla. C è evidenza sufficiente per affermare che il tempo medio di attesa per ordinare è significativamente cambiato nel tempo: il manager conclude che oggi, in media, il cliente aspetta più a lungo per ordinare rispetto al passato 6.bis Decisione in base al p-value del test Definizione: Il p-value o livello di significatività osservato è la probabilità di osservare valori della statistica test meno favorevoli ad del valore effettivamente ottenuto. In altre parole, il p-value è il più piccolo livello di significatività tale da indurre al rifiuto dell'ipotesi nulla sulla base dei dati osservati. Esso rappresenta la probabilità che i dati non compatibili con l'ipotesi nulla siano stati osservati quando in realtà era vera. Di conseguenza un p-value molto piccolo è un forte indicatore del fatto che non è vera. Se il p-value<α, rifiuto quindi l ipotesi nulla. Nel nostro caso, essendo il test bidirezionale: 2 > =2 ( >2.50)=2(1 0.9938)=0.0124 Siccome il p-value < α=0.05, allora rifiuto l ipotesi nulla.

Esercizio 2. Test delle ipotesi per la media, varianza ignota E noto che su un certo tratto stradale del Comune di Roma la velocità media delle auto è di 60 km/h. Tuttavia, la polizia municipale sospetta che lungo quel tratto, la velocità media dei veicoli sia diventata superiore. A partire da un campione di 25 autovetture si è registrata effettivamente una velocità media di 64.8 Km/h con uno scarto quadratico medio campionario di 23.2 km/h. a)sottoporre a verifica delle ipotesi con un livello di significatività del 5% l ipotesi nulla (ossia che la velocità media su quel tratto di strada sia di 60 Km/h) contro l ipotesi alternativa (ossia la velocità media sia superiore a 60 km/h). Sol. a) 1.Definizione del sistema di ipotesi: 0 1 : µ = 60 : µ > 60 =0.05 3. Costruzione della statistica test Siccome la varianza della popolazione è ignota, allora: = ~ Il livello di significatività è =0.05, il test è a una coda, quindi i quantili della distribuzione t di student da individuare sono:,. =1.711 4. Definizione della regola di decisione (regione di rifiuto) Se 1.711 allora rifiutiamo l ipotesi nulla 5. A partire dal campione calcolo il valore della statistica sotto l ipotesi nulla T = 64.8 60 23.2 25 = 1.0344

6. Decisione Poichè =1.0344<1.711 allora non rifiutiamo l ipotesi nulla. Esercizio 3. Test delle ipotesi per la proporzione Da un indagine condotta sulla composizione del management delle aziende italiane è risultato che il 35% delle aziende italiane è gestito da donne. Inoltre, in un campione di n = 100 aziende localizzate nel sud Italia è risultato che 15 sono gestite da donne. Verificare, al livello α = 0.1, se il campione può ritenersi rappresentativo della realtà aziendale italiana. Determinare il livello di significatività (p-value) del test Sol 1.Definizione del sistema di ipotesi: 0 1 : p = 0.35 : p 0.35 =0.01 3. Costruzione della statistica test Sfrutto il TLC, infatti n è sufficientemente grande per cui la statistica test è: = (1 ) (0,1) Il livello di significatività è =0.01, il test è a due code, quindi il quantile della distribuzione Normale standard da individuare è:. =2.575 4. Definizione della regola di decisione (regione di rifiuto) Se 2.575 oppure 2.575 allora rifiutiamo l ipotesi nulla Oppure, direttamente >2.575

5. A partire dal campione calcolo il valore della statistica sotto l ipotesi nulla 6. Decisione = 0.15 0.35 0.35(1 0.35) 100 = 4.19 Poichè =4.19>2.575 si rifiuta l ipotesi che il campione di aziende osservato sia rappresentativo della realtà aziendale italiana. Esercizio 4. Test sulla proporzione, errore di I e II tipo, potenza del test Un produttore di sementi afferma che almeno il 90% dei semi germoglia. Si sottopone a test l'affermazione del produttore al livello di significatività dell' 1%: a) determinare l errore di I tipo b) determinare la potenza del test quando l'ipotesi alternativa afferma che la percentuale di semi che germogliano è 85% e la numerosità campionaria è 220. d) come varierebbe la potenza del test se l'ipotesi alternativa assumesse che la percentuale di semi che germogliano è 80%? Sol. a) L errore di I tipo (rifiutare l ipotesi nulla quando è vera) è pari al livello di significatività fissato per il test quindi α=0.01 b) Per calcolare la potenza del test occorre ricordare che l errore di II tipo è la probabilità di accettare l ipotesi nulla quando è falsa. Esso è quantificabile solo fissando un valore per il parametro su cui si intende eseguire il test, ossia fissando una distribuzione alternativa differente da quella specificata sotto l ipotesi nulla. 1.Definizione del sistema di ipotesi: (iniziale) 0 1 : p = 0.90 : p < 0.90 =0.01 3. Costruzione della statistica test (sotto l ipotesi nulla) Sfrutto il TLC, infatti n è sufficientemente grande per cui la statistica test è:

= (1 ) (0,1) Il livello di significatività è =0.01, il test è unidirezionale, quindi il quantile della distribuzione Normale standard è:. = 2.33, per cui se < 2.33 rifiuto l ipotesi nulla A partire da questo si determina la potenza del test intesa come probabilità di rifiutare correttamente, in pratica la probabilità di prendere la decisione giusta : () <=1 () >=1 dapprima determiniamo il valore di (valore campionario) estremo che avvalora l ipotesi nulla, ossia. Esso corrisponde al valore limite tra la regione di accettazione e la regione di rifiuto. In particolare: da cui: () = (1 ) =. = 2.33 = 2.33 (1 ) Dunque, è falsa a partire dal valore della statistica uguale a 0.853. =0.90 2.33(0.02)=0.853 Considerando l ipotesi alternativa proposta per p, ossia =0.85, il valore della statistica test sotto l ipotesi alternativa è: () = (1 ) = 0.853 0.85 0.85(1 0.85) 220 =0.125 La probabilità di accettare l ipotesi nulla quando è falsa (errore di II specie) è dunque: = ( ) >0.125=0.4522 Per cui il complemento a 1 dell errore di II specie (1-β) è la potenza del test : (1 )=1 () >0.125= () <0.125=0.5478 c) Seguendo lo stesso tipo di ragionamento, con l ipotesi alternativa =0.80 il valore della statistica test è: () = (1 ) = 0.853 0.80 0.80(1 0.80) 220 =1.96

= () >1.96=0.025 (1 )=1 0.025=0.975 Assumendo =0.80 la potenza del test aumenta. Quindi aumenta la probabilità di prendere la decisione giusta. Note utili: Maggiore è la distanza tra ipotesi alternativa (che stiamo considerando vera) e l ipotesi nulla, maggiore sarà la potenza del test. Minore è la dispersione della variabile, minore sarà la varianza della proporzione campionaria, più strette saranno le corrispondenti distribuzioni, e maggiore sarà la potenza del test Maggiore è l α prescelto, maggiore sarà la potenza del test. Questo è logico perchè α e β sono tra loro interdipendenti La potenza del test è influenzata dalla dimensione campionaria. A parità di α, la deviazione standard della proporzione campionaria è inversamente proporzionale alla numerosità. Esercizio 5. Test della differenza tra proporzioni Un azienda automobilistica, prima di immettere sul mercato un nuovo modello di un auto già in commercio, realizza un sondaggio di opinioni. In particolare, l indagine rivela che su un campione di n1 = 100 donne il 36% preferisce il nuovo modello di auto rispetto a quello già in commercio mentre, su un campione di n2 = 100 uomini solo il 25% preferisce il nuovo modello. Verificare, al livello α = 0.01, l ipotesi che non ci sia differenza nelle preferenze in base al sesso dei potenziali acquirenti. Sol. 1. Sistema di ipotesi da verificare: : =0 : 0 α=0.01 3. Costruzione della statistica test (sotto l ipotesi nulla) = ( ) (1 ) 1 + 1 (0,1) 4. Definizione della regola di decisione

Il test è bidirezionale, dalle tavole della normale standard risulta. =±2.57 Se >2.575 rifiutiamo l ipotesi nulla 5. A partire dal campione calcolo il valore della statistica test sotto l ipotesi nulla La stima della proporzione, comune ad entrambe le popolazioni, di soggetti che preferiscono il nuovo modello è ottenuta da: = + = 0.36 100+0.25 100 =0.305 + 100+100 Per cui il valore della statistica campionaria risulta: = (0.36 0.25) 0.305(1 0.305) 1 100 + 1 100 =1.68 6. Decisione Siccome =1.68<2.575 non rifiutiamo l ipotesi nulla. Esiste indipendenza dal sesso rispetto alle preferenze dei potenziali acquirenti