N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Documenti analoghi
Casa dello Studente. Casa dello Studente

Intervalli di confidenza

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Esercitazione 8 del corso di Statistica 2

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Esercitazione: La distribuzione NORMALE

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Capitolo 5 Confidenza, significatività, test di Student e del χ 2

Esercitazione 8 maggio 2014

Il test (o i test) del Chi-quadrato ( 2 )

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Matematica II: Calcolo delle Probabilità e Statistica Matematica

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Gli errori nella verifica delle ipotesi

Scanned by CamScanner

ISTOGRAMMI E DISTRIBUZIONI:

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Note sulla probabilità

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

DISTRIBUZIONE NORMALE (1)

Esercizi riassuntivi di Inferenza

Vedi: Probabilità e cenni di statistica

Capitolo 9 Verifica di ipotesi: test basati su un campione

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

STATISTICA ESERCITAZIONE

Capitolo 6. La distribuzione normale

ES.2.3. è pari ad 1. Una variabile aleatoria X che assume valori su tutta la retta si dice distribuita

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Capitolo 8. Probabilità: concetti di base

Verifica delle ipotesi: Binomiale

Capitolo 11 Test chi-quadro

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Elementi di Psicometria con Laboratorio di SPSS 1

Variabili casuali ad una dimensione Testi degli esercizi. Variabili casuali ad una dimensione a.a. 2012/2013 1

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

DISTRIBUZIONE NORMALE STANDARDIZZATA ESEMPIO DI USO DELLE TAVOLE

Distribuzioni di probabilità

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

standardizzazione dei punteggi di un test

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Distribuzioni e inferenza statistica

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

LA DISTRIBUZIONE NORMALE ESERCITAZIONE

TEST NON PARAMETRICO DI MANN-WHITNEY

A1. La curva normale (o di Gauss)

a) 36/100 b) 1/3 c)

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

normopeso <=25 sovrappeso obesità I obesità II obesità III >=40

FACOLTÀ DI ECONOMIA Prova scritta di Statistica II Perugia, 27 gennaio 2006 COGNOME NOME

= , 30 )

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 10 Test delle ipotesi

MISURE DI SINTESI 54

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

Schema lezione 5 Intervalli di confidenza

LABORATORIO DI PROBABILITA E STATISTICA

PROBABILITÀ SCHEDA N. 7 LA VARIABILE ALEATORIA NORMALE

Test di ipotesi su due campioni

Distribuzioni campionarie

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Prova d esame di Statistica - II canale - 10 CFU

STATISTICA: esercizi svolti sulle VARIABILI CASUALI

L indagine campionaria Lezione 3

Elementi di Psicometria con Laboratorio di SPSS 1

Il confronto fra medie

Premessa: la dipendenza in media

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

Analisi statistica della bontà di un programma di simulazione del lancio di dadi

Statistica. Alfonso Iodice D Enza

COMUNE DI CONSIGLIO DI RUMO

Analisi della varianza

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Analisi della varianza a una via

Il campionamento e l inferenza. Il campionamento e l inferenza

Esame di Statistica A-Di Prof. M. Romanazzi

Esercizi di Calcolo delle Probabilità

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICHE DESCRITTIVE Parte II

Esercitazioni di statistica

Statistica descrittiva II

Metodi statistici per le ricerche di mercato

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

STATISTICA A K (60 ore)

LA DISTRIBUZIONE NORMALE

Test per la correlazione lineare

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Transcript:

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle abelle riportate alla fine del documento. Esercizio 1 La concentrazione media di sostanze inquinanti osservata nelle acque di un fiume in un determinato anno è stata del 7,1%. L anno seguente sono state effettuate 5 rilevazioni e la concentrazione di sostanze inquinanti è risultata pari a x =7,07% con s=0,0265. A un livello di significatività α=0,05 possiamo affermare che il valore medio della concentrazione è diverso da quello riscontrato nell anno precedente? (Si supponga che la concentrazione segua un andamento normale) Soluzione Esercizio 1 Dati disponibili: μ 0 =7,1 (media di popolazione) x =7,07 (media osservata sul campione) s=0,0265 (deviazione standard del campione) n=5 (numerosità del campione) α=0,05 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 7,1 H 1 : μ 7,1 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) N.B. Il simbolo ~ (la tilde) va letto si distribuisce come. Quindi, la formula precedente va letta = si distribuisce come una di Student con n-1 gradi di libertà. 7,07 7,1 Il valore della statistica test è = = 2, 53. (0,0265 5) Dal momento che l ipotesi H 1 è di tipo bidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta dalle due code (una a destra e una a sinistra) della distribuzione considerata. Avendo scelto un livello di significatività α=0,05, le due code avranno complessivamente un area pari a 0,05 e cioè 0,025 ciascuna. Quindi, bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,975 (che è il complemento a 1 di 0,025, cioè 0,975+0,025=1). I gradi di libertà sono 4. Infatti, n=5 e i gradi di libertà sono n-1=5-1=4. Si osserva che il valore della 0,025, con 4 gradi di libertà è pari a 2,77645.

Vuol dire che la coda di destra inizia al valore 2,77645 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Però, la distribuzione è simmetrica (vale 0 al centro), e bisogna anche considerare la coda di sinistra. Questa inizia in corrispondenza del valore -2,77645 e si cade nella zona di rifiuto se con la formula otteniamo un valore inferiore (per esempio -3). Allora, la valutazione può essere fatta considerando il valore assoluto, ed essendo = -2,53 = 2,53 < 2,77645 = 0,025 (4 GdL), non si rifiuta l ipotesi nulla H 0, cioè, non possiamo affermare che il livello di concentrazione sia diverso da quello dell anno precedente. Sviluppo: Lasciando costante la deviazione standard, pari a 0,0265, quale doveva essere la concentrazione per poter rifiutare H 0, cioè per poter dire che la concentrazione era differente rispetto all anno precedente? Per cadere nella zona di rifiuto, con la formula si doveva ottenere un valore superiore a 2,77645 o inferiore a -2,77645. Per determinare a che livello di concentrazione corrispondono questi due valori si effettua il seguente calcolo: Se x μ = allora si ricava che x = + μ0 0 Considerando la coda di destra, cioè il valore 2,77645, si ottiene: x = 2,77645 (0,0265 5) + 7,1 = 7,265 Considerando invece la coda di sinistra, cioè il valore -2,77645, si ottiene: x = 2,77645 (0,0265 5) + 7,1 = 6,935 Quindi, avremmo rifiutato H 0, accettando di conseguenza l ipotesi alternativa H 1, nel caso avessimo osservato valori di concentrazione superiori a 7,265 o inferiori a 6,935.

Esercizio 2 Una fabbrica di automobili utilizza guarnizioni per i freni con una durata media pari a 20mila chilometri. ale ditta sta considerando di sostituirle con un altro tipo di guarnizioni che dovrebbe avere una durata maggiore. Le nuove guarnizioni vengono montate su 64 auto e la loro durata media risulta pari a 22mila chilometri con una varianza stimata corretta pari a 4mila. Supponendo che la durata sia approssimativamente distribuita come una Normale, possiamo concludere che le nuove guarnizioni sono migliori delle precedenti? (Si consideri un livello di significatività pari a α =0,01). Soluzione Esercizio 2 Dati disponibili: μ 0 =20000 (media di popolazione) x =22000 (media osservata sul campione) s 2 =4000 (varianza del campione) n=64 (numerosità del campione) α=0,01 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 20000 H 1 : μ > 20000 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 22000 20000 Il valore della statistica test è = = 252, 96. ( 4000 64) Dal momento che l ipotesi H 1 è di tipo unidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta da una sola coda, in questo caso quella di destra della distribuzione considerata. Avendo scelto un livello di significatività α=0,01 bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,99 (che è il complemento a 1 di 0,01, cioè 0,99+0,01=1). I gradi di libertà sono 63. Infatti, n=64 e i gradi di libertà sono n-1=64-1=63. Nella tabella non esiste la riga relativa a 63 gradi di libertà e allora si considera quella del 60. Si osserva che il valore della 0,01, con 60 gradi di libertà è pari a 2,39012. Vuol dire che la coda di destra inizia al valore 2,77645 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Dal momento che 252,96 è superiore (e di un bel po ) al valore critico 2,39012, si rifiuta H 0, si accetta di conseguenza l ipotesi alternativa H 1 e si può affermare che le nuove guarnizioni hanno una durata superiore a quelle precedenti.

Sviluppo: Lasciando costante la varianza, pari a 4000, quale poteva essere come minimo la durata delle guarnizioni per poter rifiutare H 0? Per cadere nella zona di rifiuto, con la formula si doveva ottenere un valore superiore a 2,39012. Per determinare a quale durata corrisponde questo valore si effettua il seguente calcolo: Se x μ = allora si ricava che x = + μ0 0 quindi: x = 2,39012 ( 4000 64) + 20000 = 20018,9 Quindi, avremmo rifiutato H 0, accettando di conseguenza l ipotesi alternativa H 1, nel caso avessimo osservato una durata media nel campione anche solo superiore a 20018,9.

Esercizio 3 Una macchina produce bulloni di diametro pari a 8 cm. Studi effettuati sulla distribuzione del diametro hanno portato a ritenere che questa sia approssimativamente Normale con varianza pari a 1. Si ha il sospetto che la macchina sia fuori taratura (il diametro medio sia cambiato). Per verificare tale ipotesi, si estraggono casualmente 81 bulloni e si calcola il diametro medio che risulta pari a 7 cm. Possiamo concludere che la macchina sia tarata correttamente? (Si consideri un livello di significatività pari a α =0,05). Soluzione Esercizio 3 Dati disponibili: μ 0 =8 (media di popolazione) σ 2 =1 (varianza di popolazione) x =7 (media osservata sul campione) n=81 (numerosità del campione) α=0,05 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 8 H 1 : μ 8 La varianza di popolazione è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: x μ = ~ N(0,1) ( σ n) z 0 N.B. Il simbolo ~ (la tilde) va letto si distribuisce come. Quindi, la formula precedente va letta z= si distribuisce come una Normale con media=0 e varianza=1. In particolare, la Normale con queste caratteristiche (media=0 e varianza=1) è la Normale standardizzata. 7 8 Il valore della statistica test è z = = 9. ( 1 81) Dal momento che l ipotesi H 1 è di tipo bidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta dalle due code (una a destra e una a sinistra) della distribuzione considerata. Avendo scelto un livello di significatività α=0,05, le due code avranno complessivamente un area pari a 0,05 e cioè 0,025 ciascuna. Avendo scelto un livello di significatività α=0,05 bisogna guardare la tabella della Normale standardizzata. Se si prende in considerazione la abella A.1, a un area pari a 0,025 corrisponde z=-1,96. Quindi la coda di sinistra inizia in corrispondenza di z=-1,96. Dal momento che la distribuzione è simmetrica, la coda di destra inizierà in corrispondenza di z=1,96. Perciò, l ipotesi H 0 va rifiutata, e di conseguenza accettata l ipotesi alternativa

H 1, se il valore della statistica test calcolato con la formula esce dall intervallo [-1,96;1,96]. Nel nostro caso, il valore -9 è esterno all intervallo [-1,96;1,96] e quindi l ipotesi H 0 va rifiutata e di conseguenza si può dire che la macchina non sia tarata bene. Sviluppo: Entro quali limiti deve stare la media del campione per non rifiutare H 0, cioè per poter dire che la macchina è tarata bene? Per non cadere nella zona di rifiuto, con la formula si doveva ottenere un valore superiore a compreso nell intervallo [-1,96;1,96]. Per determinare a quale diametro corrispondono i valori critici, cioè gli estremi dell intervallo, si effettua il seguente calcolo: Se x μ = allora si ricava che x = z ( σ n) + μ0 ( σ n) z 0 Quindi, facendo riferimento all estremo superiore dell intervallo, cioè 1,96, si ha che: x = 1,96 ( 1 81) + 8 = 8,329 Per l estremo inferiore, cioè -1,96, invece si ottiene: x = 1,96 ( 1 81) + 8 = 7,671 Quindi, non avremmo rifiutato H 0 nel caso il diametro medio del campione fosse compreso nell intervallo [7,671;8,329].

Esercizio 4 Un medico sportivo utilizza un particolare test per misurare la condizione fisica degli atleti. Considerato un campione casuale di giocatori di calcio costituito da 25 atleti, si rileva un punteggio medio al test pari a 47,5, con s=4,8. Supponendo che i manuali indichino che il punteggio medio nel test sia distribuito normalmente e pari a 37,5. verificare se si può dire che il punteggio medio riscontrato nel campione sia migliore di quello di popolazione (Si consideri un livello di significatività pari a α =0,05). Soluzione Esercizio 4 Dati disponibili: μ 0 =37,5 (media di popolazione) x =47,5 (media osservata sul campione) s=4,8 (deviazione standard del campione) n=25 (numerosità del campione) α=0,05 (livello di significatività) Il sistema d ipotesi è: H 0 : μ = 37,5 H 1 : μ > 37,5 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 47,5 37,5 Il valore della statistica test è = = 10, 42. (4,8 25) Dal momento che l ipotesi H 1 è di tipo unidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta da una sola coda, in questo caso quella di destra della distribuzione considerata. Avendo scelto un livello di significatività α=0,05 bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,95 (che è il complemento a 1 di 0,05, cioè 0,95+0,05=1). I gradi di libertà sono 24. Infatti, n=25 e i gradi di libertà sono n-1=25-1=24. Si osserva che il valore della 0,05, con 24 gradi di libertà è pari a 1,71088. Vuol dire che la coda di destra inizia al valore 1,71088 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Dal momento che 10,42 è superiore al valore critico 1,71088, si rifiuta H 0, si accetta di conseguenza l ipotesi alternativa H 1 e si può affermare gli atleti del campione hanno punteggio medio nel test superiore a quello di popolazione. Sviluppo: Lasciando costante la deviazione standard, pari a 4,8, qual era il punteggio medio minimo con il quale veniva rifiutata l ipotesi H 0? Per cadere nella zona di rifiuto, con la formula si doveva ottenere un valore

superiore a 1,71088. Per determinare a quale durata corrisponde questo valore si effettua il seguente calcolo: Se x μ = allora si ricava che x = + μ0 0 quindi: x = 1,71088 (4,8 25) + 37,5 = 39,14 Quindi, avremmo rifiutato H 0, accettando di conseguenza l ipotesi alternativa H 1, nel caso avessimo osservato nel campione di 25 atleti un punteggio medio nei test superiore a 39,14.

Esercizio 5 Se per un campione casuale di ampiezza n=16 estratto da una popolazione normale, si osserva x =56 e s=12, quale decisione prendo rispetto alle seguenti ipotesi? (Si consideri un livello di significatività pari a α =0,05). - H 0 : μ =50; H 1 : μ 50 - H 0 : μ =50; H 1 : μ >50 Soluzione Esercizio 5 Dati disponibili: μ 0 =50 (media di popolazione) x =56 (media osservata sul campione) s=12 (deviazione standard del campione) n=16 (numerosità del campione) α=0,05 (livello di significatività) Consideriamo il primo sistema di ipotesi: H 0 : μ = 50 H 1 : μ 50 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 56 50 Il valore della statistica test è = = 2. (12 16) Dal momento che l ipotesi H 1 è di tipo bidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta dalle due code (una a destra e una a sinistra) della distribuzione considerata. Avendo scelto un livello di significatività α=0,05, le due code avranno complessivamente un area pari a 0,05 e cioè 0,025 ciascuna. Quindi, bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,975 (che è il complemento a 1 di 0,025, cioè 0,975+0,025=1). I gradi di libertà sono 15. Infatti, n=16 e i gradi di libertà sono n-1=16-1=15. Si osserva che il valore della 0,025, con 15 gradi di libertà è pari a 2,13145. Vuol dire che la coda di destra inizia al valore 2,13145 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Però, la distribuzione è simmetrica (vale 0 al centro), e bisogna anche considerare la coda di sinistra. Questa inizia in corrispondenza del valore -2,13145 e si cade nella zona di rifiuto se con la formula otteniamo un valore inferiore (per esempio -3). Allora, la valutazione può essere fatta considerando il valore assoluto, ed essendo = -2 = 2 < 2,13145 = 0,025 (15 GdL), non si rifiuta l ipotesi nulla H 0, cioè, non possiamo affermare che il valore medio osservato nel

campione sia differente dal valor medio di popolazione. Consideriamo il secondo sistema di ipotesi: H 0 : μ = 50 H 1 : μ > 50 La varianza di popolazione NON è nota. Quindi, per determinare il valore della statistica test si usa la seguente formula: = x μ0 ~ Student (n 1) 56 50 Il valore della statistica test è = = 2. (12 16) Dal momento che l ipotesi H 1 è di tipo unidirezionale (leggere le pagine 349 e 350 del libro), la zona di rifiuto è composta da una sola coda, in questo caso quella di destra della distribuzione considerata. Avendo scelto un livello di significatività α=0,05 bisogna guardare la tabella della di Student (abella A.3) nella colonna 0,95 (che è il complemento a 1 di 0,05, cioè 0,95+0,05=1). I gradi di libertà sono 15. Infatti, n=16 e i gradi di libertà sono n-1=16-1=15. Si osserva che il valore della 0,05, con 15 gradi di libertà è pari a 1,75305. Vuol dire che la coda di destra inizia al valore 1,75305 e se con la formula otteniamo un valore superiore, allora cadiamo nella zona di rifiuto di H 0. Dal momento che 2 è superiore al valore critico 1,75305, si rifiuta H 0, si accetta di conseguenza l ipotesi alternativa H 1 e si può affermare che il valore medio osservato nel campione è superiore al valor medio di popolazione.