STATISTICA. Esercitazione 6

Documenti analoghi
STATISTICA. Esercitazione 5

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione

INTERVALLI DI CONFIDENZA

Esercitazione del

Esercitazione straordinaaaaariaaaaa. Statistica L-Z

Esercizio 2: voto e ore dedicate allo studio

STATISTICA. Regressione-4 ovvero Macron!

STATISTICA. Esercizi vari

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

Simulazione di esercizi su test di significatività e 95%CI

ESAME. 9 Gennaio 2017 COMPITO B

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

ESAME. 9 Gennaio 2017 COMPITO A

Regressione Lineare Semplice e Correlazione

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Statistica di base (Canale E-M) Istruzioni (da leggere bene prima dell esame):

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

Parametri statistici

Giorno n. clienti di attesa

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

Statistica 1- parte II

Esercizi di statistica inferenziale

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Esame di Statistica A-Di Prof. M. Romanazzi

Biostatistica Laurea Magistrale in Biologia

Statistica inferenziale

STATISTICA. Regressione-2

ESERCITAZIONE N. 7 corso di statistica

Esercizi di statistica

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

Approssimazione normale alla distribuzione binomiale

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

STATISTICA. Esercizi

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Tutorato di Complementi di Analisi Matematica e Statistica 26 maggio 2016

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?

Teorema del Limite Centrale

Prova scritta di Statistica (10 CREDITI) II canale (Dott.ssa Conigliani) 16/06/2009

Esercitazione del 16 maggio 2014

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 7 Luglio 2011

PROBABILITÀ ELEMENTARE

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

STATISTICA MULTIVARIATA SSD MAT/06

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Laboratorio di Probabilità e Statistica

Test di ipotesi su due campioni

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

COGNOME.NOME...MATR..

Intervalli di confidenza

6/15/2018. Regressione lineare rappresentare con una retta due fenomeni X e Y quantitativi osservati contemporaneamente. Correlazionelineare = con 1 1

Capitolo 12 La regressione lineare semplice

Distribuzione normale

COGNOME.NOME...MATR..

Metodologie Quantitative

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

Tecniche di sondaggio

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

1.1 Obiettivi della statistica Struttura del testo 2

La verifica delle ipotesi

Cognome e Nome:... Matricola e corso di laurea:...

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

Esercitazione n. 3 - Corso di STATISTICA - Università della Basilicata - a.a. 2011/12 Prof. Roberta Siciliano

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Teorema del Limite Centrale

Esercizi di Probabilità e Statistica

STATISTICA ESERCITAZIONE 13

Corso di Statistica Esercitazione 1.8

Esercitazioni di statistica

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Esercitazione 9 del corso di Statistica (parte seconda)

Probabilità e Statistica Esercitazioni. a.a. 2017/2018. C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica

1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

docente: J. Mortera/P. Vicard Nome

Metodi Matematici e Informatici per la biologia. Esercizi

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Statistica (parte II) Esercitazione 4

Esercitazione 8 del corso di Statistica 2

Test di ipotesi. Test

Soluzioni della prova scritta del 6 Marzo 2013 (a.a. 2012/2013)

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica Applicata Corso di Laurea in Scienze Naturali a. a. 2017/2018

STATISTICA A K (60 ore)

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Cognome e Nome:... Corso di laurea:...

Distribuzione Normale

Intervalli di confidenza

Tutta la scienza è fondata sulle misure (Helmholtz)

6/1/2018 STANDARDIZZAZIONE ~ 10,25 < 8 =P < <0.4 = variabile aleatoria dimedia e varianza

Transcript:

STATISTICA Esercitazione 6

Esercizio 1 Ad un esame universitario sono stati assegnati in modo casuale tre compiti diversi con i seguenti risultati: Compito A Compito B Compito C Numero studenti 41 39 43 Media dei voti 24 24,6 23 Varianza dei voti 12,25 14,44 10,80 1. In termini di voto medio, si può concludere che i tre compiti sono di pari difficoltà? Per rispondere si esegua un test con livello di significatività pari al 1%.

Soluzione 1 ANOVA: Analisi della varianza a 1 via (Paragrafo 5.7.2) Compito A Compito B Compito C Numero studenti = 41 = 39 = 43 Media dei voti = 24 = 24,6 = 23 Varianza dei voti 12,25 = 14,44 = = 10,80 Test Ipotesinulla H 0 : le medie dei voti dei tre compiti sono uguali =0 Ipotesialternativa H 1 : almeno una delle suddette medie è diversa >0 Si rifiuta H 0 se /() > (, ) /()

Soluzione 1 ANOVA: Analisi della varianza a 1 via (Paragrafo 5.7.2) Compito A Compito B Compito C Numero studenti = 41 = 39 = 43 n= 123 Media dei voti = 24 = 24,6 = 23 Varianza dei voti = 12,25 = 14,44 = 10,80 Statistica test : /() /() = 2,33/(4),33/(44) =2,12 = 1 " = 1!. = 1!!!! "! " = 41 24 23,84 +39 (0,76) +43 ( 0,84) 123 "! = 41 24+39 24,6+43 23 123! =23,84 /! = 41 12,25+39 14,44+43 10,80 123 =12,44 =0,44 Compito A, B, C 1 =3

Soluzione 1 ANOVA: Analisi della varianza a 1 via (Paragrafo 5.7.2) Compito A Compito B Compito C Numero studenti = 41 = 39 = 43 Media dei voti = 24 = 24,6 = 23 Varianza dei voti = 12,25 = 14,44 = 10,80 Statistica test: Valore di soglia /(1 1). /( 1) =2,12 (, ) (4, 44) (, 2) =2,2 =2,66 =4,79 Si rifiuta H 0 se /() > (, ) /(), ossia se 2,12> 4,79 FALSO Quindi non si rifiuta H 0 e posso ritenere i tre compiti di ugual difficoltà.

Esercizio 2 Si consideri un campione di 4 individui di cui si rileva l età (variabile X) e il numero di pulsazioni cardiache per minuto (variabile Y): x i 10 20 30 45 y i 200 195 180 163 Al fine di indagare se il numero di pulsazioni cardiache dipenda dall età: 1. rappresentare graficamente i dati 2. calcolare il coefficiente di correlazione lineare 3. determinare la retta di regressione 4. valutare la bontà della retta regressione stimata 5. prevedere l intervallo di confidenza al 90% del numero di pulsazioni cardiache per un individuo di 22 anni. 6. Si verifichi l ipotesi 7 2 :9=0 contro 7 :9 0 per livello ;=0.05

Soluzione 2 1. rappresentare graficamente i dati x i 10 20 30 45 y i 200 195 180 163 Grafico di dispersione

Soluzione 2 2. calcolare il coefficiente di correlazione lineare = > =?@? @ = 184,37 167,19 208,25 = A,BCC X e Y sono in correlazione lineare inversa x i 10 20 30 45 105 y i 200 195 180 163 738 x i 2 100 400 900 2025 3425 y i 2 40000 38025 32400 26569 136994 x i y i 2000 3900 5400 7335 18635 " =! "! E=! E! = 105 4 =26,25 = 738 4 =184,5? = "! " = 3425 4 26,25 =167,19 @ = E! E = 136994 184,5 =208,25 4?@ = 1 "! E! " E= 18635 26,25 184,5= 184,37 4!

Soluzione 2 3. determinare la retta di regressione 9X =?@? = 184,37 167,19 = 1,10 YZ=E 9X" =184,5 ( 1,10) 26,25=213,38 x i 10 20 30 45 105 y i 200 195 180 163 738 x i 2 100 400 900 2025 3425 y i 2 40000 38025 32400 26569 136994 x i y i 2000 3900 5400 7335 18635 " =! "! E=! E! La retta di regressione stimata è = 105 4 =26,25 = 738 4 =184,5? = "! " = 3425 4 26,25 =167,19 @ = E! E = 136994 184,5 =208,25 4?@ = 1 "! E! " E= 18635 26,25 184,5= 184,37 4! E=213,38 1,10"

Soluzione 2 3.Extra : Rappresentare la retta di regressione stimata Retta di regressione : E=213,38 1,10" Si tratta di calcolare due punti della retta e congiungerli: Primo punto = (10; 202,38) ( x =10 E=213,38 1,10 10=202,38 ) (",E) Secondo punto = = (26,25; 184,5) ( ilbaricentro ultime righe pag. 172 ) Nella figura: - primo e secondo punto (punti rossi) - retta di regressione (linea rossa)

Soluzione 2 4. valutare la bontà della retta regressione stimata Indice [ di bontà di adattamento della retta ai dati: [ =\?@ =( 0,9881) =0,9764 ] =A,B^_4 indica che la retta di regressione si adatta bene ai dati. RIPASSO [ varia tra 0 e 1 (da scarso a ottimo adattamento della retta ai dati) \?@ varia tra -1 e 1 (scarsa correlazione lineare vicino a 0, ottima correlazione lineare vicino a ±1)

Soluzione2 Calcolo di s 2 s 2 viene utilizzato per: - la verifica di ipotesi sul coefficiente b della retta di regressione - il calcolo dell intervallo di confidenza per la previsione Primomodo: s = 2 1 [ @ = 4 1 0,9764 208,25=9,85 4 2 Secondo modo: s = a e a n 2 =19,67 4 2 =9,835 (differenza nei risultati dovuta all approssimazione) x i 10 20 30 45 y i 200 195 180 163 >b c 202,38 191,38 180,38 163,88 d c => c >b c -2,38 3,62-0,38-0,88 0 (circa) d c 5,66 13,1 0,14 0,77 19,67

Soluzione 2 E=213,38 1,10" 5. prevedere l intervallo di confidenza al 90% per il numero di pulsazioni cardiache di un individuo di 22 anni. Già calcolati in precedenza : " =26,25 / =9,85? =167,19 Previsione di Y per "=22: Ee=213.38 1.10 22=189,18 2 Intervallo di confidenza per tale previsione al 95% : () EZ 2 g h/ / 1 +(" " 2)? 189,18 2,91999 9,85 1 4 +(26,25 22) 4 167,19 189,18 4,82 kl 90% : (184,36 ;194) 90% =0,90 ;=1 0,90=0,10 g h/ () =g 2,2/ (3) =g 2,6j () =2,91999

Soluzione2 6. Si verifichi l ipotesi 7 2 :9=0 rispetto a 7 :9 0 per livello ;=0.05 Si rifiuta H 0 se n o2 pb q >t / (r), ossia se 9,17 >4,30265 VERO!!! Si rifiuta H 0 per ;=0.05, quindi il valore stimato di b è significativamente diverso da zero σb n = r au s (x a x ) = / = 9,85? 4 167,19 =0,12 bx 0 = 1,10 0 σb n 0,12 =9,17 t / (r) =t 2.2j/ () = t 2,6wj () =4,30265

Esercizio 3 Data la retta di regressione E=1 3", qual è il valore previsto della variabile Y per "= 2? a) y=2 b) y=0 c) y=7 d) y=-5

Soluzione 3 Data la retta di regressione E=1 3", qual è il valore previsto della variabile Y per "= 2? a) y=2 b) y=0 c) y=7 d) y=-5 Infatti E=1 3 2 =1+6=7

Esercizio 4 Data la retta di regressione E= 2+", qual è l intervallo di confidenza al 90% per la previsione della variabile Y in "=4? a) IC(90%): (-0,5 ; 1,5) b) IC(90%): (0,5 ; 3,5) c) IC(90%): (3 ; 7) d) IC(90%): (10 ; 12)

Soluzione 4 Data la retta di regressione E= 2+", qual è l intervallo di confidenza al 90% per la previsione della variabile Y in "=4? a) IC(90%): (-0,5 ; 1,5) b) IC(90%): (0,5; 3,5) c) IC(90%): (3 ; 7) d) IC(90%): (10 ; 12) Il valore previsto in "=4 di Y è E= 2+4=2 Siccome il valore ottenuto E=2 è il punto medio di IC(90%), la risposta b) è la sola possibile.

Esercizio 5 Quale potrebbe essere il coefficiente di correlazione tra X e Y qualora si fosse stimata la seguente retta di regressione E=2 5"? a) \?@ =10 b) \?@ = 1,5 c) \?@ =0,9 d) \?@ = 0,5

Soluzione 5 Quale potrebbe essere il coefficiente di correlazione tra X e Y qualora si fosse stimata la seguente retta di regressione E=2 5"? a) \?@ =10 b) \?@ = 1,5 c) \?@ =0,9 d) = > = A,x Si escudono a) e b) in quanto \?@ varia tra -1 e +1 Si esclude anche c) in quanto 0,9 denota una relazione lineare diretta tra X e Y, mentre la retta di regressione stimata indica una relazione lineare inversa in quanto 9X = 5 è negativo. L unico valore plausibile e indicato in d).

Esercizio 6 Gli addetti alla sicurezza dell aeroporto di Malpensa, sottoposti ad un test, sono stati in grado di scoprire solo 72 delle 100 armi indossate da ispettori in incognito. Si verifichi che il tasso riscontrato sia uguale a quello medio nazionale, pari all 80%, contro l alternativa che sia inferiore. Si assuma ;=0,01. DATI: esperimento di Bernoulli y 1,y 2,,y 100 ~ }~ n=100 TEST 7 2 : =0,80 7 : <0,80 = } ~ / }// = 72 100 =0,72 ;=0,01

Soluzione 6 DATI: esperimento di Bernoulli y 1,y 2,,y 100 ~ }~ n=100 = } ~ / }// = 72 100 =0,72 TEST 7 2 : =0,80 7 : <0,80 ;=0,01 Rifiuto 7 2 se 2 2 (1 2 )/ < ˆh, ossia se 2< 2,33 FALSO!!! 2 2 (1 2 )/ = 0,72 0,80 0,80(1 0,80)/100 = 2 ˆh = ˆ2,2 = ˆ2,66 = 2,33 NON rifiuto l ipotesi nulla Si può ritenere Malpensa in linea con gli altri aeroporti nazionali per quanto riguarda i controlli di sicurezza

Esercizio 6 bis Gli addetti alla sicurezza dell aeroporto di Malpensa, sottoposti ad un test, sono stati in grado di scoprire solo 72 delle 100 armi indossate da ispettori in incognito. Calcolare l intervallo di confidenza a livello 90% per la vera proporzione di armi scoperte durante i controlli. DATI: esperimento di Bernoulli y 1,y 2,,y 100 ~ }~ n=100 = } ~ / }// = 72 100 =0,72 90%=0,90 ;=1 0,90=0,10

Soluzione 6 bis DATI: esperimento di Bernoulli y 1,y 2,,y 100 ~ }~ n=100 ;=1 0,90=0,10 = } ~ / }// = 72 100 =0,72 ˆ h =ˆ 2,2 =ˆ2,6j =1,64 ˆ h 1 0,72 1,64 0,72 1 0,72 100 0,72 0,07 kl 90% =( 0,65 ; 0,79 )

Esercizio 7 Il tempo (in giorni) di degenza ospedaliera per il trattamento di una certa malattia si distribuisce normalmente con media incognita e deviazione standard 2,1. Su un campione di n=30 pazienti, si è riscontrato un tempo medio di degenza di 7,3. Posto ;=0,05, si esegua il test 7 2 : =7 contro l alternativa 7 : >7. DATI: y 1,y 2,,y 30 ~ Š ; =2,1 n=30 " =7,3 TEST 7 2 : =7 7 : >7 ;=0,05

Soluzione 7 DATI: y 1,y 2,,y 30 ~ Š ; =2,1 n=30 " =7,3 TEST 7 2 : =7 7 : >7 ;=0,05 Rifiuto 7 2 se " 2 / >ˆh, ossia se 0,78>1,64 FALSO!!! " 2 / = 7,3 7 2,1/ 30 =0,78 ˆh =ˆ2,2j =ˆ2,6j =1,64 NON rifiuto l ipotesi nulla In base al test, si ritiene che il numero medio di giorni di degenza sia 7 giorni

Soluzione 7 con il p-value DATI: y 1,y 2,,y 30 ~ Š ; =2,1 n=30 " =7,3 TEST 7 2 : =7 7 : >7 ;=0,05 Come prima, si calcola la statistica test " 2 / = 7,3 7 2,1/ 30 =0,78 Sulla tavola della normale : Y }=1 Φ 0,78 =1 0,78230=0,21770 NON rifiuto 7 2 in quanto p-value> ;,ossia 0,21770 > 0,05

Esercizio 7 bis Il tempo (in giorni) di degenza ospedaliera per il trattamento di una certa malattia si distribuisce normalmente con media incognita e deviazione standard 2,1. Su un campione di n=30 pazienti, si è riscontrato un tempo medio di degenza di 7,3. Trovare l intervallo di confidenza a livello 99% per il tempo medio di degenza. DATI: y 1,y 2,,y 30 ~ Š ; =2,1 n=30 " =7,3 99%=0,99 ;=1 0,99=0,01

Soluzione 7 bis DATI: ;=1 0,99=0,01 y 1,y 2,,y 30 ~ Š ; =2,1 n=30 " =7,3 ˆ h =ˆ 2,2 =ˆ2,66j =2,58 " ˆ h 7,3 2,58 2,1 30 7,3 0,99 kl 99% =( 6,31 ;8,29 )

Esercizio 8 Un botanico misura la lunghezza (in centimetri) di 16 foglie di camelia in un area altamente inquinata e ottiene una lunghezza media pari a 15 con deviazione standard 2. Si supponga il campione estratto da una popolazione Gaussiana. I libri di botanica riportano che le foglie di camelia sono lunghe mediamente 10 cm. A livello 5% sottoporre a verifica l ipotesi nulla che la lunghezza media delle foglie sia 10 contro l alternativa che sia diversa da 10. DATI: y 1,y 2,,y 15 ~ Š, n=16 " =15 /=2 / =4 TEST 7 2 : =10 7 : 10 ;=0,05

Soluzione 8 DATI: y 1,y 2,,y 15 ~ Š, n=16 " =15 /=2 / =4 TEST 7 2 : =10 7 : 10 ;=0,05 Rifiuto 7 2 se " 2 () // >g h, ossia se 10 >2,13145 VERO!!! " 2 // =15 10 2/ 16 =10 () ( ) g h/=g2,2j/ (j) =g 2,6wj=2,13145 Rifiuto l ipotesi nulla Le foglie di camelia nella zona inquinata hanno lunghezza diversa dall usuale.

Esercizio 8 bis Un botanico misura la lunghezza (in centimetri) di 16 foglie di camelia in un area altamente inquinata e ottiene una lunghezza media pari a 15 con deviazione standard 2. Si supponga il campione estratto da una popolazione Gaussiana. Si costruisca l intervallo di confidenza al 95% per la lunghezza medie delle foglie di camelia. DATI: y 1,y 2,,y 15 ~ Š, n=16 " =15 /=2 / =4 95%=0,95 ;=1 0,95=0,05

Soluzione 8 bis DATI: ;=1 0,95=0,05 y 1,y 2,,y 15 ~ Š, n=16 " =15 /=2 / =4 () ( ) g h/=g2,2j/ (j) =g 2,6wj=2,13145 () / " g h/ 15 2,13145 2 16 15 1,07 kl 95% =( 13,93 ;16,07 )