Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y 1, y 2,..., y 10 gli stessi pesi espressi in grammi. Quale delle seguenti affermazioni è vera? Le medie campionarie x e ȳ sono uguali Le varianze campionarie s 2 x e s 2 y sono uguali Il coefficiente di correlazione è uguale ad 1 Il coefficiente di correlazione è uguale ad 0 1.2. Supponiamo di lanciare un dado equilibrato con 6 facce e di riportare il risultato del lancio. Si considerino gli eventi: A =il numero uscito è pari; B =il numero uscito è 5. Quale delle seguenti affermazioni è vera? P (A B) = 1 6 P (A B) = 5 6 P (A B) = 1 3 P (B A) = 1 2 1.3. Una variabile casuale X è tale che E(X) = 1, V ar(x) = 2. Se si pone Y := 2X + 1, quale delle seguenti affermazioni è vera? E(Y ) = 0 E(Y ) = 1 V ar(y ) = 9 V ar(y ) = 4 1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2 X + Y B(2, 1/2) X + Y B(2, 1/4) 1.5. L ipotesi nulla H 0 viene rifiutata, in un test di verifica di ipotesi, a livello di significatività α = 0.05. Quale delle seguenti affermazioni è sicuramente vera? il p-value del test è maggiore di 0.05 per α = 0.01 H 0 viene rifiutata per α = 0.01 H 0 non viene rifiutata per α = 0.1 H 0 viene rifiutata 1.6. Sia X B(1000, 0.01) e Z N(0, 1). Quale delle seguenti affermazioni è falsa? E(X) = 10 V ar(x) = 9.9 P (X 10) P (Z 10) P ( X 10 9.9 1) P (Z 1) 1
2 1.7. Sia X N(1, 4). Allora, per ogni α (0, 1), la probabilità P (X 1 + 2z α ) vale α 1 α α 1 Nessuna delle precedenti 2. Parte B 2.1. Il 5% degli abitanti di un paese ha la pressione alta. Se il 75% delle persone con pressione alta beve alcolici mentre il 50% delle persone con pressione non alta non beve alcolici, qual è la percentuale dei bevitori che ha la pressione alta? Soluzione. Per un abitante scelto a caso si considerino gli eventi: A = ha la pressione alta, B = è un bevitore. Per la formula di Bayes P (A B) = P (B A)P (A) P (B A)P (A) + P (B A c )P (A c ) = 0.75 0.05 0.75 0.05 + 0.5 0.95 0.073. Dunque circa il 7.3% dei bevitori ha la pressione alta.
3 2.2. (Solo per gli studenti del nuovo ordinamento: esame con 6 crediti) Sono state misurate le stature di 60 studenti e i dati sono stati raggruppati nella tabella seguente: Statura x in cm Frequenza osservata x 168 15 168 < x 171 24 171 < x 174 15 174 < x 177 6 x > 177 0 Stabilire in base ai dati se la statura si può ritenere distribuita come una normale di media 170 cm e varianza 9 cm 2. Eseguire il test al 5% di significatività. Soluzione. Usiamo un test χ 2 di buon adattamento. Calcoliamo le frequenze attese delle 5 classi. Sia X N(170, 9) 4 Z N(0, 1). e 1 = 60P (X < 168) = 60P (Z < 2/3) 15.14955 e 2 = 60P (168 < X < 171) = 60[P (Z, 1/3) P (Z < 2/3)] 22.68397 e 3 = 60P (171 < X < 174) = 60[P (Z, 4/3) P (Z < 1/3)] 16.69381 e 4 = 60P (174 < X < 177) = 60[P (Z, 7/3) P (Z < 4/3)] 4.88375 4 e 5 = 60 e i 0.58892 i=1 È necessario unire le ultime due classi, ottenendo la frequenza attesa e 4 4.88375 + 0.58892 = 5.47267. Infine calcoliamo la statistica test: (15 15.14955)2 (24 22.68397)2 (15 16.69381)2 (6 5.47267)2 st = + + + 0.3. 15.14955 22.68397 16.69381 5.47267 Poiché ST < χ 2 3,0.05 = 7.815, l ipotesi di buon adattamento non viene rifiutata: si può ritenere distribuita come una normale di media 170 cm e varianza 9 cm 2.
4 2.3. (Solo per gli studenti del vecchio ordinamento: esame con 5 crediti) I dati nella tabella seguente sono misure che mettono in relazione il tasso di livello alcolico nel sangue (in percentuale rispetto al peso corporeo) con il tempo di reazione (in secondi). percentuale di alcool nel sangue 0.08 0.10 0.12 0.14 0.15 0.16 0.18 tempo di reazione (in sec) 0.32 0.38 0.44 0.42 0.47 0.51 0.63 (a) Si stimino i parametri di un modello di regressione lineare e la varianza σ 2 dell errore. (b) Si determini l intervallo di predizione al 95% per il tempo di reazione corrispondente ad una percentuale di tasso alcolico pari a 0.17. Soluzione. (a) Si trovano le seguenti statistiche aggregate: x = 0.1329, y = 0.4529, S xx = 0.0073, S yy = 0.0591, S xy = 0.0195, SS R = 0.0071, da cui ˆβ 2.6615, ˆα 0.0993, ˆσ2 = 0.0014. (b) L intervallo di predizione è ˆα + 0.17 ˆβ ± 1 + 1 (x 0.17)2 SSR + 7 s xx 5 t 5,0.025 = 0.5517 ± 0.1120
5 2.4. Si vogliono confrontare i tempi di asciugatura di due vernici con differente composizione chimica. A tal scopo si effettuano 10 prove con la vernice del primo tipo e 10 prove con la vernice del secondo tipo, e si osservano i rispettivi tempi di asciugatura media x 1 = 121 min e x 2 = 112 min. Supponendo che i tempi di asciugatura di entrambe le vernici siano distribuiti come delle variabili normali con deviazione standard σ 1 = σ 2 = 8 min, si può concludere al 5% che la prima vernice asciughi più rapidamente della seconda? Soluzione. Ovviamente non si può concludere che µ 1 < µ 2, visto che x 1 > x 2. La domanda corretta avrebbe dovuto essere: si può concludere al 5% che la prima vernice asciughi più lentamente della seconda? In tal caso prendiamo come H 0 : µ 1 > µ 2, e applichiamo un test di confronto di medie per campioni normali indipendenti a varianze note. La statistica test è st = x 1 x 2 σ 2 1 10 + σ2 1 10 2.5156. Il p-value del test è α = P (Z > st) 0.006. Poichè il p-value è < 0.05, si può concludere al 5% che la prima vernice asciughi più lentamente della seconda.