Statistica Cognome: Laurea Triennale in Biologia Nome: 26 luglio 2012 Matricola: Tema A 1. Parte A 1.1. Sia x 1, x 2,..., x n un campione di n dati con media campionaria x e varianza campionaria s 2 x 0. Si consideri un nuovo campione di dati definito come y k := x k a, con a > 0. Siano ȳ e s 2 y, rispettivamente, la media e varianza campionaria del nuovo campione. Quale delle seguenti affermazioni è vera? x = ȳ s 2 x = s 2 y s 2 y = s 2 x + a 2 Nessuna delle precedenti 1.2. Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che P (A B) = 0 P (A B) = 1 P (A B) = P (B A) P (A B) = 5/6 1.3. Siano X N(1, 2) e Y N(1, 4) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? X + Y N(2, 6) X Y N(0, 6) E(X 3Y ) = 2 V ar(x 3Y ) = 10 1.4. Sia X B(100; 0.01). Quale delle seguente affermazioni è vera? Possiamo approssimare la distribuzione di X con quella di una normale N(1, 0.99) Possiamo approssimare la distribuzione di X con quella di una Poisson P o(1) Possiamo approssimare la distribuzione di X sia con N(1, 0.99) chè con P o(1) Nessuna delle precedenti 1.5. Un produttore di sigarette afferma che il contenuto medio µ di nicotina nelle sigarette da lui prodotte è significativamente inferiore a 0.7 mg. Per dimostrarlo, fa analizzare un campione di 100 sigarette, misurando il livello di nicotina di ognuno. Quale test gli consigliereste di usare? Un test su una proporzione per verificare l ipotesi H 0 : µ < 0.7 Un test su una proporzione per verificare l ipotesi H 0 : µ > 0.7 Un test sulla media di una popolazione normale per verificare l ipotesi H 0 : µ < 0.7 Un test sulla media di una popolazione normale per verificare l ipotesi H 0 : µ > 0.7 1.6. In un test di buon adattamento ad una certa distribuzione, si ottengono le seguenti frequenze attese: Cosa si può concludere? 6.77 13.53 13.53 9.02 4.51 1.8 0.6 0.17 0.04 0.01 È necessario accorpare alcuni valori in classi più ampie. I dati sono in ottimo accordo con la distribuzione ipotizzata. I dati non si accordano alla distribuzione ipotizzata. Nessuna delle precedenti. 1
2 1.7. In un test di verifica di ipotesi si ottiene un p-value di 0.3. Si può concludere che: I dati sono fortemente in disaccordo con l ipotesi nulla. I dati sono moderatamente in disaccordo con l ipotesi nulla. I dati sono fortemente in accordo con l ipotesi nulla. I dati sono compatibili con l ipotesi nulla. 2. Parte B 2.1. (Solo per gli studenti del nuovo ordinamento: esame con 6 crediti) Dall esame del colore dei cappelli dei bambini di una certa regione, si ricavano i seguenti dati biondo rosso castano bruno nero Totale maschi 592 119 849 504 36 2100 femmine 544 97 677 451 14 1783 Totale 1136 216 1526 955 50 3883 Passiamo concludere all 1% di significatività che il colore dei capelli è indipendente dal sesso? Soluzione. Si calcolano in primo luogo le frequenze attese stimate, i cui valori sono riportati nella tabella sottostante. biondo rosso castano bruno nero maschi 614.37 116.82 825.29 516.48 27.04 femmine 521.63 99.18 700.71 438.52 22.96 Servendosi delle tabelle si calcola il valore della statistica che è T = 10.47. Poichè χ 2 4,0.01 = 13.277 > T, l ipotesi di indipendenza tra il colore dei capelli e il sesso viene accettata all 1%.
3 2.2. (Solo per gli studenti del vecchio ordinamento: esame con 5 crediti) Due tipi di soluzione chimiche sono state provate per misurarne il ph. L analisi dei 6 campioni della prima soluzione ha mostrato un ph medio di 7.52, con uno scarto quadratico campionario di 0.032; l analisi dei 5 campioni della seconda soluzione ha mostrato un ph medio di 7.49 con uno scarto quadratico campionario di 0.024. Stabilire al 5% di significatività se le due soluzioni abbiano mediamente lo stesso valore di ph. Soluzione. Soluzione. Siano µ x e µ y, rispettivamente, le medie del valore di ph nella prima e nella seconda soluzione. Sottoponiamo a verifica l ipotesi H 0 : µ x = µ y. Supponiamo che i due campioni abbiano distribuzione normale, e rattandosi di campioni piccoli, verifichiamo la condizione s2 x s 2 (1/2, 2). Quindi calcoliamo la varianza campionaria combinata y s 2 p = 5 0.0322 + 4 0.024 2 = 0.000825 9 e tramite questa la statistica test x ȳ st = ( s 2 1 p 6 + 1 ) 1.72. 5 Per un livello di significatività α = 0.05 si ha quindi la regione critica C = { ST > t 9,0.025 }, con t 9,0.025 = 2.2622. Poich st non cade nella regione critica non possiamo rifiutare H 0, e quindi concludiamo che i dati non sono sufficienti a concludere che via sia una differenza tra il ph delle due soluzioni.
4 2.3. Una certa ditta farmaceutica asserisce che un suo farmaco è efficace nel 90% dei casi. In un campione di 200 persone che lo hanno usato, il farmaco si è rivelato efficace in 160 casi. Da tele osservazione, si sospetta che l efficacia del farmaco sia minore di quella dichiarata dalla ditta farmaceutica. (a) Stabilire se il sospetto è legittimo ad un livello di significatività del 5% (b) Determinare il valore-p del test opportuno. (c) Determinare l intervallo di confidenza all 99% per il numero medio dei casi in cui il farmaco è risultato efficace Soluzione. (a) Sia p 0 = 0.9 la proporzione di efficacia del farmaco dichiarato dalla ditta, e ˆp = 0.8 quella stimata sul campione. Sottoponiamo a verifica l ipotesi H 0 : p 0.9. Usiamo quindi un test per la proporzione di un campione. Otteniamo la statistica test st = ˆp p 0 p 0 (1 p 0 ) 200 4.71. La regione critica è C = {ST < z 0.05 }. Essendo z 0.05 = 1.645, st cade nella regione critica ed H 0 è rifiutata: i dati non sono sufficienti a concludere che il sospetto dei consumatori è legittimo. (b) Il valore-p del test è: ᾱ = P (Z st) = P (Z 4.71) 0. (c) L intervallo di confidenza al 99% è ˆp(1 ˆp) ˆp ± z 0.005 = 0.8 ± 0.07286 200
5 2.4. Un autobus di linea effettua il collegamento tra due stazioni A e B seguendo due percorsi alternativi 1 e 2. La frequenza con cui segue il primo percorso è pari a 0.3, quella con cui segue il secondo percorso è pari a 0.7. Un gruppo di pendolari riesce a prendere il suddetto autobus con probabilità pari a 0.25 quando questo percorre il tragitto 1 e con probabilità 0.65 quando questo percorre il tragitto 2. Sapendo che il gruppo di pendolari non è riuscito a prendere l autobus, con che probabilità esso ha seguito il percorso 1? Soluzione. Consideriamo gli eventi A= il gruppo di pendolari non riesce a prendere l autubus B= l autobus segue il primo percorso Per ipotesi, sappiamo valere: P (E) = 0.3, P (E c ) = 0.7, P (A E) = 0.25, P (A E c ) = 0.65. Utilizzando la formula di Bayes si ottiene P (E A) = P (A E)P (E) P (A E)P (E) + P (A E c )P (E c ) = 0.14115