Compitino di Statistica del 19 maggio 200 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola Es. 1 Es. 2 Es. 3 Es. 4 Somma Voto finale Attenzione: si consegnano SOLO i fogli di questo fascicolo.
Esercizio 1. La translucenza nucale e il bitest sono due esami usati, come l amniocentesi e la villocentesi, per stabilire se un feto sia affetto dalla sindrome di Down (trisomia 21). Amniocentesi e villocentesi danno una risposta certa ma provocano il rischio di un aborto spontaneo, mentre translucenza nucale e bitest sono esami non invasivi che non hanno alcuna conseguenza sul feto o sulla madre. In particolare, la translucenza nucale individua il 77% dei feti Down e dà un risultato positivo anche nel % dei casi in cui il feto non è Down. Gli stessi dati per il bitest sono rispettivamente del 60% e del %. Infine, la probabilità che un feto sia Down in una donna di 3 anni è di 1/210. 1. Calcolare la probabilità che una donna di 3 anni che si sottopone alla translucenza nucale abbia un risultato positivo (feto Down). 2. Calcolare la stessa probabilità nel caso del bitest. 3. Calcolare, nei due casi, la probabilità che il feto sia effettivamente Down nel caso in cui si abbia avuto un risultato positivo. 4. Supponiamo che si facciano entrambi gli esami, e che i risultati degli esami siano indipendenti tra di loro sia nel caso in cui il feto sia Down sia nel caso in cui non lo sia. Calcolare la probabilità che il feto sia Down nel caso in cui si abbiano avuto due risultati positivi. Esercizio 2. Ogni anno circa il 4% dei fumatori tenta di smettere, e il 0% di questi hanno successo, nel senso che riescono a non fumare per almeno 1 anno. 1. Qual è la probabilità che un singolo fumatore smetta di fumare per almeno 1 anno? 2. Qual è la probabilità che, di 20 fumatori, almeno 4 smettano di fumare per almeno 1 anno? Supponiamo che 20 fumatori entrino in un programma per aumentare la probabilità di successo nello smettere di fumare. 3. Se 1 di queste 20 persone dopo 1 anno non hanno ripreso a fumare, può questo programma considerarsi valido? Per rispondere a questa domanda, calcolare la probabilità che questo accada se la probabilità di avere successo fosse sempre del 0%. Esercizio 3. È stato condotto uno studio su alcuni malati di retinite pigmentosa, una malattia che provoca una perdita di campo visivo. Le misurazioni sono state fatte in scala logaritmica, e in questo modo i dati possono essere ritenuti gaussiani. Dopo 3 anni, si è osservata una perdita media di campo visivo di 0.14, con una deviazione standard di (in scala logaritmica). 1. Calcolare la proporzione di pazienti che ha mostrato un declino nel campo visivo in questi 3 anni. 2. Calcolare la proporzione di pazienti che ha mostrato un declino nel campo visivo di più del 20% in questi 3 anni (nota: in scala logaritmica, il declino è di log 1 0.8 = 0.223). 3. Se i pazienti erano 90 in tutto, calcolare la probabilità che meno di 3 pazienti abbiano mostrato tale declino. Esercizio 4. Si suppone che la pressione sanguigna presa dal braccio destro o dal braccio sinistro sia confrontabile. Per testare questa ipotesi, si prendono 2 campioni da volontari, con i seguenti risultati: n braccio sinistro braccio destro 1 130 126 2 120 124 3 13 127 4 100 9 98 102 1. Fare un test statistico per capire se le due braccia danno risultati confrontabili. Riportare limitazioni per il valore P. 2. Come cambia la risposta se i due campioni sono composti dalle stesse persone? 3. Eseguire il test del punto 2). Riportare limitazioni per il valore P.
Soluzioni Esercizio 1 Innanzitutto definiamo gli eventi A := { il feto è Down, B 1 := { la translucenza nucale è positiva, B 2 := { il bitest è positivo. Possiamo riscrivere i dati come P(B 1 A) = 0.77, P(B 1 A c ) = 0.0, P(B 2 A) = 0.6, P(B 2 A c ) = 0.0, P(A) = 1/210 = 0.004762. 1. Usando la formula della probabilità totale abbiamo P(B 1 ) = P(B 1 A)P(A) + P(B 1 A c )P(A c ) = 0.0034 2. Come prima, abbiamo P(B 2 ) = P(B 2 A)P(A) + P(B 2 A c )P(A c ) = 0.0026 3. Usando la formula di Bayes abbiamo: P(A B 1 ) = P(B 1 A)P(A) P(B 1 ) P(A B 2 ) = P(B 2 A)P(A) P(B 2 ) = 0.06863 = 0.0430 4. Dobbiamo calcolare P(A B 1 B 2 ). Utilizzando la formula di Bayes e l informazione sull indipendenza abbiamo P(A B 1 B 2 ) = = P(B 1 B 2 A)P(A) P(B 1 B 2 A)P(A) + P(B 1 B 2 A c )P(A c ) = P(B 1 A)P(B 2 A)P(A) P(B 1 A)P(B 2 A)P(A) + P(B 1 A c )P(B 2 A c )P(A c ) = 0.46927 Esercizio 2 Innanzitutto definiamo gli eventi A := { si tenta di smettere e B := { non si fuma per 1 anno ; ovviamente, B A. Possiamo riscrivere i dati come P(A) = 0.04, P(B A) = 0.. 1. Per la formula della probabilità totale, abbiamo P(B) = P(B A)P(A) + P(B A c )P(A c ) = 0. 0.04 + 0 0.96 = 0.02 2. Possiamo definire le variabili aleatorie { 1 se l i-esimo fumatore smette Y i = 0 altrimenti Allora Y i Be(p), con p = 0.02, e le (Y i ) i sono indipendenti. Allora S n = n i=1 Y i è il numero di fumatori che riescono a smettere, che è distribuito con legge B(n, p). Dato che np = 20 0.02 = 0.4 <, non si può usare l approssimazione normale (e nemmeno quella di Poisson). Si ha quindi Per n = 2 abbiamo: P{S 20 4 = 1 P{S 20 3 = 1 3 P{S 20 = k = 1 761 0.27249 0.0283 0.00647 = 0.00060 k=0 dove per calcolare le probabilità binomiali si può usare la regola ricorsiva: P{S 20 = 0 = ( ) 20 p 0 (1 p) 20 = 0.98 20 = 761 0 P{S 20 = 1 = P{S 20 = 0 20 1 0.02 0.98 = 0.27249 P{S 20 = 2 = P{S 20 = 1 19 2 0.02 0.98 = 0.0283 P{S 20 = 3 = P{S 20 = 2 18 3 0.02 0.98 = 0.00647
3. Se supponiamo che tutti e 20 i fumatori abbiano tentato di smettere di fumare, possiamo ancora considerare le variabili aleatorie i.i.d. (Y i ) i di legge Be(p), ma stavolta p = 0.. In questo caso, np = 20 0. = 10 >, e si può utilizzare l approssimazione normale. Si ha quindi: P{S 20 1 = P { S 20 np np(1 p) 1 F Z (2.01) = 1 0.97778 = 0.02222 14. 10 = P{S n 2.01 = 1 F S n (2.01) dove si è utilizzata anche la correzione di continuità. In alternativa, si potrebbe calcolare questa probabilità utilizzando la legge binomiale esatta, e si otterrebbe P{S 20 1 = 0.02069. Esercizio 3 Chiamiamo X il logaritmo della perdita di campo visivo in 3 anni. Allora X N(0.14, 2 ). 1. Dobbiamo calcolare { X 0.14 P{X > 0 = P 2. Dobbiamo calcolare { X 0.14 P{X > 0.223 = P > > 0 0.14 = P{Z > 0.21 = 1 F Z ( 0.21) = F Z (0.21) = 0.8317 0.223 0.14 = P{Z > 0.13 = 1 F Z (0.13) = 1 0.4776 = 0.4224 3. Definiamo la variabile aleatoria { 1 se l i-esimo individuo ha mostrato tale declino X i = 0 altrimenti Allora X i Be(p), con p = 0.4224. Definiamo poi S n = n i=1 X i = n. di pazienti che hanno mostrato un declino maggiore del 20%. Allora S n B(n, p). Fare i calcoli con questa distribuzione sarebbe molto laborioso, ma siccome np = 90 0.4224 40.7 >, possiamo approssimare la legge di S n con una legge N(np, np(1 p)). Abbiamo quindi: P{S 90 < 3 = P { S 90 np 34. 40 < = P{Sn < 1.31 = F S np(1 p) 40 0.4 n ( 1.31) F Z ( 1.31) = 1 F Z (1.31) = 1 0.90490 = 0.0910 dove si è utilizzata anche la correzione di continuità. Esercizio 4 1. Se i 2 campioni sono composti da persone diverse, dobbiamo fare un test t di ipotesi H 0 : µ S = µ D e alternativa H 1 : µ S µ D. Chiamando X le misurazioni sul braccio destro e Y quelle sul braccio sinistro, abbiamo che X = 116.6, s 2 X = 287.8, Ȳ = 114.8 e s2 Y = 228.7, pertanto 116.6 114.8 t = = 0, 177 287.8 + 228.7 I gradi di libertà sono ν = + 2 = 8; per questi gradi di libertà, il quantile più basso è t 0.9 (8) = 1.89, che corrisponde ad un α = 0.1. Dato che t < t 0.9 (8), concludiamo che P > 0.1. Possiamo quindi concludere che le due braccia danno risultati confrontabili. 2. Se i due campioni sono composti dalle stesse persone, non si possono considerare indipendenti. La procedura adatta in questo caso è considerare, per ogni persona, le differenze di misurazione, ottenendo cosìil nuovo campione (che possiamo chiamare Z) 4, 4, 8,, 4 e su questo fare un test sulla media di ipotesi H 0 : µ Z = 0 e alternativa H 1 : µ Z 0. 3. Abbiamo che t = 1.8 = 0.73 30.2 I gradi di libertà questa volta sono ν = 1 = 4. per questi gradi di libertà, il quantile più basso è t 0.9 (4) = 2.131, che corrisponde ad un α = 0.1. Dato che t < t 0.9 (4), anche in questo caso concludiamo che P > 0.1, e possiamo quindi ancora concludere che le due braccia danno risultati confrontabili.
Compitino di Statistica del 19 maggio 200 Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova docente: Tiziano Vargiolu Andreazza Camilla 1, Balzano Nicolò 9 Barbierato Mauro 12 Bonetto Greta 23, Caprara Carlotta 14, Carretta Giulia 11 Cogo Marisa Anna 2, Dametto Paolo 12, Dotto Marco 13, Ferrari Oscar 8 Gessuti Micael 13 Gianandrea Marcello 11, Giulitti Stefano 7, Lanciai Federico 9, Longo Stefano 6, Marcato Alice 17 Mannara Francesco 22, Mazzoccato Alberto 8 Mazzocco Giovanni, Milan Andrea 4 Miolli Giulia Valentina 16, Piazza Stefano 26 Pierobon Andrea 29, Pirazzini Marco 9 Povellato Giulia 10, Puricelli Diego 1 Ranchio Alessandro 9, Shehapi Altea Sofia Alessandro Sorato Nadia 23 Stevan Martina 10 Stradiotto Damiano 12, Vendramin Matteo 2, Venturini Luca 2, Vescovo Damiano 16 Zampini Matteo 11 Zane M.Angela 7, Visione compiti corretti: martedì 24 durante la didattica di supporto.