Statistica Metodologica Esercizi di Probabilita e Inferenza Silvia Figini e-mail: silvia.figini@unipv.it Problema 1 Sia X una variabile aleatoria Bernoulliana con parametro p = 0.7. 1. Determinare la media e la varianza di X. 2. Scrivere la distribuzione di probabilita. 3. Considerando la variabile aleatoria W = 20 i=1 X i, che distribuzione ha Z? Scrivere la distribuzione di probabilita corrispondente e calcolare media e varianza. 4. Calcolare P (Z > 2) e P (Z 1). Problema 2 Sia X una variabile aleatoria Poisson (λ = 3), p(x; λ) = λx e λ x!. 1. Calcolare la media e la varianza della variabile aleatoria X. 2. Calcolare P (X > 3). 3. Calcolare P (X < 1). 4. Calcolare P (X = 3). 5. Per quali fenomeni risulta utile la distribuzione di Poisson?
Problema 3 Il numero medio di incidenti che si verifica in una settimana sulla tratta autostradale Salerno-Reggio Calabria e pari a 5. 1. Scrivere la distribuzione di probabilita utile per modellare un fenomeno come quello descritto. Quanto vale la varianza? 2. Calcolare la probabilita che succedano almeno 2 incidenti. 3. Calcolare la probabilita che succeda un solo incidente. 4. Considerate ora la settimana composta da 7 giorni lavorativi. Determinare la probabilita che per almeno due giorni succeda un solo incidente. 5. In corrispondenza al punto precedente, quanto vale la media del numero di incidenti? E la varianza? Problema 4 Il numero di incidenti aerei nella compagnia XY che succedono in un anno nella tratta Milano-Londra risulta essere mediamente pari a 1. 1. Scrivere la distribuzione di probabilita corrispondente. 2. Calcolare la probabilita che succedano almeno 2 incidenti. 3. Calcolare la probabilita che non succedano incidenti. 4. Determinare la varianza. 5. Considerando ora 10 aeromobili, determinare la probabilita che per almeno due di essi non vengano registrati incidenti. Problema 5 Consideriamo un soggetto che evidenzia una probabilita di essere negativo ad un test per il virus XY pari a 0.6.
1. Scrivere la distribuzione di probabilita corrispondente. 2. Considerate ora dieci soggetti (tra loro indipendenti e identicamente distribuiti) e in particolare la nuova variabile aleatoria Z = 10 i=1 X i ; che distribuzione di probabilita ha Z? Determinare la media e la varianza di Z. 3. Calcolare la probabilita che almeno 3 soggetti risultino positivi al test per il virus. 4. Calcolare la probabilita che due soggetti risultino negativi al test per il virus. 5. Come cambierebbe il punto 2 del presente esercizio, considerando 5 studenti ognuno dei quali presenta una probabilita di essere positivi al test pari a 0.4? Problema 6 Sia X una variabile aleatoria Normale con media e varianza incognite. 1. Proporre uno stimatore non distorto per la media e per la varianza. 2. Sulla base di un campione casuale estratto da X risulta che 20 i=1 x i = 100. Calcolare la stima della media. 3. Proporre un intervallo di confidenza al 95% per la media della popolazione, lasciando indicati i termini non noti. Calcolarne la lunghezza. 4. Se la varianza fosse nota, come cambierebbe il punto precedente? Problema 7 Sia X N(3, 4) e Z N(7, 9). Stabilire la distribuzione di probabilita di Q = X + Z e di C = Z X Calcolarne media e varianza. Problema 8 L amministrazione di un grande ospedale analizza il periodo di degenza (in giorni) dei propri ricoverati. La degenza in giorni di un campione di 14 pazienti riportata di seguito: 7 2 6 7 8 8 3 6 5 4 4 2 3 7
1. Trovate l intervallo di confidenza al 95% per la degenza, assumendo che la degenza sia distribuita normalmente; 2. supponendo che la variabile X, che descrive il periodo di degenza dei pazienti ricoverati, sia distribuita normalmente con media µ = 5.5 e varianza σ 2 = 3 calcolare P (2 X 5); 3. determinare la distribuzione e i relativi parametri della media campionaria X 14 sulla base dei dati del punto precedente. Problema 9 Considerate una variabile aleatoria Poisson di parametro λ. 1. Proporre uno stimatore non distorto per λ; 2. Che distribuzione ha lo stimatore proposto? 3. Sapendo ora che 10 i=1 x i = 120, come cambierebbero i risultati al punto precedente? 4. Immaginate ora di fare lo stesso esercizio ipotizzando come partenza una distribuzione normale. Come cambierebbe la soluzione? Problema 10 Sia X 1,..., X n un campione casuale di ampiezza n, X i P o(λ), λ incognito. 1. Proporre uno stimatore G non distorto per λ. 2. Che distribuzione ha lo stimatore proposto? Calcolarne media e varianza. 3. Sia T = X 1+X 2 +...+X n n uno stimatore alternativo di λ. Preferireste G o T? Motivare la risposta. 4. Proporre uno stimatore per h(λ) = 3λ + 5. Motivare la risposta.
Problema 11 Sia x 1,..., x 2 5 la realizzazione di un campione casuale estratto da una popolazione normale con media µ incognita e varianza σ 2 = 16. Si supponga inoltre che 25 i=1 x i = 200. 1. Proporre uno stimatore non distorto per µ. Successivamente indicare la stima di µ. 2. Specificare un intervallo di confidenza per µ ad un livello di confidenza 1 α = 0.99. 3. Cosa cambierebbe alla lunghezza dell intervallo ottenuto al punto 2, diminuendo il livello di confidenza? 4. Determinare la stima di massima verosimiglianza di h(µ) = 2e µ. Problema 12 Sia X 1,..., X n un campione casuale estratto da una popolazione X distribuita secondo una legge esponenziale negativa di parametro λ incognito. 1. Si proponga uno stimatore non distorto di 1. λ 2. Si valuti l errore quadratico medio dello stimatore proposto al punto 1. 3. Si dimostri che lo stimatore proposto al punto 1 risulta essere consistente in senso forte. 4. Calcolare l errore quadratico medio dello stimatore proposto al punto 1. Problema 13 Supponiamo che (X 1, X 2 ) sia un campione casuale di osservazioni da una popolazione con media µ e varianza σ 2. Si considerino i seguenti stimatori per µ: X = 1X 2 1 + 1X 2 2, Y = 1X 4 1 + 3X 4 2 e Z = 1X 3 1 + 2X 3 2. 1. Dimostrare che tutti e tre gli stimatori sono non distorti per µ.
2. Quale risulta lo stimatore efficiente? 3. Considerare ora T = 2X 1 + X 2. T risulta distorto per µ? In caso affermativo calcolarne la distorsione. 4. Proporre uno stimatore non distorto per la media µ. Problema 14 Una clinica propone un programma di dimagrimento. Analizzando i dati di un campione casuale di 10 suoi pazienti si sono registrate, dopo un anno di trattamento, le seguenti diminuzioni (in Kg): 18, 25, 6, 11, 15, 20, 16, 19, 12, 17. 1. Trovare un intervallo di confidenza per la media della popolazione al livello 1 α = 0.99. 2. Senza svolgere calcoli, spiegate se un intervallo di confidenza al livello 1 α = 0.90 per la media della popolazione dovrebbe essere in termini di ampiezza minore o maggiore rispetto a quello proposto al punto 1. 3. Determinare la lunghezza dell intervallo proposto al punto 1. Cosa succede se l ampiezza campionaria aumenta? 4. Considerando la lunghezza di un intervallo di confidenza, fissata l ampiezza campionaria, cosa succede se la media del campione aumenta? E se diminuisce? Problema 15 Considerate una popolazione composta da 40 persone. La distribuzione che meglio descrive il dosaggio di emoglobina nel sangue risulta una normale con media µ incognita e varianza σ 2 = 9. 1. Proporre uno stimatore non distorto per la media.
2. Calcolare la distribuzione dello stimatore proposto al punto 1, sapendo che 40 i=1 x i = 500. 3. Calcolare un intervallo di confidenza per la media, considerando un livello di confidenza pari a 95%. 4. Sulla base dei risultati ottenuti al punto 3, volendo verificare la seguente ipotesi, H 0 : µ = 14 verso H 1 : µ 14, accettate o rifiutate H 0?