Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 05/07/2010 Esercizio 1.[6 punti] Data la seguente tabella: Y 1 2 tot X 0-1 70 1-3 50 3-5 30 tot 100 50 150 a) riempirla in modo che risulti χ 2 rel =1; b) rappresentare graficamente la distribuzione marginale di X; c) calcolare la moda di X; d) calcolare la proporzione di unita con modalita di X compresa tra µ σ e µ + σ. Esercizio 2.[6 punti] Un urna contiene 8 palline bianche e 2 palline nere. Dall urna vengono estratte (con ripetizione) 2 palline. Sia X la variabile casuale numero di palline bianche su due estratte. a) Calcolare E(X) e var(x). b) Calcolare la probabilità che X assuma un valore maggiore o uguale a 1. Esercizio 3.[9 punti] Dal Mondo in cifre 2009 (The Economist) si ricava che il numero di nati maschi ogni 100 femmine nel 2007 in Portorico e pari a 92. Durante una indagine campionaria svolta nel 2010 in tale paese, su un campione di 300 nati si e osservato che 142 sono maschi. a) Costruire un intervallo di confidenza al livello 1 α = 0.95 per la proporzione di nati maschi nel 2010. a) Verificare al livello di significativita del 2.5% se la proporzione di nati maschi nel 2010 puo essere assunta uguale a quella del 2007, contro l alternativa unidirezionale piu opportuna. b) Con riferimento al test d ipotesi del punto b), calcolare il livello di significativita osservato. 1
Esercizio 4.[9 punti] Dal Mondo in cifre 2009 (The Economist) si ricava la seguente distribuzione relativa ad alcuni paesi del mondo secondo i caratteri Eta media (X) e PIL pro capite in migliaia di dollari (Y) nel 2005: Paese Austria Danimarca Francia Regno Unito Svezia Svizzera X 40.6 39.5 39.3 39.0 40.1 40.8 Y 36.1 35.7 32.0 33.1 34.2 37.2 a) Stimare i parametri della retta di regressione di Y in funzione di X e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per l intercetta della retta, con livello di confidenza pari al 95%. c) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività dell 1% l ipotesi di indipendenza lineare contro l ipotesi alternativa unilaterale più opportuna. 2
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 06/06/2010 Esercizio 1.[6 punti] Dall Annuario Statistico Italiano si ricava la seguente distribuzione dei consumatori di farmaci per classe di età (in migliaia) per l anno 2005: X 0-15 15-35 35-65 65- totale freq 1482 2773 8941 8460 21656 a) Fare la rappresentazione grafica della distribuzione. b) Calcolare il secondo decile della distribuzione. c) Calcolare la proporzione di consumatori di farmaci con eta compresa tra 18 e 40 anni. [R: D 2 = 35; F (40) F (18) = 0.18] Esercizio 2.[6 punti] Un urna contiene 30 palline rosse e 30 nere; un altra urna contiene 20 palline rosse e 40 nere; una terza urna contiene 10 palline rosse e 50 nere. Si estraggono con reimmissione tre palline da una delle urne scelta a caso. a) Calcolare la probabilita di estrarre tre palline rosse. b) Se si osservano tre palline rosse, quale è la probabilità che queste siano state estratte dalla terza urna? [R: a) 0.056; b) 0.028] Esercizio 3.[9 punti] Data una popolazione Normale di varianza unitaria si vuole sottoporre a verifica l ipotesi H 0 : µ = 3 contro H 1 : µ > 3 attraverso un campione casuale di 25 osservazioni. a) Individuare la regione critica del test per α = 0.01. b) A favore di quale ipotesi si conclude se la media campionaria e risultata pari a 3.7? c) Calcolare la potenza del test per µ = 4. d) Calcolare il livello di significativita osservato. [R: a) rifiuto H 0 se X > 3.47; b) H 1 ; c) 1 β = 0.996; d) pvalue=0] 3
Esercizio 4.[9 punti] Si considerino i seguenti dati relativi al carattere Y = utilizzo dell automobile per andare al lavoro negli anni 1997-2008 (per cento occupati che lavorano fuori casa - dati Istat): t 1997 1999 2001 2003 2005 2007 2008 Y 72,0 72,0 75,0 75,2 76,8 74,4 75,7 a) Stimare i parametri della retta di regressione che esprime Y in funzione del tempo e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per l intercetta della retta, con livello di confidenza pari al 95%. c) Al livello di confidenza del 99% l intervallo calcolato al punto b) sarebbe piu stretto o piu largo? Perche? d) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività del 1% l ipotesi di indipendenza lineare fra le due variabili contro l ipotesi alternativa unilaterale più opportuna. [R: a) ponendo per l anno 1997 t = 0, α = 72, 45, β = 0.34, R 2 = 0.58; b) (70.13;74.77); c) piu largo; d) non rifiuto H 0 ] 4
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 06/06/2010 Esercizio 1.[6 punti] Dall Annuario Statistico Italiano si ricava la seguente distribuzione doppia delle forze di lavoro in cerca di occupazione per sesso e area geografica (in migliaia) per l anno 2008: Maschi Femmine Tot Nord 210 278 488 Centro 136 181 317 Mezzogiorno 475 412 886 Tot 820 872 1692 a) Fare una rappresentazione grafica a torta della distribuzione marginale secondo l area geografica. b) Calcolare un indice di dimensione sensato per la distribuzione del punto a). c) Calcolare la proporzione di maschi che sono in cerca di occupazione nel centro-nord. [R: b) Mo(X)=Mezzogiorno; c) 0.20] Esercizio 2.[6 punti] Una ditta produttrice di computer sa che la durata della scheda video di un loro portatile si distribuisce come una normale con µ = 2 anni e σ = 0.7 anni. Essa sostituisce gratuitamente il portatile all acquirente se la durata della scheda video è inferiore a 1 anno. Calcolare la probabilità che su 5 portatili la ditta ne debba sostituire al massimo uno. [R: Siano D=durata della scheda video e N=numero di portatili da sostituire su 5. Allora: P (D < 1) = 0.08, P (N <= 1) = 0.948] Esercizio 3.[9 punti] Con riferimento alla distribuzione doppia dell esercizio 1, verificare se tra i caratteri sesso e area geografica vi e dipendenza assoluta a) mediante il calcolo di un indice opportuno; b) mediante una procedura di test (con α = 0.01). [R: a) χ 2 = 18.87, χ 2 rel = 0.011; b) rifiuto l ipotesi di indipendenza, con χ2 α,2 = 9.21.] 5
Esercizio 4.[9 punti] Data la seguente distribuzione doppia di alcuni paesi europei secondo i caratteri X = tasso di inflazione e Y = tasso di occupazione per il 2007 (valori percentuali - dati Istat): Austria Belgio Cipro Francia Germania Regno unito X 2,2 1,8 2,2 1,6 2,3 2,3 Y 71,4 62,0 71,0 64,6 69,4 71,5 a) Stimare i parametri della retta di regressione che esprime il tasso di occupazione in funzione del tasso di inflazione e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per il coefficiente angolare della retta, con livello di confidenza pari al 95%. c) Nell ipotesi di normalità della componente accidentale, prevedere (tramite una stima puntuale e un intervallo di previsione) il valore del tasso di occupazione per Malta, il cui tasso di inflazione per il 2007 era pari a 0,7. [R: a) α = 43.60, β = 11.96, R 2 = 0.76; b) (2.49;21.43); c) ŷ = 51.97, (37.41; 66.53)] 6
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 08/09/2010 Esercizio 1.[6 punti] Data la seguente distribuzione doppia secondo i caratteri età (X) e numero di appartamenti di proprietà (Y): Y X 0 1 2 3 4 o piu 0 18 20 1 0 0 18 30 10 9 1 0 30 40 10 20 2 1 40 80 10 30 7 3 a) rappresentare graficamente la distribuzione marginale di X; b) sintetizzare la distribuzione marginale di X con un indice di dimensione e uno di variabilità; c) quale è la proporzione di individui con al più 25 anni? d) quale è la proporzione di maggiorenni che hanno almeno un appartamento di proprietà? Esercizio 2.[6 punti] Siano A e B due eventi tali che P (A) = 0.7 e P (AUB) = 0.8. Si determini P (B) nei seguenti casi: a) A e B sono incompatibili; b) A e B sono indipendenti; c) P (A B) = 0.6. Esercizio 3.[9 punti] Per una popolazione Normale di varianza 9, si vuole fare un test d ipotesi per verificare: H 0 : µ = 3 H 1 : µ = 3.7 Si decide di procedere nel seguente modo: si estrae un campione casuale di numerosità n=9 e se ne calcola la media campionaria. Se la media campionaria risulta maggiore di 3.3 si rifiuta l ipotesi H 0. a) Calcolare α. b) Calcolare 1 β. c) Supponendo di volere 1 β 0.99, quale dovrà essere la numerosità campionaria? 7
Esercizio 4.[9 punti] Dal Mondo in cifre 2009 (The Economist) si ricava la seguente distribuzione relativa ad alcuni paesi del mondo secondo i caratteri Y =Abitanti (in milioni) e X =Superficie (in migliaia di chilometri quadrati) nel 2005: Paese Austria Danimarca Grecia Portogallo Repubblica Ceca Svizzera Y 8.2 5.4 11.1 10.5 10.2 7.3 X 84 43 132 89 79 41 a) Stimare i parametri della retta di regressione di Y in funzione di X e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per l intercetta della retta, con livello di confidenza pari al 95%. c) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività dell 2.5% l ipotesi di indipendenza lineare contro l ipotesi alternativa unilaterale più opportuna. 8
Prova scritta di Statistica, n.o., II canale - 10 CREDITI Dott.ssa Conigliani - 08/09/11 Esercizio 1. [6 punti] Su 500 visitatori di un acquario 250 sono uomini e 250 sono donne. Delle donne, 125 sono laureate, 75 sono diplomate, le restanti hanno altro titolo di studio. Considerando il totale dei visitatori, il numero complessivo di laureati e pari a 275, mentre quelli con altro titolo di studio sono 120. Sulla base di queste informazioni riempire la seguente tabella doppia: Diploma Laurea Altro M F a) con quali indici e possibile sintetizzare la distribuzione marginale dei due caratteri oggetto di studio? Motivare la risposta e calcolare gli indici opportuni. b) Valutare, mediante un indice opportuno, se vi sia dipendenza tra il sesso ed il titolo di studio. [R: Mo(X)=laurea, χ 2 = 24.9, χ 2 rel = 0.05] Esercizio 2. [6 punti] Una variabile casuale discreta (X) ha la seguente funzione di ripartizione: F(0) = 0; F(1) = 0.1; F(2) = 0,3; F(3) = 0,6; F(4) = 0,8; F(5) = 1. Calcolarne il valore atteso e la varianza. [R: E(X)=3.2, Var(X)=1.56] Esercizio 3. [9 punti] I pesi degli alunni di una scuola si distribuiscono normalmente con varianza pari a 49 (kg 2 ). a) Per α = 0, 01 e n = 36 determinare la regione critica del test H 0 : µ = 60 contro H 1 : µ < 60. b) Sia X = 56. A favore di quale ipotesi si conclude? c) Calcolare la potenza del test per µ = 45. d) Calcolare il livello di significativita osservato. [R: a) rifiuto H 0 per X < 57.28; b) H 1 ; c) 1 β = 0.9744; d) pvalue=0] 9
Esercizio 4. [9 punti] Per un campione di 8 famiglie con i seguenti redditi mensili (in euro): 1.020; 1.050; 1.340; 1.510; 1.560; 1.590; 1.710; 1.840 si sono riscontrate, rispettivamente, le seguenti spese alimentari mensili (in euro): 370; 340; 400; 360; 430; 450; 460; 470 a) si stimino i parametri della retta di regressione della spesa alimentare (Y) in funzione del reddito (X), e si determini la bontà di adattamento della relazione stimata; b) sotto l ipotesi di normalita della componente accidentale, si determini l intervallo di confidenza al 99% per il coefficiente di regressione; c) sotto l ipotesi di normalita della componente accidentale, si verifichi l ipotesi di passaggio della retta per l origine. [R: a) α = 206.65, β = 0.14, R 2 = 0.73; b) (0.01;0.27); c) rifiuto H 0.] 10
Prova scritta di Statistica, n.o., II canale - 10 CREDITI Dott.ssa Conigliani - 10/01/11 Esercizio 1. [6 punti] La distribuzione dei matrimoni in Italia nel 1961 secondo l età delle spose è riportata nella tabella seguente: Età delle spose frequenze relative -17 0.009 17-18 0.012 18-20 0.062 20-25 0.445 25-30 0.304 30-35 0.100 35-40 0.035 40-45 0.014 45-50 0.007 50-0.012 a) fare la rappresentazione grafica della distribuzione; b) calcolare la media aritmetica e la mediana della distribuzione; c) calcolare un indice di variabilità e un indice di asimmetria. Esercizio 2. [6 punti] Un urna contiene 5 palline bianche e 10 nere. Si estraggono senza ripetizione due palline. a) Quale la probabilità di estrarre due palline bianche? b) Sapendo che la seconda pallina è bianca, quale è la probabilità che anche la prima sia bianca? Esercizio 3. [9 punti] In uno stabilimento, sulla base di un campione di 25 operai, si è osservato che il tempo richiesto affinchè un operaio compia un certo lavoro è normalmente distribuito con scostamento quadratico medio pari a 12 minuti. a) Quale è l ampiezza dell intervallo di confidenza al 95% per il tempo medio? b) Come cambia l ampiezza del punto a) utilizzando un campione di 100 operai? c) Come cambia l ampiezza del punto a) utilizzando un livello di confidenza al 99%? 11
Esercizio 4. [9 punti] Per un campione di 8 famiglie con i seguenti redditi mensili (in euro): 1.000; 1.500; 2.000; 2.500; 3.000; 3.500; 4.000; 4.500 si sono riscontrate, rispettivamente, le seguenti spese per il vestiario (in euro): 170; 240; 200; 260; 330; 400; 410; 470 a) si stimino i parametri della retta di regressione della spesa per vestiario (Y) in funzione del reddito (X), e si determini la bontà di adattamento della relazione stimata; b) si determini l intervallo di confidenza al 95% per l intercetta e per il coefficiente di regressione della retta. 12
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 11/01/2010 Esercizio 1.[14 punti] Data la seguente distribuzione doppia relativa ad un insieme di grilli secondo il numero di trilli emessi al minuto (carattere Y) e la temperatura del suolo in gradi centigradi al momento dell osservazione (carattere X): Y X 45 73 74 104 105 135 tot 19 23 4 1 0 5 23 29 2 4 0 6 29 35 0 2 2 4 35 39 0 1 6 7 tot 6 8 8 22 a) rappresentare graficamente la distribuzione semplice secondo il carattere temperatura del suolo ; b) sintetizzare la distribuzione semplice secondo il carattere temperatura del suolo con un indice di dimensione, uno di variabilita e uno di asimmetria a scelta; c) con riferimento alla distribuzione doppia si stimino i parametri della retta di regressione della temperatura del suolo (X) in funzione del numero di trilli al minuto (Y), e si determini la bontà di adattamento della relazione stimata; d) si determini inoltre l intervallo di previsione per la temperatura del suolo in corrispondenza di un numero di trilli al minuto pari a 140. Esercizio 2.[8 punti] Una variabile casuale discreta X assume i valori 0, 1, 2, 3, ed ha la seguente funzione di ripartizione: F (0) = 1 3 k; F (1) = 2 3 k; F (2) = k; F (3) = 5 3 k. a) Determinare il valore della costante k; b) calcolare valore atteso e varianza della variabile casuale X. Esercizio 3.[8 punti] Per una popolazione Normale di varianza pari a 1, si vuole sottoporre a test l ipotesi H 0 : µ = 0 contro l ipotesi alternativa H 1 : µ = 0.5. a) Posto α = 0.06, sulla base di una numerosità campionaria n = 20 individuare la regione critica e la potenza del test. b) Supponendo di aver osservato una media campionaria pari a -0.3, per quale ipotesi si conclude? 13
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 17/06/2010 Esercizio 1.[6 punti] Dall Annuario Statistico Italiano di un certo anno si ricava la seguente distribuzione delle aziende agricole per classe di età del conduttore (in decine di migliaia): X 15-25 25-45 45-60 60-65 65-80 totale freq 10 30 95 35 80 250 a) Fare la rappresentazione grafica della distribuzione. b) Calcolare il terzo decile della distribuzione. c) Calcolare la proporzione di aziende il cui conduttore ha eta compresa tra 55 e 75 anni. Esercizio 2.[6 punti] Un urna contiene 3 palline rosse e 3 nere; un altra urna contiene 2 palline rosse e 4 nere; una terza urna contiene 1 pallina rossa e 5 nere. Si estraggono senza reimmissione due palline da una delle urne scelta a caso. a) Calcolare la probabilita di estrarre due palline nere. b) Se si osservano due palline nere, quale è la probabilità che queste siano state estratte dalla prima urna? Esercizio 3.[9 punti] Data una popolazione Normale di varianza unitaria si vuole sottoporre a verifica l ipotesi H 0 : µ = 5 contro H 1 : µ > 5 attraverso un campione casuale di 50 osservazioni. a) Individuare la regione critica del test per α = 0.025. b) A favore di quale ipotesi si conclude se la media campionaria e risultata pari a 5.7? c) Calcolare la potenza del test per µ = 6. d) Calcolare il livello di significativita osservato. Esercizio 4.[9 punti] Si considerino i seguenti dati relativi al tasso di disoccupazione (X) e al tasso di inflazione dei consumi privati (Y) in Italia in 7 anni consecutivi: X 8.2 9.1 10.1 10.8 11.4 12.1 12.2 Y 6.5 5.9 5.4 4.6 4.7 4.5 4.2 a) Stimare i parametri della retta di regressione del tasso di inflazione dei consumi privati in funzione del tasso di disoccupazione e determinare la bontà di adattamento della relazione stimata. b) Determinare la varianza di regressione e la varianza residua. c) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività del 1% l ipotesi di indipendenza lineare fra le due variabili contro l ipotesi alternativa unilaterale più opportuna. 14
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 17/06/2010 Esercizio 1.[6 punti] Data la seguente distribuzione doppia secondo i caratteri età (X) e numero di biglietti per il cinema acquistati in un mese (Y): Y X 0 1 2 4 5 e più 0 15 5 0 0 15 25 15 40 35 25 45 10 20 50 45 80 5 25 10 a) rappresentare graficamente la distribuzione marginale di X; b) calcolare i quartili della distribuzione marginale di X; c) quale è la proporzione di minorenni nel collettivo in esame? d) quale è la proporzione di individui al di sotto dei 25 anni che vanno al cinema non più di 4 volte al mese? Esercizio 2.[6 punti] In un piccolo supermercato, aperto 7 giorni su 7, risulta che la vendita settimanale di confezioni di caviale si distribuisce come una variabile casuale di Poisson. E inoltre noto che il numero medio di confezioni di caviale vendute giornalmente e pari a 0.2. a) Calcolare la probabilita che in una settimana si venda al piu una confezione di caviale. b) Calcolare la probabilita che nel mese di novembre non si venda nessuna confezione. Esercizio 3.[9 punti] Per una popolazione Normale di varianza unitaria, si vuole fare un test d ipotesi per verificare: H 0 : µ = 10 H 1 : µ = 12 e si decide di procedere nel seguente modo: si estrae un campione casuale di numerosità n=9 e se ne calcola la media campionaria. Se la media campionaria risulta maggiore di 10.5 si rifiuta l ipotesi H 0. a) Calcolare α. b) Calcolare β. c) Quale deve essere la numerosità campionaria affinche 1 β 0.9? 15
Esercizio 4.[9 punti] Date le seguenti coppie di osservazioni: X 2 2.5 3 3.5 4 Y 3 18 30 45 81 a) Stimare i parametri della retta di regressione di Y su X 2 e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, verificare l ipotesi di passaggio della retta per l origine ad un livello di significatività del 5%. c) Individuare infine l intervallo di previsione per il carattere Y in corrispondenza di X = 5. 16
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 19/07/2011 Esercizio 1.[6 punti] Data la seguente distribuzione degli occupati (anno 2008) per settore di attivita X e area geografica Y (in migliaia di persone): Nord Centro Mezzogiorno Agricoltura 346 115 434 Industria 4157 1293 1504 Servizi 7563 3448 4543 a) Valutare se tra i caratteri X e Y vi e dipendenza assoluta. b) Sintetizzare le due distribuzioni marginali di X e di Y utilizzando gli indici che si ritengono piu opportuni. [R: χ 2 = 448.59, χ 2 rel = 0.00958, Mo(X)=Servizi, Mo(Y)=Nord, Me(Y)=Nord] Esercizio 2.[6 punti] Una variabile casuale discreta X ha la seguente funzione di ripartizione: F(1)=0, F(2)=0.3, F(3)=0.5, F(4)=0.6, F(5)=1. a) Calcolarne il valore atteso e la varianza. b) Calcolare la probabilità che X assuma un valore maggiore di 3. [R: E(X)=3.6; Var(X)=1.64; P (X > 3) = 0.5] Esercizio 3.[9 punti] Data una popolazione Normale di varianza pari a 9 si vuole sottoporre a verifica l ipotesi H 0 : µ = 10 contro H 1 : µ 10 attraverso un campione casuale di 36 osservazioni. a) Individuare la regione critica del test per α = 0.01. b) A favore di quale ipotesi si conclude se la media campionaria e risultata pari a 8.4? c) Calcolare la potenza del test per µ = 11. d) Calcolare il livello di significativita osservato. [R: Rifiuto H 0 per (X < 8.71)U(X > 11.29); H 1 ; 1 β = 0.281; pvalue=0.0014] 17
Esercizio 4.[9 punti] Si considerino i seguenti dati relativi al carattere Y = incidenza percentuale della raccolta differenziata sul totale dei rifiuti urbani negli anni 2000-2008 (dati ISTAT): t 2000 2001 2002 2003 2004 2005 2006 2007 2008 Y 14,4 17,4 19,2 21,5 22,7 24,2 25,8 27,5 30,6 a) Stimare i parametri della retta di regressione che esprime Y in funzione del tempo e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per l intercetta della retta, con livello di confidenza pari al 95%. c) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività del 5% l ipotesi di indipendenza lineare fra le due variabili (considerando come alternativa l ipotesi bilaterale). [R: a) α = 22.59, β = 1.85, R 2 = 0.989; b) (22.14; 23.04); c) rifiuto H 0.] 18
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 19/09/2011 Esercizio 1.[6 punti] Data la seguente distribuzione doppia secondo i caratteri età (X) e numero di biglietti ferroviari acquistati in un mese (Y): Y X 0 1 2 4 5 e più 0 15 5 0 0 15 20 15 5 0 20 35 5 10 20 35 60 5 5 30 a) rappresentare graficamente la distribuzione marginale di X; b) calcolare i quartili della distribuzione marginale di X; c) quale è la proporzione di minorenni nel collettivo in esame? d) quale è la proporzione di individui al di sotto dei 35 anni che acquistano non più di 4 biglietti al mese? [R: b) Q 1 = 20, Me = 30.71, Q 3 = 44.375; c) F(18)=0.17; d) 0.4] Esercizio 2.[6 punti] In un piccolo supermercato, aperto 5 giorni su 7, risulta che la vendita settimanale di bottiglie di spumante si distribuisce come una variabile casuale di Poisson. E inoltre noto che il numero medio di bottiglie di spumante vendute giornalmente e pari a 1.2. a) Calcolare la probabilita che in una settimana si vendano al piu 5 bottiglie di spumante. b) Calcolare la probabilita che in un giorno non si venda nessuna bottiglia di spumante. [R: Sia X il numero di bottiglie vendute in una settimana e Y il numero di bottiglie vendute in un giorno. Allora: a) P (X <= 5) = 0.4457; b) P(Y=0)=0.3] Esercizio 3.[9 punti] Per una popolazione Normale di varianza unitaria, si vuole fare un test d ipotesi per verificare: H 0 : µ = 0 H 1 : µ = 1 e si decide di procedere nel seguente modo: si estrae un campione casuale di numerosità n=16 e se ne calcola la media campionaria. Se la media campionaria risulta maggiore di 0.35 si rifiuta l ipotesi H 0. a) Calcolare α. b) Calcolare β. c) Quale deve essere la numerosità campionaria affinche 1 β 0.999? [R: a) α = 0.0808; b) β = 0.0047; c) n >= 23] 19
Esercizio 4.[9 punti] Date le seguenti coppie di osservazioni: X 2 2.1 2.4 2.5 2.8 Y 3.8 4.5 5.6 6.3 7.8 a) Stimare i parametri della retta di regressione di Y su X 2 e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, verificare l ipotesi di passaggio della retta per l origine ad un livello di significatività del 5%. c) Individuare infine l intervallo di previsione per il carattere Y in corrispondenza di X = 3. [R: a) α = 0.078, β = 1.005, R 2 = 0.98; b) non rifiuto H 0 ; c) (8.027;9.907)] 20
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 20/06/2011 Esercizio 1.[6 punti] Dall Annuario Statistico Italiano si ricava la seguente distribuzione dei consumatori di farmaci per classe di età (in migliaia) per l anno 2008: X 0-15 15-35 35-65 65- totale freq 1487 2873 9825 9377 23562 a) Fare la rappresentazione grafica della distribuzione. b) Calcolare un indice di asimmetria. c) Calcolare la proporzione di consumatori minorenni. [R: b) γ = 0.5; c) F(18)=0.078.] Esercizio 2.[6 punti] Un nuovo modello di computer portatile e appena stato messo sul mercato, e la campagna pubblicitaria sottolinea l elevata durata sia della piastra madre che del disco rigido. Da studi condotti in azienda e noto che se il computer si guasta, ci sono 70 possibilita su 100 che la piastra madre sia da sostituire; nei restanti casi e da sostituire il disco rigido. E noto inoltre che se si guasta la piastra madre, la probabilita che anche il disco rigido risulti danneggiato e 0.2. a) Calcolare la probabilita di sostituire contemporaneamente piastra madre e disco rigido. b) Calcolare la probabilita di sostituire la piastra madre quando il disco rigido e guasto. [R: a) 0.14; b) 0.47] Esercizio 3.[9 punti] Data una popolazione Normale di varianza pari a 9 si vuole sottoporre a verifica l ipotesi H 0 : µ = 0 contro H 1 : µ 0 attraverso un campione casuale di 25 osservazioni. a) Individuare la regione critica del test per α = 0.05. b) A favore di quale ipotesi si conclude se la media campionaria e risultata pari a 0.4? c) Calcolare la potenza del test per µ = 1. d) Calcolare il livello di significativita osservato. [R: a) Rifiuto H 0 per (X < 1.176)U(X > 1.176); b) H 0 ; c) 1 β = 0.3859; d) pvalue=0.5028] 21
Esercizio 4.[9 punti] Si considerino i seguenti dati relativi al carattere Y = interruzioni volontarie di gravidanza (per 1000 donne residenti di 15-49 anni) negli anni 1982-1996 (dati ISTAT): t 1982 1984 1986 1988 1990 1992 1994 1996 Y 16,4 16,2 13,8 12,4 11,5 10,4 9,5 9,4 a) Stimare i parametri della retta di regressione che esprime Y in funzione del tempo e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per l intercetta della retta, con livello di confidenza pari al 90%. c) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività del 5% l ipotesi di indipendenza lineare fra le due variabili contro l ipotesi alternativa unilaterale più opportuna. [R: a) α = 16.33, β = 1.11, R 2 = 0.96; b) (15.7;16.96); c) rifiuto l ipotesi di indipendenza lineare.] 22
Prova d esame di Statistica - II canale - 10 CFU Dott.ssa C. Conigliani 20/06/2011 Esercizio 1.[6 punti] Data la seguente distribuzione doppia relativa che riguarda un collettivo di studenti iscritti al terzo anno secondo i caratteri crediti conseguiti (X) e media dei voti (Y): Y X 18-24 24-28 28-30 0 60 0.07 0.02 0.01 61 120 0.13 0.11 0.11 121 180 0.05 0.20 0.30 a) rappresentare graficamente la distribuzione marginale di Y; b) calcolare i quartili della distribuzione marginale di Y; c) calcolare la proporzione di individui con più di 60 crediti e media superiore a 28. [R: b) Q 1 = 24, Q 2 = 27.03, Q 3 = 28.81; c) 0.41] Esercizio 2.[6 punti] Un urna contiene 15 palline bianche e 15 palline nere. Dall urna vengono estratte (con ripetizione) 4 palline. Sia X la variabile casuale numero di palline bianche su quattro estratte. a) Calcolare E(X) e var(x). b) Calcolare la probabilità che X assuma un valore maggiore o uguale a 2. [R: E(X)=2, Var(X)=1, P (X >= 2) = 0.69.] Esercizio 3.[9 punti] Una societa telefonica dichiara che il 96% dei propri abbonati e soddisfatto del servizio e non intende cambiare gestore. Per verificare tale affermazione una agenzia di protezione dei consumatori estrae un campione casuale di 200 abbonati e chiede loro di dichiarare se sono soddisfatti oppure no; 172 abbonati dichiarano di essere soddisfatti. a) Possiamo considerare vera l affermazione della societa telefonica? b) costruire un intervallo di confidenza al livello del 95% per la proporzione di soddisfatti. [R: a) rifiuto l ipotesi nulla di p = 0.96; b) (0.81;0.91).] 23
Esercizio 4.[9 punti] Data la seguente distribuzione doppia di alcuni paesi europei secondo i caratteri X = tasso di inflazione e Y = tasso di occupazione per il 2007 (valori percentuali - dati Istat): Grecia Slovenia Bulgaria Estonia Lituania Romania X 3,0 3,8 7,6 6,7 5,8 4,9 Y 61,4 67,8 61,7 69,4 64,9 58,8 a) Stimare i parametri della retta di regressione che esprime il tasso di occupazione in funzione del tasso di inflazione e determinare la bontà di adattamento della relazione stimata. b) Nell ipotesi di normalità della componente accidentale, determinare un intervallo di confidenza per il coefficiente angolare della retta, con livello di confidenza pari al 95%. c) Nell ipotesi di normalità della componente accidentale, verificare al livello di significatività del 2.5% l ipotesi di passaggio della retta per l origine, contro l ipotesi alternativa unilaterale più opportuna. [R: a) α = 62.20, β = 0.34, R 2 = 0.02; b) (-2.88;3.56); c) rifiuto l ipotesi di passaggio per l origine.] 24