Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città di Milano e su un campione casuale di 12 monolocali nella città di Roma, è emerso che l affitto medio mensile è pari a 750 euro a Milano e 650 euro a Roma. Le relative varianze campionarie sono a Milano e a Roma. Assumendo che le popolazioni generatrici siano normali e che abbiano uguale varianza, a) verificare, ad un livello di significatività del 1%, l ipotesi che l affitto medio di un monolocale sia maggiore a Milano rispetto a Roma; b) calcolare l intervallo di confidenza al 95% per l affitto medio di un monolocale a Milano. a) verificare, ad un livello di significatività del 1%, l ipotesi che l affitto medio di un monolocale sia maggiore a Milano rispetto a Roma e indicare il livello di significatività osservato del test (p-value); T n1+n2-2,1- /2 = t 24,0.99 =2.492 Zona di rifiuto R={t: t>2.492}. Siccome 3.537>2.492 il test è significativo e si rifiuta l ipotesi nulla. b) calcolare l intervallo di confidenza al 95% per l affitto medio di un monolocale a Milano 1- =0.95; =0.05; /2=0.025; 1- /2=0.975; t n-1,1- /2 =t 13,0.975 =2.160 1
Esercizio 2 In un indagine effettuata tramite l associazione industriali, si chiede ad un campione casuale di aziende se esse esportano all estero i loro prodotti. Su un campione di 125 aziende, 45 rispondono di lavorare col mercato estero. a) Stimare la proporzione, p, di aziende che esportano all estero, fornendo sia una stima puntuale che una stima intervallare con livello di confidenza del 98%; b) Ad un livello di significatività dell 1%, si verifichi l ipotesi che la percentuale di aziende che esporta all estero sia uguale al 30% contro l ipotesi alternativa che sia maggiore e indicare inoltre il livello di significatività osservato del test (p-value) a) Stimare la proporzione, p, di aziende che esportano all estero, fornendo sia una stima puntuale che una stima intervallare con livello di confidenza del 98%; 1- =0.98; =0.02; /2=0.01; 1- /2=0.99; z 1- /2 =z 0.99 =2.32 b) Ad un livello di significatività dell 1%, si verifichi l ipotesi che la percentuale di aziende che esporta all estero sia uguale al 30% contro l ipotesi alternativa che sia maggiore e indicare inoltre il livello di significatività osservato del test (p-value) z 1- =z 0.99 =2.32 Zona di rifiuto R={z: z>2.32}. Siccome 1.464<2.32 il test non è significativo e non si rifiuta l ipotesi nulla. Livello di significatività osservato 2
Esercizio 3 Siano X ed Y due variabili casuali che rappresentano le vendite di due prodotti alimentari e si assuma che i mercati inerenti i due prodotti siano indipendenti. Indichiamo con e la media e la varianza di X e con e la media e la varianza di Y. Si vuole stimare la differenza tra le vendite medie dei due prodotti,, per cui si propone lo stimatore, dove e sono gli stimatori media campionaria. a) Sapendo che le due popolazioni sono normali, indicare la distribuzione dello stimatore. b) Descrivere le proprietà dello stimatore T, indicandone la distorsione e l Errore Quadratico Medio (MSE). c) Dati due campioni la cui numerosità campionaria è e e in cui si ha e 45, calcolare la stima di. d) Assumendo che le due popolazioni generatrici abbiano uguale varianza, e sapendo che e che, calcolare la varianza dello stimatore differenza media. a) Sapendo che le due popolazioni sono normali, indicare la distribuzione dello stimatore. b) Descrivere le proprietà dello stimatore T, indicandone la distorsione e l Errore Quadratico Medio (MSE). Lo stimatore è corretto e consistente ed è lo stimatore più efficiente nella classe degli stimatori corretti c) Dati due campioni la cui numerosità campionaria è e e in cui si ha e 45, calcolare la stima di. d) Assumendo che le due popolazioni generatrici abbiano uguale varianza, e sapendo che e che, calcolare la varianza dello stimatore differenza media. 3
Esercizio 4 Per migliorare il servizio di informazione sugli aeroporti ed orari delle linee aeree, il competente organismo di controllo statunitense ha richiesto il potenziamento delle attività espletate dai call center. In occasione di una serie di controllo effettuati sugli aeroporti internazionali si è rilevato che, in media, i centralini ricevono una chiamata ogni 30 secondi. Calcolare la probabilità che: a) in un minuto si ricevano zero chiamate; b) in un minuto si ricevano 2 o più chiamate; c) in cinque minuti si ricevano esattamente 8 chiamate. a) in un minuto si ricevano zero chiamate; X~Po(2) b) in un minuto si ricevano 2 o più chiamate; c) in cinque minuti si ricevano esattamente 8 chiamate. X~Po(10) Esercizio 5 È stato effettuato uno studio distinto per ripartizione geografica e per classi di costo per minuto della pubblicità in TV. In un campione casuale di 554 emittenti è stata rilevata la seguente distribuzione doppia. Classi di costo per pubblicità televisiva (Y) Ripartizione Territoriale (X) 60 --75 75 --110 110 --133 133 --145 totale Nord-Ovest 20 34 43 54 151 Nord-Est 33 37 39 46 155 Centro 30 32 31 24 117 Sud 45 44 23 20 132 totale 128 147 136 144 555 Se si estrae a caso un emittente televisiva, qual è la probabilità: a) che abbia la sede nella regione del Nord; b) che abbia la sede in una regione del Nord e un costo compreso fra 133 e 145; c) che sia del Nord-Est posto che abbia un costo pubblicitario compreso fra 110 e 133; d) che non sia del Nord-Est e che non abbia un costo pubblicitario inferiore a 75 Euro; e) che non sia del Nord-Est o non abbia un costo pubblicitario inferiore a 75 Euro; Tabella delle frequenze relative sul totale Classi di costo per pubblicità televisiva (Y) Ripartizione Territoriale (X) 60 --75 75 --110 110 --133 133 --145 totale Nord-Ovest 0.036 0.061 0.077 0.097 0.272 Nord-Est 0.059 0.067 0.070 0.083 0.279 Centro 0.054 0.058 0.056 0.043 0.211 Sud 0.081 0.079 0.041 0.036 0.238 totale 0.231 0.265 0.245 0.259 1 a) Probabilità che abbia la sede nella regione del Nord; P(NO NE)=0.272+0.279=0.551; b) Probabilità che abbia la sede in una regione del Nord e un costo compreso fra 133 e 145; P[(NO NE) 133-145]= P[(NO 133-145) (NE 133-145)]= P(NO 133-145) +P (NE 133-145)=0.097+0.083=0.180 4
c) Probabilità che sia del Nord-Est posto che abbia un costo pubblicitario compreso fra 110 e 133 P(NE 110-133)=P(NE 110-133 )/P(110-133)=0.070/0.245 =0.286 d) Probabilità che non sia del Nord-Est e che non abbia un costo pubblicitario inferiore a 75 Euro; P[(NO 75-110) (NO 110-133) (NO 133-145) (C 75-110) (C 110-133) (C 133-145) (S 75-110) (S 110-133) (S 133-145)]= 0.061 +0.077+0.097+0.058+0.056+0.043+0.079+0.041+0.036= =0.549 e) Probabilità non sia del Nord-Est o non abbia un costo pubblicitario inferiore a 75 Euro; 5
Soluzioni Esercizi dell esame totale non in comune con l esame parziale 18/06/2014 (Ippoliti-Fontanella-Valentini) Esercizio 1 È stato effettuato uno studio distinto per ripartizione geografica e per classi di costo per minuto della pubblicità in TV. In un campione casuale di 554 emittenti è stata rilevata la seguente distribuzione doppia. Classi di costo per pubblicità televisiva (Y) Ripartizione Territoriale (X) 60 --75 75 --110 110 --133 133 --145 totale Nord-Ovest 20 34 43 54 Nord-Est 33 37 39 46 Centro 30 32 31 24 Sud 45 44 23 20 totale a) Si costruiscano le distribuzioni marginali rispetto alla ripartizione territoriale delle emittenti (X) e delle classi di costo per pubblicità televisiva (Y) e se ne faccia la rappresentazione grafica opportuna. b) Si calcoli la moda per la distribuzione della ripartizione territoriale delle emittenti per un costo pubblicitario 110 -- 133. c) Si calcoli la mediana per il costo pubblicitario riferito alla regione del Nord-Est. d) Confrontare la variabilità delle distribuzioni condizionate dei costi pubblicitari rilevati nelle regioni del Nord- Ovest e del Sud utilizzando il coefficiente di variazione a) Si costruiscano le distribuzioni marginali rispetto alla ripartizione territoriale delle emittenti (X) e delle classi di costo per pubblicità televisiva (Y) e se ne faccia la rappresentazione grafica opportuna Distribuzione marginale di Y Giudizio (X) ni di hi 60 --75 128 15 8.53 75 --110 147 35 4.20 110 --133 136 23 5.91 133 --145 144 12 12.00 Totale 555 Distribuzione marginale di X Ripartizione Territoriale Totale (X) Nord-Ovest 151 Nord-Est 155 Centro 117 Sud 132 totale 555 180 160 140 120 100 80 60 40 20 0 Nord-Ovest Nord-Est Centro Sud 6
b) Si calcoli la moda per la distribuzione della ripartizione territoriale delle emittenti per un costo pubblicitario 110 -- 133 Ripartizione Territoriale (X) Frequenze per Y=110-133 Nord-Ovest 43 Nord-Est 39 Centro 31 Sud 23 totale 136 Moda: Nord-ovest c) Si calcoli la mediana per il costo pubblicitario riferito alla regione del Nord-Est Giudizio (X) ni Ni 60 --75 33 33 75 --110 37 70 110 --133 39 109 133 --145 46 155 Totale 155 (N+1)/2=156/2=78 Classe mediana: 110 --133 Il valore della mediana è dato da d) Confrontare la variabilità delle distribuzioni condizionate dei costi pubblicitari rilevati nelle regioni del Nord- Ovest e del Sud utilizzando il coefficiente di variazione Nord-Ovest Ore n i x c x c *n i x c -media (x c -media) 2 n i 60 --75 20 67.5 1350-46.58 43393.93 75 --110 34 92.5 3145-21.58 15833.68 110 --133 43 121.5 5224.5 7.42 2367.43 133 --145 54 139 7506 24.92 33534.35 Totale 151 17225.5 95129.38 media 114.08 varianza 630.00 Sud Ore n i x c x c *n i x c -media (x c -media) 2 n i 60 --75 45 67.5 3037.5-28.58 36756.74 75 --110 44 92.5 4070-3.58 563.92 110 --133 23 121.5 2794.5 25.42 14862.06 133 --145 20 139 2780 42.92 36842.53 Totale 132 12682 89025.24 media 96.08 varianza 674.43 7
Esercizio 2. Nella seguente tabella sono riportati i valori di potenza (in CV) e consumo su percorso misto (in km/l) rilevati su 7 berline di classe media: Potenza (X) 113 103 122 134 148 160 171 Consumo (Y) 21.8 22.1 19.9 22.2 16.8 18.2 15.4 a) Si stimi la retta di regressione interpretando con chiarezza il significato del coefficiente di regressione lineare (si utilizzi un approssimazione a due cifre decimali per i calcoli); b) Si disegni il grafico riportante i punti osservati, nonché la retta di regressione; c) Il modello lineare può essere considerato valido per rappresentare i dati? Si risponda calcolando un opportuno indice di adattamento interpretandone il significato; d) In base al modello stimato al punto a), quale sarebbe il consumo atteso di un automobile con 130 CV di potenza? X Y x- x y- y (x- x )(y- y ) (x- x ) 2 (y- y ) 2 113 21.8-22.86 2.31-52.81 522.58 5.34 103 22.1-32.86 2.61-85.76 1079.78 6.81 122 19.9-13.86 0.41-5.68 192.10 0.17 134 22.2-1.86 2.71-5.04 3.46 7.34 148 16.8 12.14-2.69-32.66 147.38 7.24 160 18.2 24.14-1.29-31.14 582.74 1.66 171 15.4 35.14-4.09-143.72 1234.82 16.73 Totale 951 136.4-356.81 3762.86 45.29 media 135.86 19.49 a) Si determini la retta di regressione lineare y * i=a+b Y X x i, interpretando con chiarezza il significato del coefficiente di regressione ottenuto b) Si disegni il grafico riportante i punti osservati, nonché la retta di regressione; 25 20 15 10 5 y = -0,0948x + 32,368 R² = 0,7471 0 0 50 100 150 200 c) Il modello lineare può essere considerato valido per rappresentare i dati? Si risponda calcolando un opportuno indice di adattamento interpretandone il significato; d) In base al modello stimato al punto a), quale sarebbe il consumo atteso di un automobile con 130 CV di potenza? 8