Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)



Documenti analoghi
1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Temi di Esame a.a Statistica - CLEF

ESAME DI STATISTICA Nome: Cognome: Matricola:

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Esercizi di riepilogo Statistica III canale, anno 2008

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

LEZIONE n. 5 (a cura di Antonio Di Marco)

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Istituzioni di Statistica e Statistica Economica

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010


CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Elementi di Psicometria con Laboratorio di SPSS 1

Lineamenti di econometria 2

INDICE PREFAZIONE VII

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

Metodi statistici per le ricerche di mercato

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

STATISTICA IX lezione

STATISTICA (A-K) a.a Prof.ssa Mary Fraire Test di STATISTICA DESCRITTIVA Esonero del 2007

Capitolo 12 La regressione lineare semplice

Statistiche campionarie

Statistica. Lezione 6

Analisi di dati di frequenza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Esercitazione n.2 Inferenza su medie

Inferenza statistica. Statistica medica 1

Prova di autovalutazione Prof. Roberta Siciliano

STATISTICA (I MODULO INFERENZA STATISTICA) Esercitazione I 27/4/2007

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE SIMULAZIONE della PROVA SCRITTA di STATISTICA 23/03/2011

La regressione lineare multipla

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)

Concetto di potenza statistica

E naturale chiedersi alcune cose sulla media campionaria x n

Soluzioni Esercizi elementari

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Capitolo 11 Test chi-quadro

Dall'analisi dei prospetti informativi diffusi dalla Borsa di Paperopoli Gastone ricava le seguenti informazioni sul rendimento dei tre titoli:

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Combustibili ed energia. Arredamenti. Servizi san. e. spese per la. salute. eec.

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Il confronto fra proporzioni

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

Metodi di previsione

Esercitazioni del corso di Statistica Prof. Mortera a.a. 2010/2011. Esercizi di stima puntuale, intervalli di confidenza e test T 2 = 1 2 X

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

1. Distribuzioni campionarie

Tabella per l'analisi dei risultati

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

3. Confronto tra medie di due campioni indipendenti o appaiati

La distribuzione Normale. La distribuzione Normale

Facoltà di ECONOMIA Corso di Statistica a.a. 2005/2006 Esame del 27/09/2006 Statistica descrittiva

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

IL TEST CHI QUADRATO χ 2

VERIFICA DELLE IPOTESI

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

Esercitazioni di Statistica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Corso di Psicometria Progredito

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazione n.4 Inferenza su varianza

Metodi statistici per le ricerche di mercato

Statistica descrittiva

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Facoltà di Psicologia Università di Padova Anno Accademico

Politecnico di Milano - Scuola di Ingegneria Industriale. I Prova in Itinere di Statistica per Ingegneria Energetica 9 maggio 2013

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Indici di dispersione

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

obbligatorio - n. iscrizione sulla lista se non ve lo ricordate siete fritti; o no?

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

Verifica di ipotesi

Test statistici di verifica di ipotesi

Relazioni tra variabili

MATEMATICA 5 PERIODI

Anteprima Finale Categoria Corsi di Statistica

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

ESERCIZI DI RIEPILOGO 2. 7 jj(addi

Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca PROGRAMMAZIONE DISCIPLINARE PER U. di A.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA INFERENZIALE

STATISTICA DESCRITTIVA UNIVARIATA

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Il campionamento. Ulteriori vantaggi: economicità (costi e tempi limitati)

SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Transcript:

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini) Esercizio 1 In uno studio sugli affitti mensili, condotto su un campione casuale di 14 monolocali nella città nella città di Milano e su un campione casuale di 12 monolocali nella città di Roma, è emerso che l affitto medio mensile è pari a 750 euro a Milano e 650 euro a Roma. Le relative varianze campionarie sono a Milano e a Roma. Assumendo che le popolazioni generatrici siano normali e che abbiano uguale varianza, a) verificare, ad un livello di significatività del 1%, l ipotesi che l affitto medio di un monolocale sia maggiore a Milano rispetto a Roma; b) calcolare l intervallo di confidenza al 95% per l affitto medio di un monolocale a Milano. a) verificare, ad un livello di significatività del 1%, l ipotesi che l affitto medio di un monolocale sia maggiore a Milano rispetto a Roma e indicare il livello di significatività osservato del test (p-value); T n1+n2-2,1- /2 = t 24,0.99 =2.492 Zona di rifiuto R={t: t>2.492}. Siccome 3.537>2.492 il test è significativo e si rifiuta l ipotesi nulla. b) calcolare l intervallo di confidenza al 95% per l affitto medio di un monolocale a Milano 1- =0.95; =0.05; /2=0.025; 1- /2=0.975; t n-1,1- /2 =t 13,0.975 =2.160 1

Esercizio 2 In un indagine effettuata tramite l associazione industriali, si chiede ad un campione casuale di aziende se esse esportano all estero i loro prodotti. Su un campione di 125 aziende, 45 rispondono di lavorare col mercato estero. a) Stimare la proporzione, p, di aziende che esportano all estero, fornendo sia una stima puntuale che una stima intervallare con livello di confidenza del 98%; b) Ad un livello di significatività dell 1%, si verifichi l ipotesi che la percentuale di aziende che esporta all estero sia uguale al 30% contro l ipotesi alternativa che sia maggiore e indicare inoltre il livello di significatività osservato del test (p-value) a) Stimare la proporzione, p, di aziende che esportano all estero, fornendo sia una stima puntuale che una stima intervallare con livello di confidenza del 98%; 1- =0.98; =0.02; /2=0.01; 1- /2=0.99; z 1- /2 =z 0.99 =2.32 b) Ad un livello di significatività dell 1%, si verifichi l ipotesi che la percentuale di aziende che esporta all estero sia uguale al 30% contro l ipotesi alternativa che sia maggiore e indicare inoltre il livello di significatività osservato del test (p-value) z 1- =z 0.99 =2.32 Zona di rifiuto R={z: z>2.32}. Siccome 1.464<2.32 il test non è significativo e non si rifiuta l ipotesi nulla. Livello di significatività osservato 2

Esercizio 3 Siano X ed Y due variabili casuali che rappresentano le vendite di due prodotti alimentari e si assuma che i mercati inerenti i due prodotti siano indipendenti. Indichiamo con e la media e la varianza di X e con e la media e la varianza di Y. Si vuole stimare la differenza tra le vendite medie dei due prodotti,, per cui si propone lo stimatore, dove e sono gli stimatori media campionaria. a) Sapendo che le due popolazioni sono normali, indicare la distribuzione dello stimatore. b) Descrivere le proprietà dello stimatore T, indicandone la distorsione e l Errore Quadratico Medio (MSE). c) Dati due campioni la cui numerosità campionaria è e e in cui si ha e 45, calcolare la stima di. d) Assumendo che le due popolazioni generatrici abbiano uguale varianza, e sapendo che e che, calcolare la varianza dello stimatore differenza media. a) Sapendo che le due popolazioni sono normali, indicare la distribuzione dello stimatore. b) Descrivere le proprietà dello stimatore T, indicandone la distorsione e l Errore Quadratico Medio (MSE). Lo stimatore è corretto e consistente ed è lo stimatore più efficiente nella classe degli stimatori corretti c) Dati due campioni la cui numerosità campionaria è e e in cui si ha e 45, calcolare la stima di. d) Assumendo che le due popolazioni generatrici abbiano uguale varianza, e sapendo che e che, calcolare la varianza dello stimatore differenza media. 3

Esercizio 4 Per migliorare il servizio di informazione sugli aeroporti ed orari delle linee aeree, il competente organismo di controllo statunitense ha richiesto il potenziamento delle attività espletate dai call center. In occasione di una serie di controllo effettuati sugli aeroporti internazionali si è rilevato che, in media, i centralini ricevono una chiamata ogni 30 secondi. Calcolare la probabilità che: a) in un minuto si ricevano zero chiamate; b) in un minuto si ricevano 2 o più chiamate; c) in cinque minuti si ricevano esattamente 8 chiamate. a) in un minuto si ricevano zero chiamate; X~Po(2) b) in un minuto si ricevano 2 o più chiamate; c) in cinque minuti si ricevano esattamente 8 chiamate. X~Po(10) Esercizio 5 È stato effettuato uno studio distinto per ripartizione geografica e per classi di costo per minuto della pubblicità in TV. In un campione casuale di 554 emittenti è stata rilevata la seguente distribuzione doppia. Classi di costo per pubblicità televisiva (Y) Ripartizione Territoriale (X) 60 --75 75 --110 110 --133 133 --145 totale Nord-Ovest 20 34 43 54 151 Nord-Est 33 37 39 46 155 Centro 30 32 31 24 117 Sud 45 44 23 20 132 totale 128 147 136 144 555 Se si estrae a caso un emittente televisiva, qual è la probabilità: a) che abbia la sede nella regione del Nord; b) che abbia la sede in una regione del Nord e un costo compreso fra 133 e 145; c) che sia del Nord-Est posto che abbia un costo pubblicitario compreso fra 110 e 133; d) che non sia del Nord-Est e che non abbia un costo pubblicitario inferiore a 75 Euro; e) che non sia del Nord-Est o non abbia un costo pubblicitario inferiore a 75 Euro; Tabella delle frequenze relative sul totale Classi di costo per pubblicità televisiva (Y) Ripartizione Territoriale (X) 60 --75 75 --110 110 --133 133 --145 totale Nord-Ovest 0.036 0.061 0.077 0.097 0.272 Nord-Est 0.059 0.067 0.070 0.083 0.279 Centro 0.054 0.058 0.056 0.043 0.211 Sud 0.081 0.079 0.041 0.036 0.238 totale 0.231 0.265 0.245 0.259 1 a) Probabilità che abbia la sede nella regione del Nord; P(NO NE)=0.272+0.279=0.551; b) Probabilità che abbia la sede in una regione del Nord e un costo compreso fra 133 e 145; P[(NO NE) 133-145]= P[(NO 133-145) (NE 133-145)]= P(NO 133-145) +P (NE 133-145)=0.097+0.083=0.180 4

c) Probabilità che sia del Nord-Est posto che abbia un costo pubblicitario compreso fra 110 e 133 P(NE 110-133)=P(NE 110-133 )/P(110-133)=0.070/0.245 =0.286 d) Probabilità che non sia del Nord-Est e che non abbia un costo pubblicitario inferiore a 75 Euro; P[(NO 75-110) (NO 110-133) (NO 133-145) (C 75-110) (C 110-133) (C 133-145) (S 75-110) (S 110-133) (S 133-145)]= 0.061 +0.077+0.097+0.058+0.056+0.043+0.079+0.041+0.036= =0.549 e) Probabilità non sia del Nord-Est o non abbia un costo pubblicitario inferiore a 75 Euro; 5

Soluzioni Esercizi dell esame totale non in comune con l esame parziale 18/06/2014 (Ippoliti-Fontanella-Valentini) Esercizio 1 È stato effettuato uno studio distinto per ripartizione geografica e per classi di costo per minuto della pubblicità in TV. In un campione casuale di 554 emittenti è stata rilevata la seguente distribuzione doppia. Classi di costo per pubblicità televisiva (Y) Ripartizione Territoriale (X) 60 --75 75 --110 110 --133 133 --145 totale Nord-Ovest 20 34 43 54 Nord-Est 33 37 39 46 Centro 30 32 31 24 Sud 45 44 23 20 totale a) Si costruiscano le distribuzioni marginali rispetto alla ripartizione territoriale delle emittenti (X) e delle classi di costo per pubblicità televisiva (Y) e se ne faccia la rappresentazione grafica opportuna. b) Si calcoli la moda per la distribuzione della ripartizione territoriale delle emittenti per un costo pubblicitario 110 -- 133. c) Si calcoli la mediana per il costo pubblicitario riferito alla regione del Nord-Est. d) Confrontare la variabilità delle distribuzioni condizionate dei costi pubblicitari rilevati nelle regioni del Nord- Ovest e del Sud utilizzando il coefficiente di variazione a) Si costruiscano le distribuzioni marginali rispetto alla ripartizione territoriale delle emittenti (X) e delle classi di costo per pubblicità televisiva (Y) e se ne faccia la rappresentazione grafica opportuna Distribuzione marginale di Y Giudizio (X) ni di hi 60 --75 128 15 8.53 75 --110 147 35 4.20 110 --133 136 23 5.91 133 --145 144 12 12.00 Totale 555 Distribuzione marginale di X Ripartizione Territoriale Totale (X) Nord-Ovest 151 Nord-Est 155 Centro 117 Sud 132 totale 555 180 160 140 120 100 80 60 40 20 0 Nord-Ovest Nord-Est Centro Sud 6

b) Si calcoli la moda per la distribuzione della ripartizione territoriale delle emittenti per un costo pubblicitario 110 -- 133 Ripartizione Territoriale (X) Frequenze per Y=110-133 Nord-Ovest 43 Nord-Est 39 Centro 31 Sud 23 totale 136 Moda: Nord-ovest c) Si calcoli la mediana per il costo pubblicitario riferito alla regione del Nord-Est Giudizio (X) ni Ni 60 --75 33 33 75 --110 37 70 110 --133 39 109 133 --145 46 155 Totale 155 (N+1)/2=156/2=78 Classe mediana: 110 --133 Il valore della mediana è dato da d) Confrontare la variabilità delle distribuzioni condizionate dei costi pubblicitari rilevati nelle regioni del Nord- Ovest e del Sud utilizzando il coefficiente di variazione Nord-Ovest Ore n i x c x c *n i x c -media (x c -media) 2 n i 60 --75 20 67.5 1350-46.58 43393.93 75 --110 34 92.5 3145-21.58 15833.68 110 --133 43 121.5 5224.5 7.42 2367.43 133 --145 54 139 7506 24.92 33534.35 Totale 151 17225.5 95129.38 media 114.08 varianza 630.00 Sud Ore n i x c x c *n i x c -media (x c -media) 2 n i 60 --75 45 67.5 3037.5-28.58 36756.74 75 --110 44 92.5 4070-3.58 563.92 110 --133 23 121.5 2794.5 25.42 14862.06 133 --145 20 139 2780 42.92 36842.53 Totale 132 12682 89025.24 media 96.08 varianza 674.43 7

Esercizio 2. Nella seguente tabella sono riportati i valori di potenza (in CV) e consumo su percorso misto (in km/l) rilevati su 7 berline di classe media: Potenza (X) 113 103 122 134 148 160 171 Consumo (Y) 21.8 22.1 19.9 22.2 16.8 18.2 15.4 a) Si stimi la retta di regressione interpretando con chiarezza il significato del coefficiente di regressione lineare (si utilizzi un approssimazione a due cifre decimali per i calcoli); b) Si disegni il grafico riportante i punti osservati, nonché la retta di regressione; c) Il modello lineare può essere considerato valido per rappresentare i dati? Si risponda calcolando un opportuno indice di adattamento interpretandone il significato; d) In base al modello stimato al punto a), quale sarebbe il consumo atteso di un automobile con 130 CV di potenza? X Y x- x y- y (x- x )(y- y ) (x- x ) 2 (y- y ) 2 113 21.8-22.86 2.31-52.81 522.58 5.34 103 22.1-32.86 2.61-85.76 1079.78 6.81 122 19.9-13.86 0.41-5.68 192.10 0.17 134 22.2-1.86 2.71-5.04 3.46 7.34 148 16.8 12.14-2.69-32.66 147.38 7.24 160 18.2 24.14-1.29-31.14 582.74 1.66 171 15.4 35.14-4.09-143.72 1234.82 16.73 Totale 951 136.4-356.81 3762.86 45.29 media 135.86 19.49 a) Si determini la retta di regressione lineare y * i=a+b Y X x i, interpretando con chiarezza il significato del coefficiente di regressione ottenuto b) Si disegni il grafico riportante i punti osservati, nonché la retta di regressione; 25 20 15 10 5 y = -0,0948x + 32,368 R² = 0,7471 0 0 50 100 150 200 c) Il modello lineare può essere considerato valido per rappresentare i dati? Si risponda calcolando un opportuno indice di adattamento interpretandone il significato; d) In base al modello stimato al punto a), quale sarebbe il consumo atteso di un automobile con 130 CV di potenza? 8