Classi di spesa Frequenza Sino a >

Documenti analoghi
Il volume: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2006

Statistica A-K (anno 2014) Lucidi sui NI proiettati a lezione non presenti nel libro di testo

Esame di Statistica Seconda Prova Parziale Cognome Nome Matricola

Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)

ESERCIZI CORRELAZIONE

Esercizi riassuntivi di Inferenza

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

Prova scritta del modulo di Statistica I (6 CFU) Cognome Nome Matr. Firma

STATISTICA AZIENDALE Modulo Controllo di Qualità

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

STATISTICA A K (60 ore)

ESERCIZI DI RIEPILOGO 1

Tema d esame del 15/02/12

Prova d esame di Statistica - II canale - 10 CFU

Giorno n. clienti di attesa

Esercitazioni di statistica

FACOLTÀ DI ECONOMIA Prova scritta di Statistica II Perugia, 27 gennaio 2006 COGNOME NOME

STATISTICA A D (72 ore)

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Intervalli di confidenza

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

La regressione lineare multipla

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Esercitazione 8 maggio 2014

Test d Ipotesi Introduzione

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Ringraziamenti dell Editore

STATISTICA ESERCITAZIONE

Matricola: Corso: 1. (4 Punti) Stimare la variazione del reddito quando il prezzo del prodotto finale raddoppia.

Americani Inglesi Firenze Roma Provare l ipotesi che la nazionalità non influisca sulla scelta della meta.

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Statistica. Alfonso Iodice D Enza

Esercitazione del

Test di ipotesi su due campioni

Esercizi di Probabilità e Statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Teoria e tecniche dei test

REGRESSIONE E CORRELAZIONE

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Casa dello Studente. Casa dello Studente

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica Inferenziale

standardizzazione dei punteggi di un test

Esercizi in preparazione all esame di. Laboratorio del corso di Principi di Informatica. Prof.sse M. Anselmo e R. Zizza. a.a.

Statistica Un Esempio

Costruire la tabella delle frequenze percentuali della variabile innovazione (si/no) per classe di addetti e per i tre macrosettori.

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Esercitazioni di Statistica

Esame di Statistica A-Di Prof. M. Romanazzi

Esercitazioni di Statistica

Teoria e tecniche dei test. Concetti di base

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Il campionamento e l inferenza. Il campionamento e l inferenza

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Istituzioni di Statistica e Statistica Economica

Qualche esercizio di riepilogo

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli

Esercitazione 8 del corso di Statistica 2

Un esempio. Ipotesi statistica: supposizione riguardante: un parametro della popolazione. la forma della distribuzione della popolazione

Statistica Compito A

Esercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese

Esercitazione 4 del corso di Statistica (parte 2)

Distribuzioni e inferenza statistica

= , 30 )

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Approssimazione normale alla distribuzione binomiale

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Statistica - Prova scritta - 23 luglio 2015 (A) Le risposte prive di adeguata motivazione non saranno prese in considerazione

ESERCIZI PROBABILITA I

Statistica descrittiva e statistica inferenziale

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche - A.A. 2005/2006 II Prova - 20 dicembre 2005

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

METODO DEI MINIMI QUADRATI

a) Usando i seguenti livelli di significatività, procedere alla verifica di ipotesi, usando come ipotesi alternativa un'ipotesi unidirezionale:

Scheda Corso di STATISTICA (D.M. 270 per 9 CFU) Anno Accademico 2014/2015 (versione in Italiano)

Distribuzione Normale

Distribuzioni di probabilità

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Probabilità e Statistica Prova del 29/07/2016 Traccia E TEORIA Università degli Studi di Verona Laurea in Informatica e Bioinformatica A.A.

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Corso di Laurea in Farmacia, cognomi M-Z Modulo di Matematica, 1 dicembre 2011, TEMA 1. Giustificare adeguatamente le soluzioni dei seguenti esercizi:

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

STATISTICA esercizi svolti sulla CONCENTRAZIONE

Transcript:

I volumi: A. Cerioli M.A. Milioli M. Riani Esercizi di statistica parte I, Uni.nova, Parma, 2009 A. Cerioli M.A. Milioli Esercizi di statistica, II parte, Uni.nova, Parma, 2009 contengono una raccolta di temi d esame adeguati per la preparazione dell esame di Statistica. Di seguito si riportano alcuni ulteriori esercizi per autovalutazione. PARTE I ESERCIZIO 1 Si conosce la seguente matrice dei dati riferita a 10 dipendenti di un azienda ed ai fenomeni X=sesso ed Y=stipendio mensile (in euro): dipendenti X Y A M 1350 B M 1420 C F 1230 D M 2500 E F 1360 F F 1400 G F 800 H F 1330 I M 2400 L F 1350 i) Si calcoli la media dello stipendio e la si commenti. Si dica, motivando la risposta, quale valore assumerebbe la media se i dati fossero espressi in dollari (tasso di cambio = 1,36) ii) Si calcoli la moda dello stipendio e la si commenti. iii) Si calcolino la media troncata al 40% e la mediana dello stipendio e si commentino i risultati ottenuti. iv) Si calcoli il MAD e lo si commenti. v) Si costruisca la corrispondente tabella a doppia entrata, considerando le seguenti classi per il reddito: 800-1300, 1300-1500, 1500-2500. ESERCIZIO 2 Un associazione di consumatori, per valutare la puntualità dei voli in partenza da un importante aeroporto internazionale, ha rilevato il ritardo (in minuti) con cui sono decollati i voli di linea in una determinata settimana. La tabella seguente riporta la corrispondente distribuzione di frequenze. Ritardo (in minuti) dei voli in partenza Frequenze Sino a 5 126 5 15 420 15 30 233 30 60 94 60 120 24 Oltre 120 (in media 185) 3 i) Si calcoli la media aritmetica e la si commenti. ii) Si calcoli la mediana e la si commenti. iii) Si calcoli il novantacinquesimo percentile e lo si commenti.

iv) Motivando adeguatamente la risposta, si dica se i valori degli indici calcolati al punto i) sono uguali a quelli che sarebbero stati ottenuti partendo dalla matrice dei dati originaria (cioè contenente le informazioni sui ritardi dei singoli voli in partenza), anziché dalla distribuzione di frequenze. ESERCIZIO 3 La seguente distribuzione di frequenze riporta l ammontare (in Euro) della spesa effettuata in un determinato mese da un insieme di consumatori. Classi di spesa Frequenza Sino a 40 145 40-70 166 70-180 144 180-200 131 200-1000 112 >1000 22 1) Si calcolino la moda ed il quarto decile. 2) Si illustri l interpretazione di tali indici. 3) Si dica, quali sono le ipotesi sottostanti al calcolo del quarto decile ricavato al punto 1) 4) Si dica senza effettuare i calcoli, quali valori approssimativamente assumerà l ottavo decile. ESERCIZIO 4 Si sono classificati gli appartamenti in affitto di un quartiere in base alla superficie (X, in mq.) e all ammontare del canone d affitto (Y, in euro): X \ Y 400 600 600 1000 1000 1500 50 80 35 15 0 80 120 30 45 5 120 160 5 25 10 160 200 0 5 25 i) Si calcolino le medie parziali di Y e si illustri il significato di una di esse. ii) Si rappresentino in un grafico le medie parziali ottenute al punto precedente e lo si commenti. iii) Si calcoli il terzo decile della superficie per il totale delle abitazioni e lo si commenti. ESERCIZIO 5 Un capitale è stato investito (con capitalizzazione degli interessi via via maturati) alle seguenti condizioni: 4 anni al tasso dell 1,5% annuo 3 anni al tasso del 2% annuo 5 anni al tasso del 3% annuo Si determini il tasso medio dell intero periodo. ESERCIZIO 6 Nella seguente matrice dei dati sono riportate le modalità di pagamento (C=contante, F=carta Fidaty, BC=bancomat o carta di credito), X, e l ammontare della spesa effettuata (in euro), Y, da 15 clienti di un supermercato in una certa giornata:

cliente X Y Cliente X Y 1 C 30 9 BC 42 2 C 15 10 BC 73 3 F 55 11 C 36 4 BC 60 12 C 40 5 BC 35 13 C 38 6 F 51 14 BC 23 7 C 10 15 F 65 8 F 38 i) Si costruisca la corrispondente tabella a doppia entrata, considerando le seguenti classi per l ammontare della spesa: fino a 25, 25-50, 50-80. ii) Si calcolino le medie parziali di Y desumibili dalla matrice dei dati. iii) Si calcolino le medie parziali di Y desumibili dalla tabella a doppia entrata e si dica per quali motivi si ottengono risultati diversi da quelli del punto precedente. Quali risultati sono da considerarsi più attendibili? ESERCIZIO 7 La seguente matrice dei dati riporta, per alcuni gelati, le seguenti variabili: X = contenuto di carboidrati (in grammi) Y = contenuto di proteine (in grammi) Gelato X Y A 38.6 4.6 B 32.2 3.9 C 26.3 3.4 D 18.5 1.5 E 12.2 0.5 F 11.0 1.8 i) Si calcolino gli scostamenti quadratici medi delle due variabili e si fornisca l interpretazione di almeno uno di essi nel problema in esame. ii) Si determini la corrispondente matrice degli scostamenti standardizzati. iii) Si illustri il significato dello scostamento standardizzato ottenuto per il gelato F. iv) Si dica, senza effettuare calcoli ulteriori, qual è l obiettivo di calcolo degli scostamenti standardizzati ed in quali metodologie statistiche essi trovano impiego. ESERCIZIO 8 Con riferimento a 5 quartieri di Parma, si sono rilevati il numero di residenti (X) e la superficie (in kmq) al 31.12.2006, (Y): quartieri X Y Parma centro 18.763 2,5 Oltretorrente 7.914 1,1 Molinetto 17.725 9,5 Cittadella 21.398 23,7 San Lazzaro 10.311 30,4

i) Si determini la densità della popolazione di ciascun quartiere. ii) Si scrivano le espressioni della media aritmetica e dello scostamento quadratico medio della densità media della popolazione per i quartieri considerati. iii) Si calcoli il valore degli indici definiti al punto precedente e se ne illustri il significato. ESERCIZIO 9 E stata rilevata la concentrazione di un gas nocivo nell aria, in mg per metro cubo (X), in alcuni giorni invernali in una certa località: X Inverno 0 4 12 4 11 10 11 26 10 26 50 22 50 80 2 56 i) Si calcoli lo scostamento medio assoluto dalla mediana e lo si commenti. ii) Si calcoli l indice di asimmetria di Gini e si dica quali informazioni fornisce. iii) Si dica, motivando la risposta se, quale valore assumerebbe tale indice se i dati fossero espressi in gr per metro cubo. ESERCIZIO 10 Nella seguente tabella sono riportati, per alcune tipologie di gelato, il peso in gr. (X) ed il contenuto energetico in kcal (Y): gelato Peso Contenuto energetico Gelato nero Perugina 68 314 Maxibon 100 339 Coppa del nonno 70 179 Mottarello 52 172 Fortunello 80 237 i) Si determini la variabile Z = contenuto energetico per 100 gr. di prodotto per ciascun tipo di gelato. ii) Spiegando il significato dei simboli utilizzati, si scrivano le espressioni della media aritmetica e dello scostamento quadratico medio del la variabile Z. iii) Si calcoli il valore degli indici definiti al punto precedente e se ne illustri il significato.

ESERCIZIO 11 La seguente distribuzione di frequenze riporta l ammontare (in euro) della spesa effettuata in una settimana dai titolari della carta fedeltà di un ipermercato. Classi di spesa ( ) Frequenza Sino a 50 381 50 100 482 100 200 264 200 500 58 Oltre 500 15 i) Si calcolino i quartili della distribuzione della spesa e se ne illustri l interpretazione. ii) Si disegni il box plot della distribuzione della spesa. iii) Si illustrino tutte le informazioni traibili dal box plot disegnato al punto precedente. ESERCIZIO 12 Nella seguente tabella è riportata la distribuzione dei dipendenti di una grande azienda in base alla retribuzione lorda mensile: retribuzioni Numero di dipendenti 1000 1200 30 1200 1500 130 1500 2000 150 2000 2500 50 2500 3500 30 3500-5000 20 i) Si calcoli lo scostamento quadratico medio e il MAD delle retribuzioni e si commenti il significato dei risultati ottenuti. ii) Si dica, motivando la risposta, quale trasformazione subirebbero la media, la mediana, lo scostamento quadratico medio e il MAD delle retribuzioni, calcolati ai punti precedenti, se: a) tutte le retribuzioni fossero aumentate di 50 euro, b) tutte le retribuzioni fossero incrementate del 7% c) tutte le retribuzioni fossero incrementate del 2% e, dopo questo aumento, aumentate di 100 euro. iii) Si rappresenti graficamente la suddetta distribuzione e si dica quali informazioni si possono ricavare. iv) Si calcoli l indice di asimmetria di Fisher e lo si commenti ESERCIZIO 13 Gli studenti immatricolati in una Facoltà di Economia nell anno accademico 2006-2007 sono stati classificati in base al voto alla maturità (X) e al numero di esami sostenuti al primo anno: X \ Y 2 3 4 5 6 totale 60 70 40 80 30 150 71 80 60 150 90 300 81 90 20 110 220 350 91-100 0 60 120 180 totale 120 400 460 980

i) Si calcolino le medie parziali di Y e si commenti il significato di una di esse. ii) Si riportino le medie ottenute al punto precedente in un grafico opportuno. iii) Applicando un opportuna proprietà della media aritmetica, si determini il numero medio di esami sostenuti da tutti gli studenti. ESERCIZIO 14 Una macchina è tarata per produrre bulloni di diametro pari a 10 mm. In un lotto di 500 pezzi si sono ottenuti i seguenti risultati: diametro Numero di pezzi 9,7 9,8 60 9,8-9,9 110 9,9 10 160 10 10,1 110 10,1 10,2 60 i) Si calcoli l indice di asimmetria di Pearson e lo si commenti. ii) Si dica, motivando la risposta, se si può ipotizzare che la distribuzione osservata sia normale. iii) Si calcoli l indice di curtosi e lo si commenti. ESERCIZIO 15 Una famiglia effettua abitualmente i propri acquisti in due supermercati differenti. La seguente tabella riporta le variazioni percentuali rispetto all anno precedente del livello medio dei prezzi nei due supermercati: Anno 2001 Variazioni % prezzi supermercato A Variazioni % prezzi supermercato B 2002 +3,3% +5,5% 2003 +2,6% +3,7% 2004 1,9% +2,2% 2005 +5,2% +3,4% i) Si calcolino le serie storiche dei numeri indici a base fissa dei prezzi nei due supermercati, con base 2001 = 100, e si illustri l interpretazione dei numeri indici calcolati nel 2005. ii) Assegnando al supermercato A un peso triplo rispetto a quello del supermercato B, si determini la corrispondente serie storica dei numeri indici composti dei prezzi, con base 2001 = 100, e si illustri l interpretazione del numero indice composto calcolato nel 2005. iii) Si dica qual è l obiettivo del calcolo dei numeri indici composti nel problema in esame e che cosa rappresentano i pesi utilizzati al punto ii) in questo esempio.

ESERCIZIO 16 Nella seguente tabella sono riportate le variazioni percentuali rispetto all anno precedente delle retribuzioni per la figura di responsabile acquisti nel settore della moda e i numeri indici dei prezi al consumo per l intera collettività nazionale (base 1995=100): anni Var.% retribuzioni n. i. prezzi 2000-112,8 2001 + 2,56 115,9 2002 +2,49 118,8 2003 +2,01 122,0 2004 +2,24 124,7 2005 +2,30 127,1 i) Si calcolino i numeri indici a base fissa delle retribuzioni con base 2003 = 100 ii) Si commenti il significato del valore ottenuto per l anno 2000. iii) Si dica in quali anni le retribuzioni sono aumentate più dell inflazione. iv) Sapendo che una retribuzione di 2500 euro nel 2006 è equivalente, in termini di potere d acquisto, ad una retribuzione di 2200 euro del 2000, si determini il livello complessivo di inflazione del periodo. ESERCIZIO 17 Nella tabella che segue sono riportati i numeri indici a base fissa (base 2001=100) dell ammontare dei canoni medi di locazione delle abitazioni nella città di Bologna e le variazioni percentuali rispetto all anno precedente dei prezzi al consumo per le famiglie di operai e impiegati: anni n. i. canoni di locazione n. i. dei prezzi 2001 100-2002 115 +2,34 2003 131 +2,54 2004 147 +2,23 2005 159 +1,86 2006 165 +2,14 i) Si calcolino i numeri indici a base fissa dell ammontare dei canoni di locazione con base 2004=100. ii) Si commenti il valore ottenuto nell anno 2001. iii) Si mostri in quali anni l ammontare dei canoni di locazione è aumentato più dell inflazione. iv) Si calcoli il tasso medio annuo di inflazione nel periodo in esame.

ESERCIZIO 18 La seguente tabella riporta la serie storica del fatturato, in migliaia di euro, di una negozio di ortofrutta e la serie storica dei numeri indici dei prezzi al consumo riferiti ai prodotti ortofrutticoli, con base 2008 = 100. Anno Fatturato N.i. dei prezzi al consumo per i prodotti ortofrutticoli (base 2008=100) 2006 122 96,2 2007 138 98,5 2008 149 100 2009 161 103,4 i) Si determini la corrispondente serie storica del fatturato deflazionato del negozio di ortofrutta ai prezzi del 2006 e si commenti il valore calcolato per l anno 2007. ii) Si calcolino e si commentino in termini comparati il tasso medio annuo di variazione del fatturato a prezzi correnti e quello del fatturato a prezzi costanti. ESERCIZIO 19 La seguente tabella riporta la serie storica, dal 2005 al 2009, della retribuzione (in euro) percepita da un lavoratore dipendente, il signor XY. Anno Retribuzione signor XY ( ) 2005 20.500 2006 20.700 2007 21.200 2008 21.400 2009 21.700 i) Si illustri che cosa significa deflazionare la retribuzione del signor XY e si descrivano sinteticamente i passaggi della corrispondente procedura di calcolo. ii) Disponendo delle variazioni percentuali rispetto all anno precedente dell indice dei prezzi al consumo per le famiglie di operai e di impiegati (indice FOI) determinate dall ISTAT: Anno 2005 Variazioni % rispetto all anno precedente dell indice FOI (fonte: ISTAT) 2006 +2,0% 2007 +1,7% 2008 +3,2% 2009 +0,7% si determini la retribuzione del signor XY ai prezzi costanti del 2005 e si commentino i risultati ottenuti.

ESERCIZIO 20 La seguente matrice dei dati riporta, per un azienda, il numero di dipendenti che hanno usufruito di permessi per motivi di studio (X) e l ammontare del fatturato in milioni di euro (Y), dal 2000 al 2005. Anno N. di dipendenti che hanno usufruito di permessi per motivi di studio (X) Fatturato (Y) 2000 30 59 2001 28 60 2002 32 64 2003 40 68 2004 45 72 2005 46 80 Il coefficiente di correlazione tra le due serie storiche risulta r xy = 0,94 i) Si commenti il valore del coefficiente di correlazione sopra riportato e si dica, motivando la risposta, se nel problema in esame è ragionevole cercare di prevedere Y in funzione di X. ii) Si determinino i numeri indici a base mobile di X e di Y e si calcoli il valore del coefficiente di correlazione tra tali numeri indici. iii) Si dica, motivando la risposta, come cambia il coefficiente di correlazione se a) il fatturato viene espresso in dollari b) i valori del fatturato vengono aumentati di 0,5 milioni di euro. ESERCIZIO 21 La seguente matrice dei dati riporta, per alcuni gelati, le seguenti variabili: X = contenuto di carboidrati (in grammi) Y = contenuto di proteine (in grammi) Gelato X Y A 38.6 4.6 B 32.2 3.9 C 26.3 3.4 D 18.5 1.5 E 12.2 0.5 F 11.0 1.8 i) Si calcoli il coefficiente di correlazione lineare tra contenuto di carboidrati e contenuto di proteine e si interpreti il risultato ottenuto. ii) Si tracci il corrispondente diagramma di dispersione. iii) Si illustrino le informazioni ottenibili dal diagramma di dispersione disegnato al punto precedente. In particolare, si dica quali informazioni aggiuntive esso fornisce nel caso in esame rispetto al coefficiente di correlazione. iv) Si dica, senza effettuare calcoli ulteriori, perché nel problema in esame il calcolo del coefficiente di correlazione risulta preferibile rispetto all adattamento di una retta di regressione.

ESERCIZIO 22 In un insieme di 100 province Italiane sono stati rilevati i tre indicatori riferiti rispettivamente agli indicatori X1=numero di rapimenti per 1000 abitanti, X2=Numero di rapine per 1000 abitanti e X3=Numero di furti auto per 1000 abitanti. La parte triangolare superiore della matrice di covarianza tra le 3 variabili è risultata la seguente. X1 X2 X3 X1 14,88 16,61 1,44 X2 90,89 1,97 X3 0,19 i) Si completino i dati mancanti presenti nella parte triangolare inferiore. ii) Si dica, motivando la risposta, quale variabile tra X2 e X3 è più utile ai fini della previsione di X1. iii) Si calcoli e si interpreti il coefficiente della retta di regressione che si ottiene ponendo X1 come variabili dipendente e la variabile scelta al punto 2. come esplicativa ESERCIZIO 23 La seguente tabella riporta per un comune italiano le variabili (dal 2001 al 2005): X = Numero di autovetture immatricolate per 100 abitanti; Y = Spesa media (in euro) per abitante per spettacoli sportivi e culturali. Anno X Y 2001 5.6 19.3 2002 9.5 22.4 2003 9.7 37.7 2004 10.3 46.9 2005 10.8 46.8 i) Si determini il coefficiente di correlazione lineare tra le due serie storiche e se ne illustri l interpretazione nel caso in esame. ii) Si calcolino la serie dei numeri indici a base mobile di X e la serie dei numeri indici a base mobile di Y. Si interpretino i valori dei numeri indici ottenuti per il 2005. iii) Si determini il coefficiente di correlazione lineare tra le due serie di numeri indici a base mobile e si dica per quali motivi il valore di tale coefficiente differisce rispetto a quello ottenuto al punto i). ESERCIZIO 24 Nella seguente tabella sono riportate le var % rispetto all anno precedente degli stranieri residenti a Parma nel periodo 2002 2007. Anni Var % 2002-2003 +11,53 2004 +21,39

2005 +17,98 2006 +11,09 2007 +10,23 i) Sapendo che al 1/1/07 gli stranieri erano pari a 33950, si ricavi la serie storica degli stranieri residenti a Parma. ii) Sapendo che la funzione interpolante della serie storica ricavata al punto precedente è risultata: ŷ t = 13296 + 3471,8 t si commenti il significato dei parametri. iii) Si calcoli VAR(E) e si determini il valore massimo che potrebbe raggiungere in questo esempio. iv) Si calcoli l indice δ e se ne commenti il significato. ESERCIZIO 25 La tabella che segue si riferisce al fatturato (X) e all ammontare della spesa in Ricerca & Sviluppo (Y) di 6 aziende, espressi in milioni di euro: aziende X Y A 120 2,6 B 115 2,5 C 130 2,8 D 142 3,0 E 115 2,1 F 110 2,2 i) Si calcolino i parametri della retta di regressione avente significato logico. ii) Si commenti il significato dei parametri. iii) Si determini la validità del modello. iv) Si illustri il significato del risultato ottenuto. v) Se l azienda F decidesse di aumentare la spesa in Ricerca & Sviluppo del 10%, quale sarebbe la variazione percentuale prevista per il fatturato? vi) Si commenti l attendibilità della stima effettuata. ESERCIZIO 26 Nella tabella che segue è riportato il numero di utenti FASTWEB (in migliaia) nel periodo 2005-2006: mesi Numero utenti Marzo 2005 542 Giugno 598 Settembre 644 Dicembre 714 Marzo 2006 794 Giugno 874 Settembre 957 Dicembre 1062 i) Si calcolino il tasso di variazione medio mensile e il tasso di variazione medio trimestrale, illustrandone il significato. ii) Sapendo che la funzione interpolante lineare (con t = 1, 2, 3, 8) è risultata la seguente:

ŷ t = 440,7+73,8 t (δ =0,987) a) si illustri il significato dei parametri, b) si commenti la bontà di adattamento della funzione, spiegando il significato dell indice di determinazione, c) si dica quanti dovrebbero essere gli utenti FASTWEB a dicembre 2007. ESERCIZIO 27 Le percentuali rispetto all anno precedente del prezzo della lattuga sono risultate le seguenti: Anno Variazioni percentuali rispetto all anno precedente 2002-2003 +3,4% 2004 +2,1% 2005-0,2% 2006 +2,3% i) Si determini la serie storica dei numeri indici a base fissa del prezzo della lattuga, con base 2005=100 e si illustri l interpretazione del N.I. calcolato nel 2003. ii) Si calcoli il tasso medio annuo di variazione del prezzo della lattuga nell intero periodo considerato e se ne commenti il significato. iii) Si calcolino i parametri della funzione interpolante lineare che esprime i numeri indici a base fissa del prezzo della lattuga in funzione del tempo iv) Si illustri l interpretazione dei parametri calcolati al punto precedente; v) Si determini la bontà di adattamento di tale funzione e si commenti il risultato ottenuto vi) Si illustri la differenza tra il parametro che esprime il coefficiente angolare della retta di regressione ed il tasso medio annuo di variazione. ESERCIZIO 28 Una ditta che produce elettrodomestici per controllare la qualità del proprio output fa ispezionare in una settimana un campione di 1.000 lavatrici. Nella tabella seguente sono riportati i risultati dell ispezione per tipo di difetto: Tipo di difetto n. lavatrici Rifiniture 230 Chiusura 80 Verniciatura 610 Parti meccaniche 60 Altro 20 Totale 1.000 i) Si disegni il diagramma di Pareto per tipo di difetto. ii) Supponendo che il costo unitario di ogni intervento per eliminare i difetti di produzione sia il seguente: verniciatura: 3,7 euro rifiniture: 12,30 euro chiusura: 9,60 euro parti meccaniche: 35,40 euro altro: 5,30 euro, si disegni il diagramma di Pareto per costo complessivo dei difetti. iii) Si commentino i due grafici in termini comparati.

PARTE II ESERCIZIO 1 In un azienda con 2.000 dipendenti l età media è pari a 43 anni, con uno scostamento quadratico medio uguale a 7 anni. i) Si dica, dandone opportuna motivazione, se è possibile calcolare la probabilità che un dipendente estratto a caso abbia un età superiore a 40 anni. ii) Illustrando tutti i passi della procedura adottata, si calcoli la probabilità che in un campione di 100 dipendenti l età media sia compresa tra 41 e 45 anni. iii) Si dica, senza effettuare i calcoli, come varierebbe la probabilità determinata al punto precedente a) se la variabilità dell età fosse stata pari a 10 anni, b) se la numerosità del campione di dipendenti fosse stata pari a 200. ESERCIZIO 2 Ad un azienda che produce semiconduttori per computer è stata commissionata una partita di schede di silicio. Le schede devono avere uno spessore compreso tra 0,74 e 0,76 mm. Il processo produttivo di tale azienda, in condizioni di controllo, è tarato per produrre schede di spessore pari a 0,75 mm, con uno scostamento quadratico medio pari a 0,004 mm. Illustrando i passi della procedura adottata, si determini la probabilità che una scheda non soddisfi i requisiti richiesti. ESERCIZIO 3 Conoscendo il seguente universo statistico riferito al numero di componenti di 6 famiglie: U = 3, 2, 4, 1, 2, 4 i) si scriva lo spazio di campionamento relativo a campioni di 2 unità nel caso di estrazione bernoulliana; ii) si scriva la distribuzione della variabile aleatoria II elemento del campione e se ne illustrino le proprietà; iii) individuando come successo l evento la famiglia ha almeno 3 componenti, si illustrino le caratteristiche della variabile aleatoria frequenza relativa di famiglie di almeno 3 componenti. ESERCIZIO 4 Da un universo di 60 individui di cui 18 sono femmine e 42 maschi viene estratto un campione di 4 unità. i) Si determini la v. a. frequenza relativa di maschi indicando, senza effettuare i calcoli, le espressioni delle probabilità associate ai singoli valori. ii) Si calcolino il valore atteso e la varianza di tale v. a. iii) Si dica, motivando la risposta, se è possibile calcolare le probabilità indicate al punto i) ricorrendo all approssimazione gaussiana. ESERCIZIO 5 In un azienda la percentuale di dipendenti femmine è pari al 35%. Considerando un campione bernoulliano di 10 dipendenti, si determini: i) la probabilità che 2 dipendenti siano femmine; ii) la probabilità che al massimo 2 dipendenti siano femmine; iii) la media e la varianza della variabile aleatoria di riferimento.

ESERCIZIO 6 Una ditta confeziona scatole di biscotti il cui peso, se il processo è sotto controllo, presenta distribuzione normale con media pari a 250 gr. e varianza pari a 25. Le confezioni vengono immesse sul mercato se il loro peso rispetta le tolleranza di 10 gr. i) Con riferimento al processo di confezionamento di un intera giornata, si determini la percentuale di confezioni non immesse sul mercato perché non rispettano le tolleranze. ii) Si dica quale dovrebbe essere la variabilità del processo affinché la percentuale di confezioni difettose si riduca al 2%. ESERCIZIO 7 Una casa produttrice di autovetture dichiara che, per un suo modello, il primo guasto al motore si verifica in media ad una percorrenza di 52.500 km, con uno scostamento quadratico medio di 9.400 km. Illustrando tutti i passi della procedura adottata: i) si calcoli la probabilità che per un auto di quel modello il primo guasto al motore si verifichi ad una percorrenza minore di 30.000 km; ii) si calcoli la probabilità che in un campione di 100 auto di quel modello la percorrenza media al primo guasto sia superiore a 54.000 km; iii) si commentino i motivi che giustificano l impiego delle distribuzioni campionarie utilizzate per la risoluzione dei punti i) e ii). ESERCIZIO 8 Si consideri il seguente universo costituito da 4 batterie al litio di cui si è rilevata la durata (in ore): {100, 150, 125, 300} i) Si determini lo spazio dei campioni di 2 elementi nel caso di estrazione Bernoulliana. {5 punti} ii) Considerando come successo il seguente evento: la batteria estratta ha durata maggiore di 100 ore si determinino il valore atteso e la varianza della variabile aleatoria che rappresenta l esito di una singola estrazione Bernoulliana. {5 punti} iii) Ipotizzando che il valore atteso di cui al punto precedente rappresenti la percentuale di batterie prodotte ad alta durata, si calcolino gli estremi dell intervallo in cui, con probabilità 0,95, è compresa la frequenza relativa campionaria di batterie ad alta durata in un campione di 120 batterie. Si evidenzino altresì gli assunti teorici che consentono di definire tale intervallo e se ne illustri l interpretazione. {5 punti} ESERCIZIO 9 In un indagine di marketing volta a determinare il prezzo di lancio di un nuovo prodotto, è stato chiesto ad un campione di 100 consumatori di indicare il prezzo ritenuto equo per tale prodotto. La media campionaria dei prezzi è risultata pari a 60 euro, mentre lo scostamento quadratico medio campionario (non corretto) è risultato uguale a 11 euro. i) Si determini l intervallo di confidenza per il prezzo ritenuto equo nell intera popolazione, con probabilità 0,99.

ii) Si illustrino, senza effettuare i calcoli, quali effetti avrebbe sull ampiezza dell intervallo di confidenza l impiego di un campione di numerosità pari a 300 consumatori. ESERCIZIO 10 In una certa Facoltà è stata condotta un indagine campionaria per stimare la percentuale di laureati nel 2002 che hanno trovato un lavoro a tempo pieno ad un anno dalla laurea. Dall indagine, che ha interessato un campione di 120 laureati, è risultata una percentuale pari al 75%. i) Si determini l intervallo di confidenza della proporzione di laureati con le suddette caratteristiche con probabilità 0,95 e se ne commenti il significato; ii) si dica, senza effettuare i calcoli, come varierebbe la procedura adottata se l indagine fosse stata effettuata su 30 laureati; iii) prima dell indagine il Preside della Facoltà aveva ipotizzato che tale percentuale fosse pari all 80%. Sulla base dei risultati ottenuti al punto i), si dica, motivando la risposta, se tale ipotesi può ritenersi fondata. ESERCIZIO 11 Una macchina è tarata per produrre tondini di spessore medio uguale a 0,5 cm. Per verificare il corretto funzionamento della macchina è stato ispezionato un campione di 4 pezzi, ottenendo i seguenti valori dello spessore (in cm): 0,45 0,48 0,51 0,46 i) Esplicitando le formule di calcolo, si determinino: la media del campione, la varianza del campione, la stima corretta della varianza dell universo e l errore standard della media campionaria. {5 punti} ii) Illustrando tutti i passi della procedura adottata, si calcoli l intervallo di confidenza con probabilità 0,95 dello spessore medio di tutti i tondini prodotti dalla macchina. {5 punti} iii) Sulla base dell intervallo ottenuto al punto ii), si dica, motivando la risposta, se è possibile ritenere che la macchina sia fuori controllo. Si fornisca, al riguardo, adeguata formalizzazione dell'ipotesi nulla e dell ipotesi alternativa, rappresentando graficamente le zone di accettazione e di rifiuto. {5 punti} ESERCIZIO 12 Un importante misura della qualità del servizio fornito dal call center di un azienda è la velocità con cui ciascun cliente viene messo in contatto con un operatore. A seguito delle lamentele di alcuni clienti, l azienda stabilisce che interverrà inserendo un operatore aggiuntivo nel call center qualora il tempo medio di attesa superi i 45 secondi. In un campione di 100 telefonate ricevute nel corso di una settimana, il tempo medio di attesa è risultato pari a 51,4 secondi, mentre lo scostamento quadratico medio corretto è risultato uguale a 25 secondi. i) Si scelgano opportunamente l ipotesi nulla e l ipotesi alternativa nel problema in esame, motivando le scelte effettuate. ii) Commentando tutti i passi della procedura adottata, si determini il P-value corrispondente. iii) Si dica a quale conclusione perviene l azienda circa l inserimento di un operatore aggiuntivo nel call center. ESERCIZIO 13 Un imprenditore edile deve decidere la località ove costruire una nuova palazzina fra le alternative: Parma (A) e Reggio Emilia (B).

La decisione dipende dal prezzo medio di vendita di un appartamento al metro quadrato. Egli svolge quindi un indagine campionaria nelle due città rilevando i seguenti valori del prezzo X (in euro): Città Prezzo X Numerosità del campione Parma (A) x (A) = 2975 120 Reggio Emilia (B) X(B): {3300 per 40 appartamenti 3200 per 40 appartamenti 2800 per 40 appartamenti} x (B) da calcolare 120 s cor s cor (A) = 150 s cor (B) da calcolare a) Si calcolino media e s cor relativamente ai prezzi nella città di Reggio Emilia; {3 punti} b) Dovendo verificare l ipotesi di uguaglianza fra i prezzi medi delle due città, si definisca la variabile aleatoria di riferimento e se ne illustrino le proprietà; {3 punti} c) Dovendo verificare l ipotesi di uguaglianza fra i prezzi medi delle due città, si formalizzi il problema di verifica di ipotesi scrivendo e commentando l ipotesi nulla e l ipotesi alternativa. Inoltre, si rappresenti graficamente la zona di accettazione e quella di rifiuto; {3 punti} ESERCIZIO 14 In un indagine condotta su un campione casuale di 450 uomini e un campione casuale di 400 donne è emerso che il 7,7% degli uomini ricordava lo spot della Coca-cola trasmesso dalla televisione due mesi prima dell indagine, mentre per quanto riguarda le donne tale percentuale raggiunge il 10,5%. Dovendo verificare l ipotesi di uguaglianza delle due percentuali per la popolazione maschile e per quella femminile: i) si definisca la variabile aleatoria di riferimento e se ne illustrino le caratteristiche; ii) fissando un livello di significatività pari al 4%, si dica se si può ritenere che la differenza riscontrata tra le due percentuali sia attribuibile alle fluttuazioni campionarie; iii) decidendo di rifiutare l ipotesi nulla, si determini il livello di significatività corrispondente e lo si commenti. ESERCIZIO 15 Un azienda che ha una quota di mercato pari al 9% vuole verificare se l introduzione di uno sconto di prezzo è in grado di incrementarla. A tale scopo, effettua un indagine su un campione di 800 consumatori, 92 dei quali si dichiarano pronti ad acquistare il prodotto in questione in caso di introduzione dello sconto di prezzo. i) Si scelgano opportunamente l ipotesi nulla e l ipotesi alternativa nel problema in esame, motivando le scelte effettuate. ii) Commendando tutti i passi della procedura adottata, si determini il p-value per la verifica dell ipotesi nulla definita al punto i). iii) Si commenti la conclusione a cui perviene l azienda circa l efficacia dello sconto di prezzo e la probabilità di errore associata a tale conclusione.

ESERCIZIO 16 Il responsabile del reparto confezioni di una ditta di abbigliamento vuole verificare che la lunghezza delle gonne di una certa taglia sia pari a 65 cm (misura standard per quel modello). A tale scopo controlla un campione di 15 gonne, rilevando una lunghezza media pari a 65,5 cm con uno scostamento quadratico medio pari a 0,5 cm. i) Scegliendo opportunamente l ipotesi alternativa, si dica a quale conclusione giungerà il responsabile del reparto, se il livello di significatività prefissato è pari a 0,02. ii) Si illustri, senza effettuare i calcoli, come varierebbe la procedura di verifica d ipotesi se la varianza del processo fosse nota. iii) Si dica, motivando la risposta, se il seguente intervallo di confidenza per la lunghezza media : P 65,1 65,9 = 0,98 è compatibile con la decisione presa la punto i). ESERCIZIO 17 Una società di ricerche deve stabilire se la quota di mercato di un azienda varia da regione a regione. Per questo motivo, intervista un campione di 200 consumatori della regione A ed un campione di 150 consumatori della regione B. La quota di mercato nel campione proveniente dalla Regione A è risultata pari al 12%, mentre la quota di mercato nel campione proveniente dalla Regione B è risultata pari al 16%. i) Si formuli il problema in esame nei termini di una verifica d ipotesi e, motivando adeguatamente la scelta effettuata, si scrivano l ipotesi nulla e l ipotesi alternativa in tale problema. ii) iii) Illustrando tutti i passi della procedura adottata, si calcoli il P-value del test suddetto. Si commenti il risultato ottenuto al punto precedente e si indichino le conclusioni che si possono trarre circa i valori delle quote di mercato nelle due regioni oggetto di indagine. ESERCIZIO 18 Una macchina è tarata per produrre lamine di alluminio di spessore medio uguale a 0,5 cm. Per verificare il corretto funzionamento della macchina è stato ispezionato un campione di 150 lamine, ottenendo i seguenti valori dello spessore (in cm): Spessore in cm 0,45 0,48 0,51 0,50 Frequenza 20 30 40 60 i) Sulla base dei dati riportati, si calcolino la stima corretta dello scostamento quadratico medio della distribuzione degli spessori e l errore standard della corrispondente media campionaria. {5 punti} ii) Spiegando i motivi delle scelte effettuate, si scrivano l ipotesi nulla e l ipotesi alternativa che consentono di rappresentare il problema in esame in termini di una verifica d ipotesi. {3 punti} iii) Illustrando tutti i passi della procedura adottata, si dica se, al livello di significatività del 1%, è possibile accettare l ipotesi nulla. Si determini il P-value {5 punti}. iv) Si fornisca un adeguata illustrazione grafica della zona di accettazione, della zona di rifiuto e del P-value calcolato al punto precedente. {2 punti}

ESERCIZIO 19 In uno studio sulla valutazione delle proprietà immobiliari, sono stati rilevati la superficie, in m 2 (X), ed il prezzo di vendita, in migliaia di euro (Y), per un campione di 7 appartamenti venduti in un determinato anno in un particolare quartiere di una città. Appartamento X = Superficie (m 2 ) Y = Prezzo di vendita (migliaia di ) A 52,1 170 B 66,1 185 C 82,5 212 D 88,3 248 E 96,5 232 F 104,7 260 G 116,4 296 La retta di regressione di Y in funzione di X risulta la seguente: yˆ 63,36 1, 91, i =1,, 7. i x i i) Si calcoli l errore standard dello stimatore B 1 del coefficiente angolare del modello di regressione ( Y i ) x. E 0 1 i ii) Si determini il corrispondente intervallo di confidenza per 1, con probabilità 0,95. iii) Si dica se, nell esempio in esame, l ipotesi di distribuzione normale dell universo è giustificata oppure no. ESERCIZIO 20 Il proprietario di una catena di gelaterie intende studiare l effetto che la temperatura atmosferica ha sulle vendite di gelati nella stagione estiva. Con riferimento ad un campione di 15 giornate si sono rilevati i seguenti valori delle temperature (X), in gradi centigradi, e delle vendite (Y), in euro: Giorno X Y 1 30 1500 2 31 1550 3 28 1200 4 27 1210 5 28 1300 6 32 1560 7 34 1600 8 27 1510 9 25 1000 10 29 1400 11 31 1450 12 30 1380 13 35 1630 14 33 1250 15 26 1240

i) Si calcolino i parametri del modello di regressione di X in funzione di Y, se ne misuri la validità e si commenti il significato dei risultati trovati. ii) Si scrivano l ipotesi nulla e l ipotesi alternativa che consentono di valutare la significatività della relazione tra le due variabili. iii) Si valuti la significatività della relazione tra le due variabili. iv) Si commentino in termini comparati le indicazioni che si traggono dai precedenti punti i) e iii). ESERCIZIO 21 In un campione di 5 aziende agricole appartenenti alla medesima regione, sono state effettuate le seguenti rilevazioni: a) Z = mm di pioggia al suolo da gennaio ad agosto 2009. b) Y = quantità di pomodori prodotti per ettaro nel 2009: Azienda A Azienda B Azienda C Azienda D Azienda E Z = mm di pioggia al suolo 120 75 100 80 135 Y = Quantità di pomodori per ettaro 80 65 77 68 102 Considerando le variabili di cui sopra: i) Si determini e si commenti il modello di regressione lineare che esprime il legame logico tra Z e Y. In altre parole, si determinino le stime campionarie dei coefficienti β 0 e β 1 di tale modello e se ne illustri l interpretazione. (Al fine di semplificare la procedura di calcolo, si possono utilizzare i seguenti valori già calcolati: cov(z,y)= 280,2; var(z) = 526; M(Z) = 102; M(Y) = 78,4) {5 punti} ii) Si calcoli l errore standard della stima campionaria del coefficiente di regressione β 1 e se ne illustri il significato. {5 punti} iii) Utilizzando le stime calcolate ai punti i) e ii), si verifichi al livello di significatività del 5% l ipotesi nulla che non vi sia alcuna relazione lineare tra Z e Y e si illustri il significato della decisione presa. Si dettaglino inoltre le ipotesi di lavoro sottostanti tale verifica di ipotesi. {5 punti}