Facoltà di Economia Università di Pavia 3 Novembre 2009 Prova scritta di Analisi dei dati Modalità A

Documenti analoghi
Facoltà di Economia Università di Pavia 15 Aprile 2009 Prova scritta di Analisi dei dati Modalità A

Facoltà di ECONOMIA Università di Pavia 15 Aprile 2008 Prova scritta di Analisi dei dati, Modalità A Soluzioni sintetiche dei principali esercizi.

Facoltà di Economia Università di Pavia 7 Luglio 2009 Prova scritta di Analisi dei dati. Modalità A

Statistica. Alfonso Iodice D Enza

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Outline. 1 La forma di una distribuzione. 2 Indici di asimmetria. 3 Indice di asimmetria per variabili qualitative ordinate.

Facoltà di ECONOMIA Università di Pavia 26 Aprile 2006 Prova scritta di Analisi dei dati

Statistica. Alfonso Iodice D Enza

1) Calcolare l indice di eterogeneità di Gini per i caratteri Qualifica Funzionale e Regime di Impiego.

Med. Med. Si determinano il limite inferiore e superiore applicando le seguenti formule

Q1 = /4 0 4 = Me = /2 4 = 3

Statistica Medica. Sez. 1 - Analisi esplorativa dei dati. Statistica Medica p.1/39

La variabilità. Monia Ranalli. Ranalli M. Variabilità Settimana # 2 1 / 14

Esercitazioni di statistica

Facoltà di ECONOMIA Università di Pavia 15 Aprile 2009 Prova scritta di Analisi dei dati, Modalità C Soluzioni sintetiche dei principali esercizi.

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Esercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese

Facoltà di ECONOMIA Università di Pavia 20 Aprile 2004 Prova scritta di Analisi dei dati MODALITÀ A

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

1.1 Obiettivi della statistica Struttura del testo 2

Facoltà di ECONOMIA Università di Pavia 17 Aprile 2007 Prova scritta di Analisi dei dati, Modalità A Soluzioni sintetiche dei principali esercizi

Statistica Matematica A

Prova scritta di Statistica

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

STATISTICA AZIENDALE Modulo Controllo di Qualità

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

Indici di variabilità relativa

ESERCIZI. 2 - Descrittiva

Misure di dispersione (o di variabilità)

Analisi univariata Analisi bivariata Analisi multivariata

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

VOTI ESERCIZIO 1. In Tabella 1 è mostrato l insieme dei 31 voti del primo appello dell esame scritto di cinese.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Range interquartile. Calcolare e interpretare Range interquartile

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Statistica Sociale - modulo A

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Politecnico di Milano - Scuola di Ingegneria Industriale. II Appello di Statistica per Ingegneria Energetica 5 settembre 2011

Settimana 2. G. M. Marchetti. 4 Marzo 2017

ESAME. 9 Gennaio 2017 COMPITO B

Fonti e strumenti statistici per la comunicazione. Prof.ssa Isabella Mingo A.A

ESAME. 9 Gennaio 2017 COMPITO A

TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA

Esercitazione 6 marzo 2014

Statistica. Antonio Azzollini

La variabilità. Antonello Maruotti

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.

Statistica A-D. Marco Riani. Esercizio: calcolare M, Me, dev, var, σ, S M, MAD dei seguenti prezzi di un bene. M=Me=8 DEV = 10 VAR = 2,5.

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Variabile divisa in classi: varianza

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

Istituzioni di Statistica e Statistica Economica

Dispensa di Statistica

Esercizi di preparazione all esame di Statistica Dr Alessia Mammone alessia STATISTICA DESCRITTIVA

e) calcolate i cinque numeri di sintesi, la media e la deviazione standard per entrambi i campioni di lunghezze. 1,5 + 1,5

Corso di Statistica. Variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Statistica descrittiva

Esercizi di Ricapitolazione

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

Esercitazioni di Statistica

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Distribuzione di Frequenza: Esempio

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Statistica Descrittiva Esercitazione 3. Indici di variabilità

Le misure numeriche. La media aritmetica

Rappresentazione dei dati

STATISTICA A K (63 ore)

R - Esercitazione 2. Andrea Fasulo 20 Ottobre Università Roma Tre

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2016/2017 Appello A - 27 Gennaio 2017

Dispersione. si cercano indici di dispersione che:

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Indici di Dispersione

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD. 4038) 6 novembre 2002

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Indici di variabilità

Insegnamento di Statistica Parte 1: Distribuzioni Univariate Prof. P.F. Perri. Raccolta dei temi d esame assegnati nell anno accademico 2004/2005

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

STATISTICA 1 ESERCITAZIONE 6

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Indici di variabilità ed eterogeneità

Politecnico di Milano Facoltà di Ingegneria Industriale. I Prova in Itinere di Statistica Matematica A per Ingegneria ENG 03 Maggio 2004

Statistica Un Esempio

Ad unagarapodisticahannopartecipato100 persone. La tabellariportailorotempi di percorrenza(in minuti) raggruppatiin classi:

Esercizi di Ricapitolazione

Transcript:

Facoltà di Economia Università di Pavia 3 Novembre 2009 Prova scritta di Analisi dei dati Modalità A Indicare in alto a sinistra, nell ordine: Cognome, Nome, Numero di Matricola, Modalità del Compito. Problema (9 PUNTI) Un indagine sull acquisto di computer portatili ha prodotto i seguenti risultati (la spesa è riportata in migliaia di euro): Età (E i ) Tipologia Optional Spesa acquistata (T i ) acquistati (O i ) sostenuta (S i ) 9 Mac.5 2 Windows 2.9 28 Mac 0 2 25 Windows.5 24 Windows 2.3 27 Mac 3.4 30 Windows 2 2.2 45 Windows 3 2.5 23 Mac 4.6 40 Windows 2 2. i= E i = 282 i= O i = 9 i= S i = 9 i= E2 i = 8570 i= O2 i = 49 i= S2 i = 37.42 a) Calcolare media e mediana della variabile Età. (2 punti) µ = 28.2, Me = 26 b) Dopo averla riclassificata negli intervalli [0,.5], (.5, 2] e (2, 2.5], rappresentare la distribuzione di frequenza della variabile Spesa con un istogramma. (4 punti) n i p i Densità [0,.5] 3 0.3 0.2 (.5, 2] 3 0.3 0.6 (2, 2.5] 4 0.4 0.8 Histogram of s Density 0.0 0.2 0.4 0.6 0.8 0.0 0.5.0.5 2.0 2.5 s

c) Calcolare la mediana della variabile Spesa sulla base dei dati raggruppati come al punto precedente. (3 punti) (Me.5).6 =.2 Me =.5 +.2/.6 =.83 Problema 2 (7 PUNTI) 2a) Si considerino nuovamente i dati di cui al Problema. Calcolare l indice di eterogeneità relativo di Gini per la variabile Tipologia di computer acquistato. (3 punti) Due modalità, Mac e Windows con pesi p =.4 e p 2 =.6 G = k i= p2 i =.48 G = = 2G =.96 G k k 2b) Si considerino nuovamente i dati di cui al Problema. Mediante l utilizzo di un opportuno indice, stabilire se è più variabile Età od Optional. (4 punti) CV E = 0 e analogamente si ottiene CV O = 0.60 Problema 3 (9 PUNTI) i= E2 i ( 0 0 i= E i ) 2 0 i= E i = 0.28 3a) Specificando opportunamente le ipotesi, si enunci il teorema di Bayes. (3 punti) 3b) Enunciare le condizioni che garantiscono l indipendenza tra due eventi A e B. (3 punti) 3c) Due eventi A e B sono tali che P (A B) = 0.3 e P (A B) = 0.2. Determinare P (B). (3 punti) P (A B) = P (A B)P (B) P (B) = P (A B) P (A B) =.2/.3 =.67 P (B) =.33

Problema 4 (5 PUNTI) Si consideri il seguente box-plot. 4a) Che tipo di informazioni si possono trarre dal box-plot circa la simmetria della distribuzione rappresentata? ( punto) Asimmetria positiva, dato che la mediana è molto vicina al minimo, e il baffo lungo per valori maggiori del terzo quartile farà sì che la media superi la mediana. 4b) Spiegare che cosa rappresenta il simbolo grafico isolato indicato con, e perchè il baffo non si estende fino a tale punto. (2 punto) È un outlier, cioè valore anomalo, rappresentato isolatamente se supera min{x (n), Q 3 +.5DI}, dove Q 3 è il terzo quartile e DI è la differenza interquartile. 4c) Fornire la forma analitica dell indice di asimmetria γ, specificando con precisione tutte le quantità coinvolte. (2 punti)

Facoltà di Economia Università di Pavia 3 Novembre 2009 Prova scritta di Analisi dei dati Modalità B Indicare in alto a sinistra, nell ordine: Cognome, Nome, Numero di Matricola, Modalità del Compito. Problema (9 PUNTI) Un indagine sull acquisto di computer portatili ha prodotto i seguenti risultati (la spesa è riportata in migliaia di euro): Età (E i ) Tipologia Optional Spesa acquistata (T i ) acquistati (O i ) sostenuta (S i ) 8 Windows 2.3 22 Mac.8 27 Mac 3 2. 23 Windows.4 25 Windows 2 2. 26 Mac 4.4 29 Windows 2 2.3 32 Windows.5 30 Windows.2 28 Windows 3 2.0 i= E i = 260 i= O i = 20 i= S i = 7. i= E2 i = 696 i= O2 i = 50 i= S2 i = 30.65 a) Calcolare media e mediana della variabile Età. (2 punti) µ = 26, Me = 26.5 b) Dopo averla riclassificata negli intervalli [,.4], (.4, 2] e (2, 2.5], rappresentare la distribuzione di frequenza della variabile Spesa con un istogramma. (4 punti) n i p i Densità [,.4] 4 0.4 (.4, 2] 3 0.3 0.5 (2, 2.5] 3 0.3 0.6 Histogram of s Density 0.0 0.2 0.4 0.6 0.8.0.0.5 2.0 2.5 s

c) Calcolare la mediana della variabile Spesa sulla base dei dati raggruppati come al punto precedente. (3 punti) (Me.4).5 =. Me =.4 +./.5 =.6 Problema 2 (7 PUNTI) 2a) Si considerino nuovamente i dati di cui al Problema. Calcolare l indice di eterogeneità relativo di Gini per la variabile Tipologia di computer acquistato. (3 punti) Due modalità, Mac e Windows con pesi p =.3 e p 2 =.7 G = k i= p2 i =.42 G = = 2G =.84 G k k 2b) Si considerino nuovamente i dati di cui al Problema. Mediante l utilizzo di un opportuno indice, stabilire se è più variabile Età od Optional. (4 punti) CV E = 0 e analogamente si ottiene CV O = 0.50 Problema 3 (9 PUNTI) i= E2 i ( 0 0 i= E i ) 2 0 i= E i = 0.5 3a) Specificando opportunamente le ipotesi, si enunci il teorema di Bayes. (3 punti) 3b) Enunciare le condizioni che garantiscono l indipendenza tra due eventi A e B. (3 punti) 3c) Due eventi A e B sono tali che P (B A) = 0.4 e P (A B) = 0.3. Determinare P (A). (3 punti) P (A B) = P (B A)P (A) P (A) = P (A B) P (B A) =.3/.4 =.75 P (A) =.25

Problema 4 (5 PUNTI) Si consideri il seguente box-plot. 4a) Che tipo di informazioni si possono trarre dal box-plot circa la simmetria della distribuzione rappresentata? ( punto) Asimmetria negativa, dato che la mediana è molto vicina al massimo, e il baffo lungo per valori minori del primo quartile farà sì che la media sia inferiore alla mediana. 4b) Spiegare che cosa rappresenta il simbolo grafico isolato indicato con, e perchè il baffo non si estende fino a tale punto. (2 punto) È un outlier, cioè valore anomalo, rappresentato isolatamente se è inferiore a max{x (), Q.5DI}, dove Q 3 è il terzo quartile e DI è la differenza interquartile. 4c) Fornire la forma analitica dell indice di asimmetria γ, specificando con precisione tutte le quantità coinvolte. (2 punti)