ESERCIZI DI RIEPILOGO 1

Documenti analoghi
Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

1.1 Obiettivi della statistica Struttura del testo 2

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. L Editore ringrazia. Ringraziamenti. Autori. Prefazione. Obiettivi formativi XIII XVII

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Laboratorio di Statistica 1 con R Esercizi per la Relazione. I testi e/o i dati degli esercizi contassegnati da sono tratti dai libri consigliati

Dispensa di Statistica

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

7. STATISTICA DESCRITTIVA

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

STATISTICA 1 ESERCITAZIONE 2

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Statistica di base per l analisi socio-economica

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Questionario 1. Sono assegnati i seguenti dati

SCOPO DELL ANALISI DI CORRELAZIONE

Statistica descrittiva II

CAPITOLO 2 RAPPRESENTAZIONI GRAFICHE DEI DATI

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

STATISTICA AZIENDALE Modulo Controllo di Qualità

Teoria e tecniche dei test. Concetti di base

Statistica Un Esempio

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Scale di Misurazione Lezione 2

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente

STATISTICA 1 ESERCITAZIONE 6

Variabilità e Concentrazione Esercitazione n 02

Istituzioni di Statistica

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

Istituzioni di Statistica e Statistica Economica

Compiti tematici dai capitoli 2,3,4

REGRESSIONE E CORRELAZIONE

PROBABILITÀ ELEMENTARE

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Statistica Sociale - modulo A

Rappresentazioni grafiche

Esercitazione del

ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE

Transcript:

ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2 5.2 5 f i a) Calcolare la media e lo scarto quadratico medio delle età. b) In un campione di adulti l età media è pari a 37 e lo scarto quadratico medio a 6. Si confronti la variabilità delle età nei due gruppi. ESERCIZIO 2 La tabella contiene i dati storici relativi al numero di persone (in milioni) impiegate nei principali settori produttivi in Italia: Anno Agricoltura Industria servizi 1951 8,2 6,3 5,0 1971 3,2 8,3 7,2 1991 1,8 6,9 12,8 Proporre una rappresentazione grafica adeguata a mostrare il cambiamento della forza lavoro in Italia dopo il 1950. 1

ESERCIZIO 3 L altezza media di un campione di giocatori di basket è pari a 195 mentre la varianza è pari a 9. a) Sapendo che la distribuzione delle altezze ha forma approssimativamente simmetrica e campanulare qual è la percentuale di giocatori con altezza compresa tra 186 e 204? b) Si verifichi che il valore trovato al punto precedente soddisfa la disuguaglianza di Tcebiscev. ESERCIZIO 4 Le mele di un azienda ortofrutticola sono etichettate da un bollino codificato che può dare diritto a premi in denaro di diversa entità. L azienda ha reso noto che il premio medio è pari a 20 euro e lo scarto quadratico medio dei premi è pari a 4 euro. a) A vostro parere la forma della distribuzione dei premi è simmetrica o asimmetrica a destra/sinistra? b) Tenendo conto della risposta data al punto a) cosa è possibile dire circa la percentuale di premi nell intervallo [12,28]? c) Sempre tenendo conto della risposta data al punto a) cosa è possibile dire sulla frequenza dei premi con valore superiore a 28 euro? ESERCIZIO 5 Il seguente diagramma ramo foglia contiene dati campionari (ramo = unità) 3 0, 1 4 5, 8, 8 5 0, 3, 4, 5, 7, 8, 9 6 1, 4, 7, 9 7 3, 6, 9 8 0, 3, 7 a. Ricavare i cinque numeri di sintesi e disegnare il box plot. b. Trovare l ottavo decile. c. Trovare il 92 percentile. 2

ESERCIZIO 6 La tabella seguente mostra la distribuzione del reddito di un campione di 700 famiglie (valori espressi in migliaia di euro): classi di reddito Numero di famiglie 0-6 12 6-10 40 10-20 250 20 30 160 30 40 180 40-50 30 50-60 20 60-100 8 Totale 700 (a) rappresentare graficamente la variabile commentarne la forma. (b) calcolare il reddito mediano e quello medio. Dal confronto tra i due valori cosa potete dire sull asimmetria della distribuzione? (c) qual è la frequenza relativa di coloro che hanno un reddito minore di 15 000 euro? Evidenziare tale proporzione sul grafico ricavato al punto a) ESERCIZIO 7 La varianza può essere calcolata con una formula detta ridotta. Si scriva la suddetta formula e la si utilizzi per calcolare la varianza della popolazione seguente: 1, 3, 6, 3, 1, 1. ESERCIZIO 8 In una classe di 15 alunni l età media è pari a 18 e la varianza dell età è pari a zero. Si scriva la distribuzione di frequenza dell età degli alunni. 3

ESERCIZIO 9 Quale informazione aggiuntiva fornisce il coefficiente di correlazione rispetto alla covarianza? Si spieghi il motivo di questa differenza. ESERCIZIO 10 La covarianza di due variabili X e Y può essere calcolata attraverso una formula più semplice. Si scriva la formula semplificata e la si utilizzi per calcolare la covarianza delle seguenti coppie (x,y) di valori: (1,2), (3,4), (6,2), (3,2), (1,8), (1,9). ESERCIZIO 11 Da un indagine sulla nazionalità (X) degli studenti dei corsi graduate di una università americana è emersa la distribuzione di frequenza riportata nella tabella sotto. Si sa inoltre che sono di sesso maschile il 50% degli studenti italiani e tedeschi, il 65% degli studenti cinesi e il 25% degli altri studenti. Nazionalità p i Italia 0.20 Germania 0.10 Cina 0.65 Altro 0.05 a) si rappresenti la variabile Nazionalità mediante un opportuno diagramma a barre. 4

b) si ricavi la distribuzione di frequenza congiunta delle variabili X= Nazionalità e Y= Sesso. c) Quale percentuale degli studenti è di sesso maschile e non proviene dalla Cina? d) si rappresenti graficamente la variabile Y mediante un diagramma a torta. e) Si proponga un grafico che mostri la distribuzione del sesso al variare del paese di provenienza. Che indicazione è possibile trarre circa la dipendenza tra le due variabili? 5

Risultati 1. a) Calcolo media e scarto quadratico medio: x = 1 x i f i n i = 1 24 (4.6*8+3.2*3+5.4*6+2.6*2+5.2*5)=4.583 s 2 x = 1 n 1 i (x i x) 2 f i = 1 ( 23 (4.6-x)2 *8+(3.2-x) 2 *3+(5.4-x) 2 *6+(2.6-x) 2 *2+(5.2-x) 2 *5) = 0.84 s x = 0.84 = 0.92 b) Per comparare la variabilità calcolo il coefficiente di variazione nei due gruppi (adulti e bambini): CV età bambini = s x x = 0.20 CV età adulti = 6 37 = 0.16 dal confronto posso concludere che l età è meno variabile tra gli adulti. 2. Un grafico adeguato è un grafico a barre sovrapposte che mostri, per ogni anno, la proporzione dei lavoratori nei vari settori. 3. a) L intervallo è (mu- 3sigma, mu+3sigma) e la forma della distribuzione è campanulare quindi posso usare la regola empirica e concludere che circa il 99.73% dei giocatori ha un altezza compresa tra 186 e 204 cm. c) Utilizzando la disuguaglianza di Tchebicheff avremmo concluso che almeno l 88.9% per cento dei giocatori ha un altezza compresa tra 186 e 204cm. Essendo 99.73>88.9 la disuguaglianza risulta verificata. 6

4. 5. a) I cinque numeri di sintesi sono: min=minimo delle osservazioni=3, Q1 si trova nella posizione 0.25(n+1)=6 quindi Q1=5 Q2 si trova nella posizione 0.5(n+1)=11,5 quindi Q2=5.85 Q3 si trova nella posizione 0.75(n+1)=17 quindi Q3=7.3 Max=massimo delle osservazioni= 8.7 b) L ottavo decile si trova nella posizione 0.8(n+1) quindi c) Il novantaduesimo percentile occupa la posizione 6. a) Istogramma, utilizzando la densità di frequenza ( ) b) La variabile reddito è continua per intervalli. Per calcolare la media calcoliamo i punti medi degli intervalli e poi utilizziamo la formula per variabili discrete: x = 1 x m i f i n i = 1 (3*12+8*40+15*250+25*160+35*180+45*30 + 55*20 + 80*8) 700 =24.99 Per calcolare la mediana : passo 1) identifico l intervallo in cui cade la mediana, si tratta di [20,30] dal momento che la frequenza cumulata è inferiore a 350 nell estremo inferiore e superiore a 350 nell estremo superiore; passo 2) la mediana è il valore di x che soddisfa: 0.5=F(20)+(x- 20)*(densità intervallo in cui cade mediana) ( ) c) procedere in modo simile al calcolo della mediana. 7. Per la formula ridotta si veda l appendice al capitolo 5. La varianza della popolazione è 4.68. 7

8. 9. Fornisce l informazione circa l intensità del legame lineare tra le due variabili. 10. Per la formula ridotta si veda l appendice al capitolo 5. La covarianza nel campione dato è - 0.58. 11. Si veda l esercitazione 2 8