Variabilità e Concentrazione Esercitazione n 02

Documenti analoghi
Esercitazioni di Statistica

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

Esercitazioni di statistica

Esercitazioni di Statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

Statistica Applicata all edilizia Lezione 3: i numeri indice

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Il test (o i test) del Chi-quadrato ( 2 )

L indagine statistica

Generazione di Numeri Casuali- Parte 2

Esercitazioni di Statistica Dott.ssa Cristina Mollica

ESAME DI STATO. SIMULAZIONE PROVA NAZIONALE Scuola Secondaria di I grado Classe Terza. Prova 3. Anno Scolastico Classe:... Data:...

Correlazione. Daniela Valenti, Treccani Scuola 1

Esercitazione # 3. Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti

La Prova Invalsi per la scuola secondaria di 2 grado

Indicazioni per lo svolgimento dell esercitazione di laboratorio

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

UNIVERSITA' CATTOLICA DEL SACRO CUORE. Valutazione della soddisfazione degli studenti a.a Riepilogo delle valutazioni fornite

REGIONE CALABRIA REPUBBLICA ITALIANA FINCALABRA S.P.A. REGIONE CALABRIA DIPARTIMENTO 6 SVILUPPO ECONOMICO, LAVORO, FORMAZIONE E POLITICHE SOCIALI

Calcolo di una Regressione lineare semplice con Excel

Metodi statistici per le ricerche di mercato

STUDIO DI SETTORE TG42U ATTIVITÀ AGENZIE DI CONCESSIONE DEGLI SPAZI PUBBLICITARI

Indicatori statistici

Protocollo dei saperi imprescindibili Ordine di scuola: professionale

Esercitazioni di statistica

2. Variabilità mediante il confronto di valori caratteristici della

CONICHE. Esercizi Esercizio 1. Nel piano con riferimento cartesiano ortogonale Oxy sia data la conica C di equazione

Matematica con il foglio di calcolo

Statistica. Alfonso Iodice D Enza iodicede@gmail.com

Esercitazione 8: Esercizi di riepilogo. Viviana Amati

6. IMPIANTO DI CLIMATIZZAZIONE CALCOLO PSICROMETRICO DEL SOGGIORNO-PRANZO

Capitolo 11 Test chi-quadro

CORSO LAUREA IN INGEGNERIA ELETTRONICA E INFORMATICA RAPPORTO DI RIESAME 2016 APPENDICE

UNIVERSITA DEGLI STUDI DI PADOVA DIPARTIMENTO DI INGEGNERIA IDRAULICA, MARITTIMA E GEOTECNICA

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Documento non definitivo

SISTEMI LINEARI MATRICI E SISTEMI 1

4 0 = 4 2 = 4 4 = 4 6 = 0.

GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti

ESERCIZIO 1. Confrontare, analiticamente e graficamente, la forma e la variabilità delle due distribuzioni. Commentare i risultati ottenuti.

valore di a: verso l alto (ordinate crescenti) se a>0, verso il basso (ordinate decrescenti) se a<0;

Qualche esercizio di riepilogo

La Distribuzione Normale (Curva di Gauss)

ESERCITAZIONI DI LOGISTICA. Laurea in Ingegneria Logistica e della Produzione. Corso di Logistica e di Distribuzione

Tabella relativa alla produzione di agrumi e frutta fresca (migliaia di quintali):

Variabili aleatorie Parte I

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

ESERCIZI IN PIÙ I NUMERI COMPLESSI

Le frazioni algebriche

Pro memoria per la ripartizione delle spese

ALLEGATO 4 LIVELLI DI SERVIZIO E PENALI PER LA CONDUZIONE DELLA RETE DISTRIBUTIVA FISICA

LA PRIMA LEGGE DI OHM

Documento non definitivo

Appendice B Esempi di item di matematica

BILANCIO DEI VINCOLI ED ANALISI CINEMATICA

Documento non definitivo

SIMULAZIONE - 29 APRILE PROBLEMA 1

Simulazione del comportamento energetico di una turbina eolica: bilanci energetici ed analisi economica

SOTTOSPAZI E OPERAZIONI IN SPAZI DIVERSI DA R n

Rapporto riparazioni Rapporto riparazioni 2016 RiparAutOnline Febbraio RiparAutOnline srl

SCHEDA DI VALUTAZIONE DELLE COMPETENZE. Tecnico Professionali Specifiche

VERIFICHE PERIODICHE DEL COLLEGIO SINDACALE. di Teresa Aragno

LA MEDIANA (Caratteri almeno qualitativi ordinati)

MISURA DELLA DISTANZA FOCALE DI UNA LENTE CONVERGENTE

Gravidanza o no? Patient Diagnostics Test Rapidi della Progettazione Familiare

Corso di Psicometria Progredito

Esercitazioni di Statistica

Figura 2. Box-plot categorizzato dei tempi di attesa complessivi (in secondi) per i diversi valori della variabile intervento

Analisi dell evento nascita - Anno 2010

Procedura operativa per la gestione della funzione di formazione classi prime

ISTITUZIONI DI ECONOMIA corso diurno

LE PROPORZIONI. Stefania Sciuto numeri&molecole.wordpress.com

SEPARAZIONI E DIVORZI IN ITALIA ED IN EMILIA- ROMAGNA DAL 2000 AL 2012

STUDIO DI SETTORE UM85U ATTIVITÀ COMMERCIO AL DETTAGLIO DI GENERI DI MONOPOLIO (TABACCHERIE)

Esercitazione n. 5 di Metodologia della Ricerca Psicologica

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

GRIGLIA DI CORREZIONE 2013 Matematica Classe I Scuola secondaria di primo grado FASCICOLO 1

differiticerti.notebook November 25, 2010 nov nov nov Problemi con effetti differiti

Esercitazioni del corso ufficiale di Statistica. Ottobre - Novembre Corso di Laurea in Economia Aziendale. Lezione di Sabato 18 Novembre

Esercizi sulle affinità - aprile 2009

ANAGRAFE NAZIONALE CREDITI FORMATIVI. Manuale utente

I CONSUMI DI PRESTAZIONI AMBULATORIALI PER DISCIPLINA E DI PRIME VISITE SPECIALISTICHE NELL ASL DI VARESE ANNO 2013

L incidentalità sulle strade della provincia di Monza e della Brianza

Transcript:

Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo (in ore) 4,4 3,2 3,6 4,7 5,1 3,2 4,2 2,8 1) precisare il collettivo, il fenomeno e la natura del carattere oggetto di studio 2) calcolare il tempo medio impiegato dagli studenti per completare il test 3) studiare la variabilità del tempo impiegato dagli studenti con un indice opportuno 4) data la trasformazione lineare Z=2X 3, calcolare media e varianza del carattere Z ESERCIZIO 2 Le due distribuzioni seguenti sono relative ad un gruppo di 1570 studenti iscritti al primo anno fuori corso del Corso di Laurea in Economia Aziendale, divisi in matricole pari e dispari e distribuiti secondo il numero di esami sostenuti: Esami Matricole Matricole sostenuti pari dispari 0-4 38 12 5-9 116 171 10-14 168 234 15-19 203 300 20-24 215 113 Totale 740 830 1) precisare il collettivo, il fenomeno e la natura del carattere oggetto di studio 2) calcolare il n medio di esami sostenuti dagli studenti con matricola pari e con matricola dispari 3) stabilire quale delle due distribuzioni presenta maggiore variabilità ESERCIZIO 3 Negli ultimi 20 giorni alle ore 12:00 è stata rilevata la temperatura di una località montana (in C): Giorno 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 Temperatura (in C) 0-3 2 0-1 -1 2-2 1-2 -3 1-3 2 1-2 1 2-3 1 1) precisare il collettivo, il fenomeno e la natura del carattere oggetto di studio 2) costruire la distribuzione di frequenza 3) stabilire in quanti giorni la temperatura si è mantenuta al di sotto dello zero 4) determinare la temperatura mediana e studiare la variabilità con un indice opportuno

ESERCIZIO 4 In una indagine sui consumi telefonici è stato chiesto a tutti gli studenti iscritti al primo anno del C. di L. in Economia Aziendale che importo ricaricano sul cellulare in un mese. Nella tabella che segue sono riportati i risultati: Ricarica ( ) n i 10 44 25 112 50 176 100 41 150 27 totale 400 1) studiare la concentrazione del carattere calcolando l indice R e utilizzando la Curva di Lorenz 2) cosa accade se il prossimo mese ogni studente ricarica il proprio cellulare della metà? ESERCIZIO 5 È stata analizzata la quantità di ferro (in mg) contenuta in 84 campioni prelevati dal terreno A e in 72 campioni prelevati dal terreno B. I risultati sono riportati nella seguente tabella: TERRENO A TERRENO B quantità ferro (mg) n campioni totale ferro (mg) n campioni totale ferro (mg) 0-5 15 20 8 40 5-15 18 108 8 112 15-40 19 304 10 400 40-60 12 600 25 1025 60-70 6 390 15 975 70-100 14 1260 6 426 Totale 84 2682 72 2978 1) verificare quale tra le due distribuzioni ha la maggiore variabilità 2) verificare in quale terreno il ferro è più concentrato

ESERCIZIO 1 1) Il collettivo oggetto di studio è costituito dagli 8 studenti che hanno svolto il test di valutazione; il fenomeno che stiamo analizzando è il tempo impiegato da ciascun studente per completare il test, carattere quantitativo di tipo continuo. 2) Per calcolare il tempo medio impiegato dagli studenti utilizziamo la media aritmetica: 1 x a = (4,4 + 3,2 + 3,6 + 4,7 + 5,1 + 3,2 + 4,2 + 2,8) = 3,9 ore 8 Possiamo quindi concludere che mediamente gli studenti hanno impiegato 3 ore e 54 minuti per completare il test di valutazione (0,9 x 60 = 54). 3) Avendo calcolato il tempo medio, possiamo studiare la variabilità attraverso lo scostamento semplice medio oppure attraverso la varianza: S x a [ 4,4 3,9 + 3,2 3,9 + 3,6 3,9 + 4,7 3,9 + + 5,1 3,9 + 3,2 3,9 + 4,2 3,9 + 2,8 3,9 ] = = 0,7 ore 8 [(4,4 3,9) (3,2 3,9) (3,6 3,9) (4,7 3,9) 2 2 2 2 + + + + 2 2 2 2 (5,1 3,9) (3,2 3,9) (4,2 3,9) (2,8 3,9) ] 2 + + + + σ = = 0,5875 8 Con lo scostamento semplice medio si rileva una variabilità di 42 minuti (0,7 x 60), mentre invece considerando lo scarto quadratico medio (radice quadrata della varianza) si rileva una variabilità di circa 46 minuti (0,77 x 60). 4) Utilizzando le proprietà della media aritmetica e della varianza possiamo facilmente calcolare media e varianza del carattere Z = 2X - 3. Infatti avremo che: z = 2x 3 = 2 3,9 3 = 4,8 ore a a σ = 2 σ = 4 0,5875 = 2,35 σ = 2,35 = 1,53 ore 2 2 2 z x z Dopo la trasformazione avremo quindi un tempo medio pari a 4 ore e 48 minuti, con uno scostamento medio da tale tempo pari a circa ± 1 ora e 32 minuti.

ESERCIZIO 2 1) Il collettivo è costituito da tutti gli studenti iscritti al primo anno fuori corso del CdL in Economia Aziendale, divisi in due gruppi a seconda che la loro matricola sia pari o dispari; il fenomeno studiato è il numero di esami sostenuti alla data di rilevazione, carattere quantitativo di tipo discreto. 2) Per calcolare il numero medio di esami sostenuti dagli studenti dei due diversi collettivi è necessario innanzi tutto calcolare il valore centrale delle diverse classi di voto. Esami Matricole Matricole v.c. sostenuti pari dispari 0-4 2 38 12 5-9 7 116 171 10-14 12 168 234 15-19 17 203 300 20-24 22 215 113 Totale 740 830 Calcoliamo la media aritmetica considerando i valori centrali di ciascuna classe e il numero di studenti corrispondente, prima per il collettivo degli studenti con matricola pari e quindi per quello degli studenti con matricola dispari. Il n medio di esami sostenuti dagli studenti con matricola pari è pari a circa 15, mentre il n medio di esami sostenuto dagli studenti con matricola dispari è 14. Possiamo anche calcolare il n medio di esami sostenuto da tutti gli studenti: x x N + x N 15 740 + 14 830 pari pari dispari dispari a = = = Npari + Ndispari 1570 14,7 esami 3) Per poter stabilire quale distribuzione è più variabile (cioè se il carattere numero di esami ha una maggiore variabilità tra gli studenti con matricola pari o tra quelli con matricola dispari), è necessario prima calcolare lo scarto quadratico medio e quindi il coefficiente di variazione. σ 2 pari 2 2 2 2 2 (2 15) 38 + (7 15) 116 + (12 15) 168 + (17 15) 203 + (22 15) 215 36 σpari 6 esami = = 740 σ 2 dispari 2 2 2 2 2 (2 14) 12 + (7 14) 171 + (12 14) 234 + (17 14) 300 + (22 14) 113 25 σ dispari 5 esami = = 830 Abbiamo quindi nel caso delle matricole pari una variabilità di ± 6 esami (in termini di s.q.m), mentre nel caso delle matricole dispari una variabilità di ± 5 esami. Possiamo ora calcolare i coefficienti di variazione e confrontare le distribuzioni: σ 6 σ 5 = = = = pari dispari CVpari 0,40 40% CVdispari 0,36 36% x pari 15 x dispari 14 Dal confronto dei due coefficienti di variazione concludiamo che il numero di esami sostenuti dagli studenti con matricola pari ha una maggiore variabilità rispetto al numero di esami sostenuti dagli studenti con matricola dispari.

ESERCIZIO 3 1) Il collettivo statistico è costituito dai 20 giorni nei quali abbiamo registrato la temperatura; il fenomeno è dato quindi dalla temperatura (in C), carattere quantitativo di tipo continuo. 2) Per costruire la distribuzione di frequenza dobbiamo individuare tutti i diversi modi di manifestarsi del fenomeno, cioè le diverse modalità del carattere temperatura: Temperatura (in C) Giorni -3 XXXX 4-2 XXX 3-1 XX 2 0 XX 2 1 XXXXX 5 2 XXXX 4 20 3) Per stabilire in quanti giorni la temperatura si è mantenuta sotto lo zero è necessario derivare le frequenze cumulate assolute dalle frequenze assolute: Temperatura (in C) Giorni N i F i -3 4 4 0,20-2 3 7 0,35-1 2 9 0,45 0 2 11 0,55 1 5 16 0,80 2 4 20 1,00 Totale 20 - La temperatura si è mantenuta sotto lo zero per 9 giorni (N 3 ). 4) La temperatura mediana è pari a 0 C, poiché osserviamo dalle frequenze cumulate relative che in corrispondenza di tale valore abbiamo il 55% dei casi, quindi l unità che bipartisce la distribuzione ha come modalità corrispondente la temperatura 0. Avendo utilizzato la mediana come misura di centralità calcoliamo lo scostamento semplice mediano per valutare la variabilità del fenomeno: S Me 0 + 3 + 2 + 0 + 1 + 1 + 2 + 2 + 1 + 2 + + 3 + 1 + 3 + 2 + 1 + 2 + 1 + 2 + 3 + 1 33 = = = 1,65 C 20 20

ESERCIZIO 4 1) Per calcolare la concentrazione abbiamo bisogno di determinare la frazione delle prime i unità statistiche e la frazione di carattere posseduto dalle prime i unità statistiche. La prima quantità (p i ) corrisponde in questo caso alla frequenza cumulata relativa (F i ) poiché stiamo considerando una distribuzione di frequenza; la seconda quantità (q i ) corrisponde invece all intensità del carattere nelle prime i unità del collettivo, ovvero quanta parte del carattere è posseduta dalle prime i unità del collettivo. Considerando la tabella dei dati avremo quindi: Ricarica ( ) n i p i (F i ) A i (x i n i ) q i p i - q i 10 44 0,11 440 0,02 0,09 25 112 0,39 3240 0,16 0,23 50 176 0,83 12040 0,60 0,23 100 41 0,93 16140 0,80 0,13 150 27 1,00 20190 1,00 0,00 Totale 400 - - - - Possiamo allora calcolare il rapporto di concentrazione R: k 1 (pi q i) i= 1 0,09 + 0,23 + 0,23 + 0,13 R = = = 0,3025 30% k 1 0,11 + 0,39 + 0,83 + 0,93 p i= 1 i Abbiamo quindi un indice R pari al 30% circa, che indica un basso livello di concentrazione. Possiamo dedurre la stessa informazione disegnando la Curva di Lorenz: q i 1 0.9 0.8 0.7 0.6 0.5 R 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 p i 2) Se il prossimo mese ogni studente ricarica sul proprio cellulare la metà di quello che ha ricaricato questo mese allora la concentrazione del carattere non cambia, poiché è invariante per trasformazioni del tipo ax (in questo caso 0,5 X).

ESERCIZIO 5 1) E necessario calcolare il contenuto medio di ferro nei campioni estratti dai terreni A e B: x = 2,5 15 + 10 18 + 27,5 19 + 50 12 + 65 6 + 85 14 84 = 34,76 Mg 2,5 8 + 10 8 + 27,5 10 + 50 25 + 65 15 + 85 6 x = = 43,19 Mg 72 Mediamente i campioni di terreno A presentano un contenuto di 34,76 mg, mentre i campioni di terreno B presentano un contenuto di 43,19 mg. A questo punto è necessario calcolare per ciascun terreno la deviazione standard: σ = (2,5 15) + (10 18) + (27,5 19) + (50 12) + (65 6) + (85 14) 84 = 848,31 σ = 848,31 = 29,13 Mg 34,76 = σ = (2,5 8) + (10 8) + (27,5 10) + (50 25) + (65 15) + (85 6) 72 = 601,43 σ = 601,43 = 24,12 Mg 43,19 = Con la media e la deviazione standard possiamo calcolare i coefficienti di variazione e confrontare la variabilità delle due distribuzioni: CV = 29,13 34,76 = 0,84 84% CV = 24,52 = 0,57 57% 43,19 Quindi è possibile concludere che il terreno A ha una maggiore variabilità della quantità di ferro rispetto al terreno B. 2) Per calcolare la concentrazione, avendo a disposizione l ammontare di carattere posseduto da ciascuna classe, assumiamo l equidistribuzione del carattere in ciascuna classe: quantità ferro n. campioni frequenze totale ferro frequenze p (mg) terreno A relative i (mg) relative q i 0-5 15 0,18 0,18 20 0,01 0,01 5-15 18 0,21 0,39 108 0,04 0,05 15-40 19 0,23 0,62 304 0,11 0,16 40-60 12 0,14 0,76 600 0,22 0,38 60-70 6 0,07 0,83 390 0,15 0,53 70-100 14 0,17 1,00 1260 0,47 1,00 Totale 84 1,00 2682 1,00

quantità ferro n. campioni frequenze totale ferro frequenze p (mg) terreno B relative i (mg) relative q i 0-5 8 0,11 0,11 40 0,01 0,01 5-15 8 0,11 0,22 112 0,04 0,05 15-40 10 0,14 0,36 400 0,13 0,19 40-60 25 0,35 0,71 1025 0,34 0,53 60-70 15 0,21 0,92 975 0,33 0,86 70-100 6 0,08 1,00 426 0,14 1,00 Totale 72 1,00 2978 1,00 Per calcolare l indice R applichiamo la formula: k-1 i=0 ( )( ) R 1- q + q p - p i+1 i i+1 i Terreno A Terreno B 0,001 0,001 0,012 0,007 0,047 0,033 0,078 0,248 0,065 0,289 0,255 R 0,155 R 0,459 0,541 0,733 0,267 Confrontando l indice R nel primo e nel secondo terreno si deduce che la concentrazione di ferro del terreno A è maggiore (54,1% vs 26,7%).