Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill



Documenti analoghi
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Esempi di confronti grafici

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Capitolo 11 Test chi-quadro

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Metodi statistici per le ricerche di mercato

Stesso valore medio per distribuzioni diverse

Misure di dispersione (o di variabilità)

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Esercitazioni di Statistica

Prova scritta di Statistica

Fonti e strumenti statistici per la comunicazione

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Compiti tematici dai capitoli 2,3,4

Esercitazioni di statistica

STATISTICA. Esonero 8 novembre 2014 Soluzione. Quesito 1.

Matematica Lezione 22

ESERCIZI STATISTICA DESCRITTIVA

Dispense Associazione PRELIMINARY DRAFT

Materiale didattico per il corso di Statistica I Seconda esercitazione SOLUZIONI

Metodi statistici per le ricerche di mercato Soluzione degli Esercizi 1-8

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Distribuzioni Doppie e Relazioni tra Variabili Esercitazione n 03

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

STATISTICA DESCRITTIVA I

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Statistica di base (Canale E-M) Istruzioni (da leggere bene prima dell esame):

Analisi bivariata. Il caso di caratteri qualitativi

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica Descrittiva Soluzioni 8. Dipendenza

Metodi statistici per le ricerche di mercato

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Esercitazione III Soluzione

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Esercitazione di Statistica Indici di associazione

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Analisi economica NUTS (regioni) Europee

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 6-16/10/2015

normopeso <=25 sovrappeso obesità I obesità II obesità III >=40

ESERCIZI DI STATISTICA SOCIALE

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

2. Variabilità mediante il confronto di valori caratteristici della

REGRESSIONE E CORRELAZIONE

Corso di Statistica. Variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Relazioni Statistiche

I laureati scuole di provenienza, durata degli studi, votazioni ed età

Lo scarto quadratico medio è s = s 2 2,15. c) Le confezioni con peso inferiore a 500g sono 18, quindi in percentuale sono 18 = 0,72 = 72%.

docente: J. Mortera/P. Vicard Nome

Analisi bivariata Il caso di caratteri qualitativi

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

Istituzioni di Statistica

Statistiche e relazioni

STATISTICHE DESCRITTIVE Parte II

Copyright Esselibri S.p.A.

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

7. STATISTICA DESCRITTIVA

X \Y Liceo Classico Liceo Scientifico Altro le distribuzioni di frequenza marginali relative, f i. e f.

Corso di Statistica. Distribuzioni doppie Relazioni tra due variabili. Prof.ssa T. Laureti a.a

Teoria e tecniche dei test. Concetti di base

Esercizio 1. Si rilevano le variabili età, altezza e peso di 18 pazienti:

materiale didattico II incontro

STATISTICHE DESCRITTIVE

Daniela Tondini

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia

Analisi dell associazione tra due caratteri

Metodi statistici per le ricerche di mercato

Y M F Calcolare X e darne un adeguata interpretazione;

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Variabilità e Concentrazione Esercitazione n 02

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

Corso di Laurea in MQEGA

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Grafico 1: LAUREATI E DIPLOMATI ANNO 2001 PER ETA' E SESSO < = > = 30

Introduzione alla statistica con Excel

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

ESERCIZI SULLE TABELLE DI CONTINGENZA

Istituzioni di Statistica e Statistica Economica

ESEMPI DI DOMANDE PER LA PROVA SCRITTA DI STATISTICA SOCIALE

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Modelli e procedure per l educazione degli adulti

SCHEDA DIDATTICA N 7

Transcript:

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli, si possono riscontrare piccole differenze nei risultati finali. 7.1 a. Le distribuzioni relative condizionate dell Età rispetto all Abitudine al fumo sono mostrate nella seguente tabella: Distribuzioni percentuali Possesso TV Fax Stereo PC Cellulare No 1, 81,2 3, 56,1 6,2 Si 99, 18,8 97, 43,9 39,8 Totale 1, 1, 1, 1, 1, b. Carattere Moda Età 39 Stato civile Non sposato Diploma di Grado di istruzione scuola superiore c. Il valore dell indice Lambda è pari a,15 quindi molto basso. Tuttavia è da notare che l uso dell indice Lambda non è del tutto appropriato poiché la variabile Età presenta un numero molto elevato di valori distinti. In questo caso sarebbe più appropriato suddividere l età in classi e successivamente costruire la tabella di frequenze. d. Carattere 9-esimo percentile Reddito 143 7.2 a. anno immatricolazione freq. 7 28 71 27 72 28 73 4 74 26 75 3 76 34 77 28 78 36 79 29 8 27 81 28 82 3 totale 391 Nazione produttrice freq. Italia 244 Europa 68 Giappone 79 totale 391 L anno d immatricolazione più frequente è il 1973. b. L indice di correlazione lineare tra le variabili CV e Consumo è -,775. Il valore ottenuto indica che tra le due variabili sussiste un elevato grado di associazione lineare. Il segno negativo dell indice è spiegabile se si pensa al significato della variabile Consumo: a valori alti corrisponde un basso consumo; pertanto, a valori alti di Consumo (ossia bassi consumi) sono più frequentemente associati valori bassi di CV (del numero di cavalli).

c. No, come si può vedere dalla seguente distribuzione: classi peso freq. <=8 132 >8 259 totale 391 d. Il grafico a barre della distribuzione dell Anno d immatricolazione è il seguente: freq. 45 4 35 3 25 2 15 1 5 7 71 72 73 74 75 76 77 78 79 8 81 82 anno immatricolazione e. Considerando l Accelerazione dipendente dalla Nazione produttrice, dall output di Spss si ottiene il valore di Eta=,27 il cui quadrato corrisponde al valore del rapporto di correlazione pari a,73. Questo valore ci indica assenza di dipendenza. 7.3 a. Le distribuzioni di frequenze delle variabili Sesso e Facoltà sono mostrate nelle seguenti tabelle: Sesso Freq. Femmina 469 Maschi 631 totale 11 a. Dalla prima distribuzione si evince che le femmine laureate sono meno della metà dei maschi; b. Dalla seconda distribuzione si osserva che i laureati più frequenti sono quelli di Agraria. b. Dalla distribuzione di frequenze dello Stipendio iniziale si può osservare che la classe più frequente è quella oltre 299. Tuttavia, notando che le classi hanno diversa ampiezza, per un corretto confronto è necessario considerare le densità. Chiudiamo l ultima classe al valore più grande osservato, 655. Dal calcolo delle densità si evince che, anche se di poco rispetto alla classe che la precede, la classe con maggiore densità di frequenza è la penultima. classi freq. ampiezza densità fino a 25 242 25,118 Da 251 a 258 297 53,56 Da 2581 a 299 231 41,563 Oltre 299 33 356,93 totale 11 Facoltà freq. Agraria 415 Architettura 1 Economia 322 Ingegneria Civile 55 Ingegneria Meccanica 281 Lettere Classiche 2 Magistero 13 Scienze ambientali 2 totale 11

c. I seguenti grafici mostrano rispettivamente la distribuzione rispetto alla Facoltà e al Sesso. 45 4 35 3 freq. 25 2 15 1 5 Scienze ambientali Magistero Lettere Classiche Ingegneria Meccanica Ingegneria Civile Economia Architettura Agraria Facoltà Sesso 43% 57% Femmina Maschi d. Il valore dell indice Chi-quadrato è pari a 212,2 mentre il valore di Lambda è pari a,294 quando il Sesso è visto dipendere dalla Facoltà e,134 quando è la Facoltà a dipendere dal Sesso. In generale si può dire che il grado di associazione tra i due caratteri è molto basso. e. Dall output di Spss, quando lo Stipendio è dipendente dal Sesso, si ottiene Eta=,16 ossia un rapporto di correlazione pari a,26. Ciò indica che il livello dello Stipendio iniziale non dipende dal Sesso. 7.4 a. L indice di correlazione lineare tra Bolletta e Reddito è uguale a,21, pertanto tra le due variabili sussiste una debole relazione lineare. b. La percentuale di coloro che al mese mediamente stanno più di 18 minuti al telefono è del 67,6%. c. Coloro che utilizzano il cellulare prevalentemente per lavoro, ossia coloro che più della metà delle telefonate è per motivi di lavoro, è pari al 2,8%.

7.5 a. I valori della media e della mediana del Reddito sono rispettivamente: 69,47 e 45. Tra questi due valori c è molta differenza. b. Tra gli sposati il reddito medio è 69,68 mentre tra i non sposati è 69,27. Non sembra esserci grande differenza. c. Considerando la variabile Età, i valori della media, della mediana e della varianza sono rispettivamente pari a: 42,7, 41 e 15,88. d. Considerando la variabile Impiego, i valori della media, della mediana e della deviazione standard sono rispettivamente pari a: 1,57, 8 e 9,72. e. L indice Lambda dove il Possesso di cellulare è posto dipendente dal Grado di istruzione è pari a,116. Questo valore basso dell indice indica assenza di dipendenza tra i due caratteri. 7.6 a. Nella seguente tabella sono mostrati i valori della media e della mediana rispetto alle variabili Consumo, Motore, CV, Peso e Accel. Consumo Motore CV Peso Accel Media 18,53 194,13 83,24 99,69 15,67 Mediana 18, 151, 72, 933, 16, b. Nella seguente tabella sono mostrati i valori della varianza e della deviazione standard rispetto alle variabili considerate nel punto precedente: Consumo Motore CV Peso Accel Varianza 6,3 1919,33 1461,47 79292,2 7,6 Deviazione Standard 7,77 14,5 38,23 281,59 2,76 c. Considerando i valori dei Coefficienti di variazione possiamo osservare che tra le variabili considerate Accel è quella meno variabile mentre Motore è quella più variabile. Consumo Motore CV Peso Accel Coeff.Var.,42,54,46,28,18 d. Il Consumo medio differisce rispetto al paese produttore. In particolare, le macchine italiane mostrando un valore medio del Consumo più basso di quello dell Europa e del Giappone consumano mediamente di più. Consumo Origine medio Italia 15,14 Europa 22,62 Giappone 25,48 7.7 a. La matrice di correlazione tra le quattro variabili considerate è la seguente: ETÀ REDDITO IMPIEGO NFAM ETÀ 1 REDDITO,334 1 IMPIEGO,619,579 1

NFAM -,242 -,66 -,148 1 b. Il valore quasi nullo dell indice di correlazione lineare (-,66) tra il Reddito e il Numero di componenti della famiglia (Nfam) indica assenza di relazione lineare tra le due variabili. 7.8 a. La seguente tabella mostra la distribuzione di frequenze doppia tra Stato Civile e Possesso di Fax e le corrispondenti distribuzioni percentuali di riga e colonna: Tavola di contingenza Stato civile * Possiede fax Possiede faxtotale No Sì Non sposato 2636 588 3224 % riga 81,8 18,2 1, Stato civile % colonna 5,7 48,9 5,4 Sposato 2562 614 3176 % riga 8,7 19,3 1, % colonna 49,3 51,1 49,6 Totale 5198 122 64 % riga 81,2 18,8 1, % colonna 1, 1, 1, b. Il valore del Chi-quadrato è 1,256, del Phi di Pearson,14 e della V di Cramér,14. c. Dal valore dei tre indici possiamo concludere che i due caratteri sono indipendenti. 7.9 a. La seguente tabella mostra la distribuzione di frequenze tra Grado di Istruzione e Possesso di PC e le corrispondenti distribuzioni percentuali di riga e colonna: PC ISTRUZ 1 Totale Scuola superiore non completata 1123 267 139 %riga 8,79% 19,21% 1,% %colonna 31,29% 9,5% 21,72% Diploma di scuola superiore 1237 699 1936 63,89% 36,11% 1,% 34,47% 24,87% 3,25% Frequenza all'università 688 672 136 5,59% 49,41% 1,% 19,17% 23,91% 21,25% Laurea universitaria 477 878 1355 35,2% 64,8% 1,% 13,29% 31,23% 21,17% Specializzazione post-universitaria 64 295 359 17,83% 82,17% 1,% 1,78% 1,49% 5,61% Totale 3589 2811 64 %colonna 56,8% 43,92% 1,% %riga 1,% 1,% 1,% b. Il valore degli indici Chi-quadrato, Phi di Pearson e V di Cramér sono rispettivamente: 862,32;,367;,367. c. Dai valori mostrati dai tre indici si può concludere che tra i due caratteri sussiste un moderato grado di associazione

7.1 a. Il valore dell indice Eta tra i caratteri Anni di permanenza e Soddisfazione nel lavoro è pari a,486 e quindi il rapporto di correlazione è,236. Possiamo concludere che gli anni di permanenza dipendono debolmente dal grado di soddisfazione. b. Tra i due caratteri Possesso di Stereo e Possesso di TV il valore dell indice V di Cramér è,352. Sussiste pertanto una moderata associazione tra i due caratteri. 7.11 a. La seguente tabella mostra le correlazioni tra le variabili: CONSUMO MOTORE CV PESO ACCEL CONSUMO 1 MOTORE -,841 1 CV -,77542,898453 1 PESO -,82985,933887,862893 1 ACCEL,41368 -,54895 -,69628 -,42161 1 Si può notare una forte correlazione negativa tra le coppie di variabili Consumo-Motore, Consumo-CV e Consumo-Peso; un forte correlazione positiva tra le coppie di variabili Peso-Motore, CV-Motore e Peso-CV. b. Dai seguenti grafici di dispersione si può osservare il diverso grado di associazione lineare già indicato dai corrispondenti valori del coefficiente di correlazione. Motore 5 45 4 35 3 25 2 15 1 5 1 2 3 4 5 Consumo 3 25 Accellerazione 2 15 1 5 1 2 3 4 5 Consumo

7.12 a. Dalla seguente matrice di correlazione possiamo notare che la correlazione tra le coppie di variabili è sempre positiva. Sussiste una moderata correlazione positiva tra l uso del cellulare per motivi di lavoro (LAVORO) e il tempo medio di uso del cellulare (MINUTI). In sostanza, più si utilizza il cellulare per lavoro e maggiore sarà l uso complessivo del cellulare. MINUTI BOLLETTA LAVORO REDDITO MINUTI 1 BOLLETTA,477728 1 LAVORO,347331,54899 1 REDDITO,332616,212965,231588 1 b. No. Dalla matrice di correlazione si osserva una debole correlazione positiva tra la bolletta telefonica (BOLLETTA) e l uso del cellulare per lavoro (LAVORO). c. I grafici di dispersione tra Bolletta-Reddito e Bolletta-Lavoro sono i seguenti: 12, 1, Reddito 8, 6, 4, 2,,, 2, 4, 6, 8, 1, 12, 14, Bolletta 7. 6. 5. Lavoro 4. 3. 2. 1... 2. 4. 6. 8. 1. 12. 14. Bolletta