Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 7 home - indice In base agli arrotondamenti effettuati nei calcoli, si possono riscontrare piccole differenze nei risultati finali. 7.1 a. Le distribuzioni relative condizionate dell Età rispetto all Abitudine al fumo sono mostrate nella seguente tabella: Distribuzioni percentuali Possesso TV Fax Stereo PC Cellulare No 1, 81,2 3, 56,1 6,2 Si 99, 18,8 97, 43,9 39,8 Totale 1, 1, 1, 1, 1, b. Carattere Moda Età 39 Stato civile Non sposato Diploma di Grado di istruzione scuola superiore c. Il valore dell indice Lambda è pari a,15 quindi molto basso. Tuttavia è da notare che l uso dell indice Lambda non è del tutto appropriato poiché la variabile Età presenta un numero molto elevato di valori distinti. In questo caso sarebbe più appropriato suddividere l età in classi e successivamente costruire la tabella di frequenze. d. Carattere 9-esimo percentile Reddito 143 7.2 a. anno immatricolazione freq. 7 28 71 27 72 28 73 4 74 26 75 3 76 34 77 28 78 36 79 29 8 27 81 28 82 3 totale 391 Nazione produttrice freq. Italia 244 Europa 68 Giappone 79 totale 391 L anno d immatricolazione più frequente è il 1973. b. L indice di correlazione lineare tra le variabili CV e Consumo è -,775. Il valore ottenuto indica che tra le due variabili sussiste un elevato grado di associazione lineare. Il segno negativo dell indice è spiegabile se si pensa al significato della variabile Consumo: a valori alti corrisponde un basso consumo; pertanto, a valori alti di Consumo (ossia bassi consumi) sono più frequentemente associati valori bassi di CV (del numero di cavalli).
c. No, come si può vedere dalla seguente distribuzione: classi peso freq. <=8 132 >8 259 totale 391 d. Il grafico a barre della distribuzione dell Anno d immatricolazione è il seguente: freq. 45 4 35 3 25 2 15 1 5 7 71 72 73 74 75 76 77 78 79 8 81 82 anno immatricolazione e. Considerando l Accelerazione dipendente dalla Nazione produttrice, dall output di Spss si ottiene il valore di Eta=,27 il cui quadrato corrisponde al valore del rapporto di correlazione pari a,73. Questo valore ci indica assenza di dipendenza. 7.3 a. Le distribuzioni di frequenze delle variabili Sesso e Facoltà sono mostrate nelle seguenti tabelle: Sesso Freq. Femmina 469 Maschi 631 totale 11 a. Dalla prima distribuzione si evince che le femmine laureate sono meno della metà dei maschi; b. Dalla seconda distribuzione si osserva che i laureati più frequenti sono quelli di Agraria. b. Dalla distribuzione di frequenze dello Stipendio iniziale si può osservare che la classe più frequente è quella oltre 299. Tuttavia, notando che le classi hanno diversa ampiezza, per un corretto confronto è necessario considerare le densità. Chiudiamo l ultima classe al valore più grande osservato, 655. Dal calcolo delle densità si evince che, anche se di poco rispetto alla classe che la precede, la classe con maggiore densità di frequenza è la penultima. classi freq. ampiezza densità fino a 25 242 25,118 Da 251 a 258 297 53,56 Da 2581 a 299 231 41,563 Oltre 299 33 356,93 totale 11 Facoltà freq. Agraria 415 Architettura 1 Economia 322 Ingegneria Civile 55 Ingegneria Meccanica 281 Lettere Classiche 2 Magistero 13 Scienze ambientali 2 totale 11
c. I seguenti grafici mostrano rispettivamente la distribuzione rispetto alla Facoltà e al Sesso. 45 4 35 3 freq. 25 2 15 1 5 Scienze ambientali Magistero Lettere Classiche Ingegneria Meccanica Ingegneria Civile Economia Architettura Agraria Facoltà Sesso 43% 57% Femmina Maschi d. Il valore dell indice Chi-quadrato è pari a 212,2 mentre il valore di Lambda è pari a,294 quando il Sesso è visto dipendere dalla Facoltà e,134 quando è la Facoltà a dipendere dal Sesso. In generale si può dire che il grado di associazione tra i due caratteri è molto basso. e. Dall output di Spss, quando lo Stipendio è dipendente dal Sesso, si ottiene Eta=,16 ossia un rapporto di correlazione pari a,26. Ciò indica che il livello dello Stipendio iniziale non dipende dal Sesso. 7.4 a. L indice di correlazione lineare tra Bolletta e Reddito è uguale a,21, pertanto tra le due variabili sussiste una debole relazione lineare. b. La percentuale di coloro che al mese mediamente stanno più di 18 minuti al telefono è del 67,6%. c. Coloro che utilizzano il cellulare prevalentemente per lavoro, ossia coloro che più della metà delle telefonate è per motivi di lavoro, è pari al 2,8%.
7.5 a. I valori della media e della mediana del Reddito sono rispettivamente: 69,47 e 45. Tra questi due valori c è molta differenza. b. Tra gli sposati il reddito medio è 69,68 mentre tra i non sposati è 69,27. Non sembra esserci grande differenza. c. Considerando la variabile Età, i valori della media, della mediana e della varianza sono rispettivamente pari a: 42,7, 41 e 15,88. d. Considerando la variabile Impiego, i valori della media, della mediana e della deviazione standard sono rispettivamente pari a: 1,57, 8 e 9,72. e. L indice Lambda dove il Possesso di cellulare è posto dipendente dal Grado di istruzione è pari a,116. Questo valore basso dell indice indica assenza di dipendenza tra i due caratteri. 7.6 a. Nella seguente tabella sono mostrati i valori della media e della mediana rispetto alle variabili Consumo, Motore, CV, Peso e Accel. Consumo Motore CV Peso Accel Media 18,53 194,13 83,24 99,69 15,67 Mediana 18, 151, 72, 933, 16, b. Nella seguente tabella sono mostrati i valori della varianza e della deviazione standard rispetto alle variabili considerate nel punto precedente: Consumo Motore CV Peso Accel Varianza 6,3 1919,33 1461,47 79292,2 7,6 Deviazione Standard 7,77 14,5 38,23 281,59 2,76 c. Considerando i valori dei Coefficienti di variazione possiamo osservare che tra le variabili considerate Accel è quella meno variabile mentre Motore è quella più variabile. Consumo Motore CV Peso Accel Coeff.Var.,42,54,46,28,18 d. Il Consumo medio differisce rispetto al paese produttore. In particolare, le macchine italiane mostrando un valore medio del Consumo più basso di quello dell Europa e del Giappone consumano mediamente di più. Consumo Origine medio Italia 15,14 Europa 22,62 Giappone 25,48 7.7 a. La matrice di correlazione tra le quattro variabili considerate è la seguente: ETÀ REDDITO IMPIEGO NFAM ETÀ 1 REDDITO,334 1 IMPIEGO,619,579 1
NFAM -,242 -,66 -,148 1 b. Il valore quasi nullo dell indice di correlazione lineare (-,66) tra il Reddito e il Numero di componenti della famiglia (Nfam) indica assenza di relazione lineare tra le due variabili. 7.8 a. La seguente tabella mostra la distribuzione di frequenze doppia tra Stato Civile e Possesso di Fax e le corrispondenti distribuzioni percentuali di riga e colonna: Tavola di contingenza Stato civile * Possiede fax Possiede faxtotale No Sì Non sposato 2636 588 3224 % riga 81,8 18,2 1, Stato civile % colonna 5,7 48,9 5,4 Sposato 2562 614 3176 % riga 8,7 19,3 1, % colonna 49,3 51,1 49,6 Totale 5198 122 64 % riga 81,2 18,8 1, % colonna 1, 1, 1, b. Il valore del Chi-quadrato è 1,256, del Phi di Pearson,14 e della V di Cramér,14. c. Dal valore dei tre indici possiamo concludere che i due caratteri sono indipendenti. 7.9 a. La seguente tabella mostra la distribuzione di frequenze tra Grado di Istruzione e Possesso di PC e le corrispondenti distribuzioni percentuali di riga e colonna: PC ISTRUZ 1 Totale Scuola superiore non completata 1123 267 139 %riga 8,79% 19,21% 1,% %colonna 31,29% 9,5% 21,72% Diploma di scuola superiore 1237 699 1936 63,89% 36,11% 1,% 34,47% 24,87% 3,25% Frequenza all'università 688 672 136 5,59% 49,41% 1,% 19,17% 23,91% 21,25% Laurea universitaria 477 878 1355 35,2% 64,8% 1,% 13,29% 31,23% 21,17% Specializzazione post-universitaria 64 295 359 17,83% 82,17% 1,% 1,78% 1,49% 5,61% Totale 3589 2811 64 %colonna 56,8% 43,92% 1,% %riga 1,% 1,% 1,% b. Il valore degli indici Chi-quadrato, Phi di Pearson e V di Cramér sono rispettivamente: 862,32;,367;,367. c. Dai valori mostrati dai tre indici si può concludere che tra i due caratteri sussiste un moderato grado di associazione
7.1 a. Il valore dell indice Eta tra i caratteri Anni di permanenza e Soddisfazione nel lavoro è pari a,486 e quindi il rapporto di correlazione è,236. Possiamo concludere che gli anni di permanenza dipendono debolmente dal grado di soddisfazione. b. Tra i due caratteri Possesso di Stereo e Possesso di TV il valore dell indice V di Cramér è,352. Sussiste pertanto una moderata associazione tra i due caratteri. 7.11 a. La seguente tabella mostra le correlazioni tra le variabili: CONSUMO MOTORE CV PESO ACCEL CONSUMO 1 MOTORE -,841 1 CV -,77542,898453 1 PESO -,82985,933887,862893 1 ACCEL,41368 -,54895 -,69628 -,42161 1 Si può notare una forte correlazione negativa tra le coppie di variabili Consumo-Motore, Consumo-CV e Consumo-Peso; un forte correlazione positiva tra le coppie di variabili Peso-Motore, CV-Motore e Peso-CV. b. Dai seguenti grafici di dispersione si può osservare il diverso grado di associazione lineare già indicato dai corrispondenti valori del coefficiente di correlazione. Motore 5 45 4 35 3 25 2 15 1 5 1 2 3 4 5 Consumo 3 25 Accellerazione 2 15 1 5 1 2 3 4 5 Consumo
7.12 a. Dalla seguente matrice di correlazione possiamo notare che la correlazione tra le coppie di variabili è sempre positiva. Sussiste una moderata correlazione positiva tra l uso del cellulare per motivi di lavoro (LAVORO) e il tempo medio di uso del cellulare (MINUTI). In sostanza, più si utilizza il cellulare per lavoro e maggiore sarà l uso complessivo del cellulare. MINUTI BOLLETTA LAVORO REDDITO MINUTI 1 BOLLETTA,477728 1 LAVORO,347331,54899 1 REDDITO,332616,212965,231588 1 b. No. Dalla matrice di correlazione si osserva una debole correlazione positiva tra la bolletta telefonica (BOLLETTA) e l uso del cellulare per lavoro (LAVORO). c. I grafici di dispersione tra Bolletta-Reddito e Bolletta-Lavoro sono i seguenti: 12, 1, Reddito 8, 6, 4, 2,,, 2, 4, 6, 8, 1, 12, 14, Bolletta 7. 6. 5. Lavoro 4. 3. 2. 1... 2. 4. 6. 8. 1. 12. 14. Bolletta