Captolo 2 Dat e Tabelle
La Descrzone della Popolazone La descrzone d una popolazone passa attraverso due fas: 1. la formazone de dat statstc 2. la sntes de dat La formazone del dato statstco prevede: () l osservazone del fenomeno oggetto d studo sulle untà del collettvo statstco; () l annotazone sstematca, untà per untà, della modaltà rlevata. Il processo d rlevazone de dat sulle untà statstche s realzza usualmente tramte la complazone d questonar. Per ogn untà statstca s dspone, n generale, d un ngente mole d nformazon che occorre organzzare sstematcamente al fne d renderne agevole l elaborazone. Data Set Inseme de dat relatv a caratter rlevat su una stessa popolazone. 2
Un data set può essere assmlato ad una tabella, chamata Matrce de Dat, formata da n rghe e r colonne, n cu: (a) ogn rga rporta le nformazon alfanumerche relatve alla sngola untà statstca; (b) ogn colonna rporta valor de caratter osservat sulle dverse untà statstche; (c) ogn cella contene l valore d una sngola varable rlevato su una determnata untà statstca Caratter X 1 X 2 X j X r u 1 x 11 x 12 x 1j x 1r Untà Statstche u 2 x 21 x 22 x 2j x 2r..................... u x 1 x 2 x j x r..................... Matrce de Dat X ( n r ) = { x } j u n x n1 x n2 x nj x nr Se r = 1 Anals Descrttva Unvarata Se r = 2 Anals Descrttva Bvarata 3
Esempo 2.1 Matrce de Dat Indagne sulla Struttura e Produzone delle Azende Agrcole n Calabra Caratterstche dell ndagne Natura della rlevazone: camponara Untà statstche: azende agrcole della Calabra Numero d azende agrcole rlevate: 2984 Varabl rlevate: 200 Natura della varabl: qualtatve e quanttatve Varabl Presentate 1. Comune e Provnca n cu s trova l azenda 2. Comune d resdenza del ttolare dell azenda 3. Estensone (n ettar) della superfce d propretà dell azenda 4. Estensone della superfce concessa n afftto all azenda 5. Estensone della superfce concessa a ttolo gratuto all azenda 6. Estensone totale della superfce dell azenda 7. Estensone della SAU (Superfce Agrcola Utlzzata) totale dell azenda 8. Estensone della SAU concessa n afftto all azenda 9. Estensone della SAU concessa a ttolo gratuto all azenda 10. Estensone della SAU nvestta a semnatv 11. Estensone della SAU destnata a coltvazon 4
5
6
Problem La presentazone delle nformazone sotto forma d matrce de dat non consente d far luce n manera mmedata su alcun aspett delle varabl n esame. Provamo, ad esempo, a rspondere alle seguent domande: Qual è la forma d conduzone pù frequente? Qual è la percentuale d azende che hanno una superfce totale par al pù a 50 ettar e s presentano come dtte ndvdual? Tra le azende ndvdual, qual è la percentuale d quelle che hanno una superfce par al pù a 50 ettar? Per dare una rsposta occorre organzzare dat n manera pù sntetca COME?!?! 7
Accorpando n class omogenee le dverse modaltà del carattere e assocando ad ognuna d essa l numero d volte che è stata rlevata sulle untà statstche 8
Lo Spoglo de Dat L operazone d accorpamento de cas dentc corrsponde ad una fase ben precsa dell ndagne statstca. Tale fase è nota come Classfcazone o Spoglo de Dat Per semplctà, consderamo l caso n cu s è nteressat all anals d un solo carattere ( r = 1). Allora, è facle renders conto che lo spoglo de dat rappresenta l prmo processo d sntes de dat perché consente d passare da un elenco grezzo d modaltà ad un prospetto organzzato. 9
Operatvamente lo spoglo de dat s realzza n due pass: 1. la predsposzone d una lsta esaustva delle dverse modaltà del carattere n esame 2. l conteggo delle untà che presentano la medesma modaltà Sempre nel caso d un solo carattere n esame, l rsultato dell operazone d spoglo è una tabella costtuta da due colonne e da tante rghe quante sono le dverse modaltà del carattere n esame. In partcolare: sulla prma colonna s rporteranno le k dverse modaltà del carattere, x 1, x2,..., x,..., xk, x x j ; sulla seconda colonna s rporteranno, n corrspondenza d ogn modaltà, l numero d volte che questa s è presentata nel collettvo. Il prospetto ottenuto è detto Dstrbuzone d Frequenze 10
Esempo 2.2 Dstrbuzone d Frequenze Indagne sulla Struttura e Produzone delle Azende Agrcole n Calabra Provamo a dare una rsposta al prmo questo che c samo post. Lo spoglo de dat relatvo alla varable qualtatva Forma d Conduzone dell Azenda Agrcola, ha dato luogo alla seguente dstrbuzone d frequenze Forma d Conduzone Dell Azenda Numero Azende Colona parzara appoderata 10 Con salarat 294 Dretta con manodopera extrafamlare prevalente Dretta con manodopera famlare prevalente Dretta con solo manodopera famlare 515 393 1772 Totale 2984 Tabella 2.1 11
La dstrbuzone delle frequenze ha permesso d sntetzzare un elenco d 2984 dat (le modaltà per ogn sngola azenda, x 1, x2, x,..., x2854 facle lettura...., ) n una tabella d rdotte dmenson e d Tuttava, ogn processo d sntes presenta un prezzo da pagare n termn d perdta d nformazon. Dalla tabella non è pù possble rsalre all azenda su cu è stata rlevata una determnata modaltà!!! 12
Esempo 2.3 Dstrbuzone d Frequenze Su un collettvo statstco costtuto da 50 famgle è stato rlevato l carattere Numero d Fgl, ottenendo l seguente elenco grezzo d modaltà: 3 1 3 2 2 0 2 1 5 4 2 2 3 1 1 2 2 0 2 1 4 2 1 2 1 4 3 2 1 3 0 4 3 2 0 3 2 2 1 2 3 1 0 2 2 1 2 2 1 3 La dstrbuzone d frequenze è la seguente: Dstrbuzone semplce per untà o elenco grezzo d modaltà Modaltà Dstnte Numero Numero d fgl d famgle 0 5 1 12 2 19 3 9 4 4 5 1 Totale 50 Tabella 2.2 Frequenze Assolute Numerostà del collettvo Una dstrbuzone d frequenze ndca come le untà del collettvo statstco s dstrbuscono tra le dverse modaltà del carattere. 13
In generale, una dstrbuzone d frequenze per un carattere con k modaltà dstnte s presenta nella forma: -esma modaltà X n n n x 1 1 x 2 2 x x n... k Totale n n k -esma frequenza assoluta n = k n = 1 Nel proseguo ndcheremo con: x la -esma modaltà del carattere, =1,2,,k; n la -esma frequenza assoluta, =1,2,,k. La frequenza assoluta n ndca equvalentemente: l numero d volte che la modaltà x è stata rlevata sul collettvo statstco formato da n untà; l numero d untà statstche che presentano le stessa modaltà x. 14
Dstrbuzone d frequenze S defnsce dstrbuzone d frequenze del carattere X la successone del numero d untà statstche che s hanno n corrspondenza delle dverse modaltà del carattere, ovvero l nseme costtuto delle coppe: { x,n ),( x,n ),...,( x,n )} ( 1 1 2 2 k k 15
Dstrbuzon n class d modaltà Nel caso n cu le modaltà d una varable sano molto numerose, può essere utle determnare class d modaltà a cu assegnare le untà Tale procedmento consente d effettuare un ulterore sntes de dat Generalmente, alla suddvsone n class d modaltà s rcorre quando l carattere è quanttatvo: contnuo dscreto con numerose modaltà Nella costruzone delle class occorre atteners ad alcun aspett: 1. nessuna classe deve essere vuota; 2. le class devono essere contgue, dsgunte ed esaustve; 3. devono avere possblmente la stessa ampezza; 4. l numero d class deve essere tale da consentre un adeguata sntes de dat senza comportare una eccessva perdta d nformazon; 16
Esempo 2.4 Class d Modaltà per un Carattere Contnuo Su un collettvo statstco formato da 200 ndvdu è stato rlevato l carattere contnuo Altezza (espresso n cm.), ottenendo l seguente elenco grezzo d modaltà: 81,46 73,02 87,89 96,97 96,54 98,75 70,43 82,22 95,90 74,16 199,43 200,17 190,08 196,08 204,52 209,08 208,04 196,49 195,45 194,70 183,18 174,61 168,53 169,05 175,86 167,22 144,52 161,84 146,02 128,10 182,67 159,04 139,88 197,58 207,99 166,99 149,72 140,62 139,87 173,42 176,50 183,91 158,27 121,00 157,38 176,95 187,96 177,16 164,94 171,75 203,27 198,59 200,71 199,29 191,21 195,01 207,38 201,73 205,98 196,20 165,69 117,11 184,28 147,32 154,99 141,96 200,60 157,27 140,33 144,39 208,43 128,65 181,60 145,80 141,88 127,86 199,38 199,03 165,53 190,84 165,00 161,63 166,90 163,46 174,68 185,09 185,24 186,48 158,18 142,17 128,92 119,61 155,29 178,83 168,23 147,93 112,49 128,74 163,55 121,86 77,35 71,36 70,97 74,92 76,59 70,51 78,55 80,29 86,61 80,72 176,85 179,01 165,26 171,93 213,43 216,30 181,64 154,06 177,58 162,62 163,94 166,20 177,60 165,01 128,75 201,33 162,90 170,66 156,95 201,21 199,69 147,06 155,00 167,72 179,37 156,51 208,00 197,84 158,19 212,91 188,48 165,99 215,25 183,18 129,08 116,86 153,66 133,90 189,07 174,83 192,04 208,89 203,64 198,20 203,88 191,26 208,52 190,57 196,71 209,99 192,21 138,04 147,00 172,53 169,92 167,42 139,43 150,04 139,08 196,55 149,78 178,11 181,38 194,63 157,36 163,88 195,21 167,63 162,88 119,97 155,16 144,50 144,12 123,98 188,78 166,56 188,45 186,68 169,16 172,41 126,57 146,26 161,36 114,21 123,79 190,42 184,53 170,87 107,27 169,40 Ampezza classe Estremo Superore Classe Estremo Inferore Classe a = x + 1 x 17
Dstrbuzon n class d ampezza dversa Classe Ampezza n x x + 1 a 70-100 20 30 100-120 7 20 120-140 18 20 140-170 65 30 170-180 21 10 180-200 45 20 200-220 24 20 Totale 200 Tabella 2.3 Per un carattere contnuo suddvso n class, l ampezza della classe rappresenta l numero d ntervall untar che rcadono nella classe medesma. Dstrbuzon n class d uguale ampezza Classe Ampezza n x x + 1 a 70-85 14 15 85-100 6 15 100-115 3 15 115-130 16 15 130-145 15 15 145-160 25 15 160-175 41 15 175-190 29 15 190-205 37 15 205-220 14 15 Totale 200 Tabella 2.4 18
Notazone Nello stablre gl estrem della classe occorre tenere presente che ognuna delle determnazone osservate del carattere deve essere compresa n una sola classe. Nel caso d caratter contnu s rende allora necessaro ncludere nella stessa classe uno solo de due estrem dell ntervallo. Notazone x x + 1 x, + ] ( x 1 x x + 1 x, + ) [ x 1 Estremo Inferore Estremo Superore Ampezza Classe Escluso Incluso x+ 1 x Incluso Escluso x+ 1 x Tuttava, da un punto d vsta teorco, per un carattere contnuo ndcare specfcamente quale estremo consderare è d scarsa rlevanza. 19
Esempo 2.5 Class d Modaltà per un Carattere Dscreto_ Ad gruppo d student scrtt al Corso d Laurea Trennale n Economa Azendale è stato chesto l Numero d Credt Formatv ottenendo l seguente elenco grezzo d modaltà: 0 26 67 19 16 71 10 180 24 5 19 10 79 113 3 27 27 12 30 10 9 52 18 114 179 10 18 90 56 68 18 6 21 84 86 27 9 9 104 26 10 48 81 114 39 17 123 141 66 82 18 78 13 99 91 18 72 13 144 14 84 41 130 36 136 27 60 169 132 41 9 120 84 90 139 30 72 6 16 116 33 48 12 12 152 30 12 30 6 110 48 117 33 9 141 66 171 75 6 50 58 45 84 6 24 30 13 60 9 143 15 13 99 39 15 36 53 180 36 73 156 60 10 51 150 18 13 19 72 55 18 57 32 36 18 92 103 62 150 18 41 169 55 42 24 179 9 10 171 10 Classe n Ampezza a 0 20 50 21 20 50 33 30 50 100 37 50 100 125 10 25 125 155 11 30 155 180 9 25 Totale 150 Tabella 2.5 L ampezza della classe rappresenta l numero d modaltà dstnte che rcadono nella classe. 20
La tabella precedente poteva essere anche rportata nel modo seguente: Classe n Ampezza a 0-20 50 (20-0)+1=21 21 50 33 (50-21)+1=30 51 100 37 (100-51)+1=50 101 125 10 (125-101)+125 126 155 11 (155-126)+1=29 156 180 9 (180-156)+1=25 Totale 150 Tabella 2.6 n cu entramb gl estrem della classe sono nclus. Replogando Notazone x x + 1 x, + ] ( x 1 x x + 1 x, + ] [ x 1 Estremo Inferore Estremo Superore Ampezza Classe Escluso Incluso x+ 1 x Incluso Incluso x x ) 1 ( + 1 + 21
Determnazone del numero delle class Come ogn processo d sntes, la suddvsone del collettvo statstco n class d modaltà comporta una perdta d nformazone. In partcolare, l raggruppamento delle untà statstche non consente d conoscere le vere modaltà del carattere che le untà rcadent n una classe assumono. Così, ad esempo, relatvamente dstrbuzone rportata nella tabella 2.5, non è dato conoscere la vera altezza de 65 ndvdu che rcadono nella classe 140-170. Inoltre, per quanto gà detto n precedenza, non è possble rsalre agl ndvdu che hanno un altezza compresa tra 140 e 170 cm. 22
L ammontare della perdta d nformazon e l lvello della sntes determnat dal raggruppamento dpendono dal numero delle class: Numero Class Ampezza Classe Perdta d Informazon Lvello della Sntes Grande S rduce Scarsa Scarso Pccolo Aumenta Elevata Elevato Occorre pertanto trovare un gusto compromesso che consenta d sntetzzare opportunamente dat senza pregudcare eccessvamente la perdta d nformazon. 23
Prma d concludere è opportuno far presente che raggruppament n class pù ampe, possono renders necessar anche per caratter qualtatv. S pens, ad esempo, alla classfcazone ATECO della attvtà economche (http://www.stat.t/defnzon/ndex.htm) oppure alle alla classfcazone delle professon d cu s rporta l seguente prospetto (Fonte: http://www.stat.t/defnzon/ndex.htm) Grand Grupp Grupp Class Categore Voc Professonal I Legslator, drgent e mprendtor 3 8 48 319 II Professon ntellettual, scentfche e d elevata 6 17 69 679 specalzzazone III Professon tecnche 4 17 92 901 IV Impegat 2 6 37 185 V Professon qualfcate nelle attvtà commercal e 5 11 47 478 ne servz VI Artgan, opera specalzzat e agrcoltor 6 24 108 1778 VII Conduttor d mpant e opera semqualfcat addett a macchnar fss 4 22 89 1431 e mobl VIII Professon non qualfcate 6 15 28 440 IX Forze Armate 1 1 1 89 Totale 37 121 519 6300 24
Le Frequenze Relatve Le frequenze assolute dpendono dalla numerostà del collettvo n esame, nel senso che saranno pccole se l collettvo presenta una dmensone rdotta, mentre saranno certamente maggor se l collettvo è grande. Da cò dscendono alcun nconvenent. In partcolare, le frequenze assolute non consentono d confrontare, rspetto al medesmo carattere, due o pù collettv d numerostà dversa; non fornscono una percezone mmedata del peso che ogn sngola modaltà ha all nterno della dstrbuzone d frequenze. Per ovvare a quest nconvenent s consderano le frequenze relatve, che s ottengono rapportando le frequenze assolute alla dmensone del collettvo. La -esma frequenza relatva è defnta come: f n =, 1,2,...,k. n = 25
Ovvamente vale quanto segue: 1. 0 f 1 k 2. f 1 = 1 = Infatt: k = 1 f = f 1 + f 2 +... + f +... + f k n = 1 n = 1 n n + 2 n +... + n n +... + nk n 1 n ( n + n +... + n +... + n ) = n = 1 1 2 k Se s moltplcano le frequenze relatve per 100 s ottengono le frequenze relatve percentual: p = 100 f, = 1,2,...,k Per costruzone le f e le p non dpendono dalla numerostà del collettvo 26
Se s consderano solo la frequenze relatve (percentual) s perde un nformazone. Quale? 27
Esempo 2.6 Dstrbuzone d Frequenze Rprendamo l esempo precedente e ndchamo l collettvo esamnato d 50 famgle come COLLETTIVO A. Supponamo ora che lo stesso carattere sa stato rlevato anche su un secondo altro collettvo, che chameremo COLLETTIVO B. Ponamo a confronto le due dstrbuzon: COLLETTIVO A X A n X B n 0 5 0 20 1 12 1 10 2 19 2 35 3 9 3 15 4 4 4 10 5 1 5 10 Totale 50 Totale 100 Tabella 2.7 Tabella 2.8 COLLETTIVO B E corretto affermare che la famgle con un fglo sono pù numerose nel collettvo A? E corretto affermare che la famgle con due fgl sono pù numerose nel collettvo B? 28
Costruamo anztutto le frequenze relatve e quelle percentual: X n A Collettvo A f A p A n B Collettvo B 0 5 0.10 10% 20 0.20 20% 1 12 0.24 24% 10 0.10 10% 2 19 0.38 38% 35 0.35 35% 3 9 0.18 18% 15 0.15 15% 4 4 0.08 8% 10 0.10 10% 5 1 0.02 2% 10 0.10 10% Totale 50 1 100% 100 1 100% Tabella 2.9 Nel collettvo A, le famgle con un solo fglo rappresentano l 24% del totale delle famgle del collettvo, mentre nel collettvo B rappresentano l 10%. Pertanto, le famgle con un solo fglo sono pù numerose nel collettvo A. L affermazone è corretta. Nel collettvo A, le famgle con due fgl rappresentano l 38% del totale delle famgle del collettvo, mentre nel collettvo B rappresentano l 35%. Pertanto, le famgle con due fgl sono pù numerose nel collettvo A. L affermazone è errata. f B p B 29
Le Frequenze Cumulate Nel caso n cu le modaltà del carattere n esame sono ordnate (ossa l carattere è qualtatvo ordnale o quanttatvo) può essere nteressante consderare la frequenza con cu s presentano nel collettvo n esame modaltà nferor o ugual ad un certa modaltà. Relatvamente al Collettvo A, provamo a rspondere alle seguent domande: D1. Quante sono le famgle che hanno al pù un fglo? D2. Qual è la percentuale d famgle che hanno al massmo due fgl? D3. Qual è la percentuale d famgle che hanno almeno due fgl? D4. Quante sono le famgle che hanno meno d tre fgl? D5. Quante sono le famgle che hanno non meno d 4 fgl? 30
X n A A f p A 0 5 0.10 10% 1 12 0.24 24% 2 19 0.38 38% 3 9 0.18 18% 4 4 0.08 8% 5 1 0.02 2% Totale 50 1 100% Tabella 2.10 R1 Quante sono le famgle che hanno al pù un fglo? { X 1 } = 5 + 12 17 Freq = R2 Qual è la percentuale d famgle che hanno al massmo due fgl? 5 + 12 + 19 36 Freq % = 50 50 { X 2 } = 100 = 100 72% oppure n manera equvalente: Freq% Freq% { X 2 } = (0.10 + 0.24 + 32 ) 100 = 72% { X 2 } = 10% + 24% + 38% = 72% 31
R3 Qual è la percentuale d famgle che hanno almeno due fgl? Freq% { X 2 } = (0.38 + 0.18 + 0.08 + 0.02 ) 100 = 0,66 100 = 66% oppure, n alternatva: Freq% { X 2 } = 100 Freq% { X < 2 } = = 100 Freq% 17 100 1 = 50 { X 1 } 33 100 50 = 100 = 66% 17 50 100 R4 Quante sono le famgle che hanno meno d tre fgl? { X < 3 } = 5 + 12 + 19 36 Freq = R5 Quante sono le famgle che hanno non meno d 4 fgl? { X 4 } = 4 + 1 5 Freq = 32
Dato un carattere X con k modaltà ordnate n senso crescente, sa {( x,n ), 1,2,...,k } = la corrspondente dstrbuzone d frequenze. Possamo allora defnre le seguent frequenze: Frequenze Cumulate Assolute N = n j= 1 j = 1,2,..., k Frequenze Cumulate Relatve F = j= 1 f j = N n Frequenze Retrocumumale Assolute = 1,2,..., k R = n N 1 = 2,..., k Frequenze Retrocumumale Relatve R r = = 2,..., k n 33
Tabella Replogatva delle Dverse Tpologe d Frequenze X n Assolute f Relatve p Percentual N Cumulate Assolute F Cumulate Relatve R Retrocumulate Assolute r Retrocumulate Relatve x 1 n 1 f1 = n1 / n f 100 p1 = 1 1 n1 N = F 1 = f1 R1 = n r 1 = 1 x 2 n 2 f2 = n2 / n f 100 p2 2 N = N + n F2 N 2/n = 2 1 2 R = n N r2 = R 2/n = 2 1 x n f = n / n p f 100 = 1 N = N + n F N /n = R n N 1 r = R /n =......... x k n k fk = nk / n p = f 100 k k N k = n F k = 1 Rk nk = rk = fk Tot. n 1 34
Relazon Rcorsve Tra le frequenze assolute [relatve, percentual] e quelle cumulate assolute [relatve, percentual] esstono semplc relazon, esprmbl nelle forme: N + = N 1 n n = N N 1 Infatt, per defnzone N = n1 + n2 +... + n 1 + n = N 1 1442444 3 N 1 + n Dalla precedente relazone segue subto che n = N N 1. Identche relazon valgono, ovvamente, per F Inoltre dalle retrocumulate N = n 1 R 35
Le Frequenze Specfche o Denstà d Frequenze Per un carattere quanttatvo suddvso n class oltre alle frequenze assolute, relatve e cumulate (assolute e relatve) s possono defnre ulteror tpologe d frequenze: Denstà d Frequenza Assolute n H =, = 1,2,..., k a Denstà d Frequenza Relatve f h =, = 1,2,..., k a Denstà d Frequenza Percentual p h = 100 h, = 1,2,..., k Queste ultme, rsultano pù semplc da trattare e da nterpretare rspetto alle h 36
Interpretazone delle frequenze specfche Le frequenze specfche servono a valutare l grado d addensamento delle untà statstche all nterno delle class. Carattere H h p h Ipotes Dscreto Contnuo Esprme la frequenza assoluta mputable ad ogn sngola modaltà che rcade nella classe Esprme la frequenza assoluta mputable ad ogn ntervallo untaro che rcade nella classe Esprme la frequenza relatva mputable ad ogn sngola modaltà che rcade nella classe Esprme la frequenza relatva mputable ad ogn ntervallo untaro che rcade nella classe Esprme la percentuale d untà mputable ad ogn sngola modaltà che rcade nella classe Esprme la percentuale d untà mputable ad ogn ntervallo untaro che rcade nella classe Unforme dstrbuzone delle untà all nterno della classe 37
Esempo 2.7 Frequenze Cumulate Rprendamo gl esemp 2.4 e 2.5 relatv alle dstrbuzon n class d modaltà per caratter Altezza e Numero d Credt Formatv. x x + 1 n f 70-100 20 0,1 20 0,1 0,1 100-120 7 0,035 27 0,135 14% 120-140 18 0,09 45 0,225 23% 140-170 65 0,325 110 0,55 55% 170-180 21 0,105 131 0,655 66% 180-200 45 0,225 176 0,88 88% 200-220 24 0,12 200 1 100% Totale 200 1 N Tabella 2.11 F P 45 ndvdu su 200 hanno un altezza par al pù a 140 cm. Il 55% degl ndvdu è alto al massmo 170 cm. 38
x x + 1 n f N F P 0-20 50 0,3333 50 0,3333 33,33% 20-50 33 0,2200 83 0,5533 55,33% 50-100 37 0,2467 120 0,8000 80,00% 100-125 10 0,0667 130 0,8667 86,67% 125-155 11 0,0733 141 0,9400 94,00% 155-180 9 0,0600 150 1,0000 100,00% Totale 150 1,000 Tabella 2.12 39
Esempo 2.8 Frequenze Specfche Completamo la tabella relatva al carattere Altezza x x + 1 n f a H h p h 70-100 20 0,1 30 0,667 0,0033 0,33% 100-120 7 0,035 20 0,350 0,0018 0,18% 120-140 18 0,09 20 0,900 0,0045 0,45% 140-170 65 0,325 30 2,167 0,0108 1,08% 170-180 21 0,105 10 2,100 0,0105 1,05% 180-200 45 0,225 20 2,250 0,0113 1,13% 200-220 24 0,12 20 1,2 0,0060 0,60% Totale 200 1 Tabella 2.13 1. Qual è l sgnfcato delle frequenze evdenzate? 2. Determnare l numero d ndvdu che hanno un altezza compresa tra 170 e 171 cm; 3. Determnare la percentuale d ndvdu che hanno un altezza compresa tra 110 e 111 cm; 4. Determnare la percentuale d ndvdu che hanno un altezza compresa tra 110 e 115 cm; 5. Determnare la percentuale d ndvdu 40
Completamo la tabella relatva al carattere Numero d Credt x x + 1 n f a H h p h 0-20 50 0,3333 21 2,381 0,0159 1,59% 20-50 33 0,2200 30 1,100 0,0073 0,73% 50-100 37 0,2467 50 0,740 0,0049 0,49% 100-125 10 0,0667 25 0,400 0,0027 0,27% 125-155 11 0,0733 30 0,367 0,0024 0,24% 155-180 9 0,0600 25 0,360 0,0024 0,24% Totale 150 1 Tabella 2.14 1. Qual è l sgnfcato delle frequenze evdenzate? 2. Determnare l numero d student che hanno 7 credt; 3. Determnare la percentuale d student un numero d credt compreso tra 50 e 55 (estrem nclus); 4. Determnare la percentuale d student che hanno meno d 7 credt; 5. Determnare la percentuale d student che hanno almeno 175 credt. 41
Tabelle rassuntve per gl esemp su caratter Numero d Credt e Altezza credt e es n f N F R r amp h H 0.0 20.0 50 0.333 50 0.33 150 1.00 21.0 0.0159 2.3810 20.0 50.0 33 0.220 83 0.55 100 0.67 30.0 0.0073 1.1000 50.0 100.0 37 0.247 120 0.80 67 0.45 50.0 0.0049 0.7400 100.0 125.0 10 0.067 130 0.87 30 0.20 25.0 0.0027 0.4000 125.0 155.0 11 0.073 141 0.94 20 0.13 30.0 0.0024 0.3667 155.0 180.0 9 0.060 150 1.00 9 0.06 25.0 0.0024 0.3600 150 1.000 altezza e es n f N F R r amp h H 70.0 100.0 20 0.100 20 0.10 200 1.00 30.0 0.0033 0.6667 100.0 120.0 7 0.035 27 0.14 180 0.90 20.0 0.0018 0.3500 120.0 140.0 18 0.090 45 0.23 173 0.87 20.0 0.0045 0.9000 140.0 170.0 65 0.325 110 0.55 155 0.78 30.0 0.0108 2.1667 170.0 180.0 21 0.105 131 0.66 90 0.45 10.0 0.0105 2.1000 180.0 200.0 45 0.225 176 0.88 69 0.35 20.0 0.0113 2.2500 200.0 220.0 24 0.120 200 1.00 24 0.12 20.0 0.0060 1.2000 200 1.000 qual frequenze vanno confrontate tra le assolute e le specfche per avere nformazon sul reale peso da attrbure alle class evdenzate? 42
Dstrbuzon d Quanttà La tabella che segue rporta l valore (n mlon d euro) delle esportazon della Regone Calabra relatve all anno 2003 e dstnte per settore. Valor Settor (n mlon d euro) Prodott agrcol, dell allevamento e della pesca 45 Prodott ndustra estrattva 2 Almentar, bevande e tabacco 49 Prodott tessl 14 Artcol d abbglamento 4 Calzature e prodott n pelle cuoo 1 Prodott n legno e sughero (esclus mobl) 3 Prodott n carta, stampa ed edtora 1 Prodott petrolfer raffnat 0 Prodott chmc e farmaceutc 59 Prodott n gomma e plastca 28 Vetr, ceramca e materal non metallc per l edlza 5 Metall e prodott n metallo 7 Macchne e apparecch metallc 53 Macchne e apparecch elettrc d precsone 12 Autovecol 4 Altr mezz d trasporto 4 Mobl 5 Altr manufatt 2 Altr prodott 12 Totale 310 Tabella 2.15 (Fonte: http://www.ce.gov.t/stud/bollettno/menu.htm) 43
La dfferenza con le tabelle analzzate n precedenza, n cu è stata consderata la dstrbuzone del totale delle untà statstche fra le modaltà del carattere (dstrbuzon d frequenze), è notevole. Infatt, nell esempo delle esportazon, l totale che vene rpartto non rguarda l numero delle untà statstche, bensì la somma del valore delle esportazon (309 mlon d euro). Lo scopo che s vuole raggungere con la tabella è quello d analzzare la rpartzone del valore complessvo delle esportazon n base al settore d appartenenza Ad una tabella d questo tpo s da l nome d dstrbuzone d quanttà. Una dstrbuzone d quanttà è l rsultato d due operazon 1. Classfcazone S suddvde l collettvo n class 44
2. Msurazone S quantfca, per ogn classe creata, l ammontare d un carattere. Il carattere rspetto a cu s fa la classfcazone può essere dverso da quello che vene msurato e po sommato n ogn classe. Il nome dstrbuzone fa rfermento al modo n cu l ammontare globale d un carattere s rpartsce tra le class/modaltà del carattere d classfcazone. Per una dstrbuzone d quanttà, detto Q l carattere oggetto d studo, T Q l suo totale e Q la msurazone (ntenstà) d esso n corrspondenza della -esma occorre tenere presente che le Q non sono frequenze assolute e, qund, non ha alcun senso calcolare le frequenze relatve e percentual. Il rapporto Q q = T Q 45
ndca la quota parte dell ammontare complessvo T Q spettante alla -esma classe. 46
Settor Q q q % Prodott agrcol, dell allevamento e della pesca 45 0,145 14,5% Prodott ndustra estrattva 2 0,006 0,6% Almentar, bevande e tabacco 49 0,158 15,8% Prodott tessl 14 0,045 4,5% Artcol d abbglamento 4 0,013 1,3% Calzature e prodott n pelle cuoo 1 0,003 0,3% Prodott n legno e sughero (esclus mobl) 3 0,010 1,0% Prodott n carta, stampa ed edtora 1 0,003 0,3% Prodott petrolfer raffnat 0 0,000 0,0% Prodott chmc e farmaceutc 59 0,190 19,0% Prodott n gomma e plastca 28 0,090 9,0% Vetr, ceramca e materal non metallc per l edlza 5 0,016 1,6% Metall e prodott n metallo 7 0,023 2,3% Macchne e apparecch metallc 53 0,171 17,1% Macchne e apparecch elettrc d precsone 12 0,039 3,9% Autovecol 4 0,013 1,3% Altr mezz d trasporto 4 0,013 1,3% Mobl 5 0,016 1,6% Altr manufatt 2 0,006 0,6% Altr prodott 12 0,039 3,9% Totale 310 1 100% Tabella 2.16 47
In alcun cas l confne tra dstrbuzon d quanttà e dstrbuzon d frequenze è molto sottle. Consderamo, ad esempo, la tabella seguente n cu vene rportato l numero d Immatrcolat n alcune Unverstà Italane nell a.a. 2002/2003 Ateneo Immatrcolat Incdenza relatva Incdenza % Bar 7922 0,103 10,3% Bologna 18013 0,235 23,5% Calabra 5939 0,077 7,7% Catana 9859 0,129 12,9% Frenze 9547 0,124 12,4% Lecce 5502 0,072 7,2% Messna 6144 0,080 8,0% Mlano Bcocca 4855 0,063 6,3% Mlano Boccon 2639 0,034 3,4% Mlano Poltecnco 6281 0,082 8,2% Totale 76701 1 100,0% Tabella 2.17 (Fonte: Il Sole-24 Ore del 28/06/2004) 48
Se s assume come untà statstca l sngolo mmatrcolato rlevando su d esso l carattere Ateneo d scrzone allora la tabella è una dstrbuzone d frequenze Se s assume come untà statstca l sngolo Ateneo e s rleva l carattere Numero d Immatrcolat, allora la tabella s confgura una dstrbuzone d quanttà 49
Consderamo, ancora, la tabella successva n cu vene rportato l numero d rcover regstrat n Itala per prm 10 grupp d patologe: Patologa Rcover Incdenza relatva Incdenza % Malatte del sstema crcolatoro 1458726 0,194 19,4% Malatte dell apparato dgerente 933156 0,124 12,4% Traumatsm e avvelenament 786625 0,105 10,5% Tumor 779503 0,104 10,4% Complcazon della gravdanza, parto e puerpero 771000 0,103 10,3% Malatte dell apparato respratoro 672739 0,090 9,0% Malatte dell apparato gento-urnaro 588548 0,078 7,8% Malatte del sstema nervoso e degl organ de sens 544031 0,072 7,2% Malatte del sstema osteomuscolare 531811 0,071 7,1% Sntom, segn e stat morbos mal defnt 441072 0,059 5,9% Totale 7507211 1 100% Tabella 2.18 (Fonte: Il Sole-24 Ore del 22/03/2004) 50
Se s pone l accento sul sngolo rcovero, consderandolo come una untà statstca, allora la tabella altro non è che la dstrbuzone de 7507211 rcover tra le 10 forme d patologe. La tabella s presenta pertanto come dstrbuzone d frequenze del carattere Patologa; Se nvece assumamo come l untà statstca la sngola patologa e come carattere oggetto d studo l numero d rcover, allora la tabella s presenta come una dstrbuzone d quanttà, n quanto l numero de rcover vene consderato come una caratterstca delle patologe. Dstrbuzone d frequenze Dstrbuzone d quanttà Unta Statstca sngolo rcovero sngola patologa Carattere d studo patologa numero d rcover 51
Sere Storche Sere Storca o Temporale Successone d valor d una varable quanttatva rlevata n dvers stant temporal. Esempo 2.9 Sere Storche Valore (n mlon d euro) delle esportazon d merc della Regone Calabra Anno Valore delle Esportazon 1999 230,7 2000 310,7 2001 296,3 2002 290,9 2003 309,2 Tabella 2.19 (Fonte: http://www.ce.gov.t/stud/bollettno/menu.htm) 52
Andamento de mutu a tasso fsso e varable Anno Tasso Fsso Tasso Varable 1990 15,8 14,7 1991 14,6 13,5 1992 19,1 10 1993 12,4 11,3 1994 12,3 11,2 1995 12,7 11,6 1996 12,9 11,7 1997 10 9 1998 7,2 6,9 1999 5,8 4,6 2000 7,2 5,9 2001 6,7 5,5 2002 6,1 4,6 2003 5,13 3,85 Tabella 2.20 (Fonte: Il Sole-24 Ore del 26/04/2004) 53
Spesa per R&S n Itala e Germana (mlon d dollar) Anno Itala Germana 1991 13449,5 42019 1992 13083,7 40864,9 1993 12347,5 39464,8 1994 11780,1 38773,2 1995 11522,8 39451,5 1996 11735,8 39728,3 1997 12500,4 40894,2 1998 12909,2 42134,5 1999 12798,7 45253,1 2000 13566,5 47653,3 Tabella 2.21 (Fonte: Il Sole-24 Ore del 3/05/2004) Uno strumento utle per valutare le varazone del fenomeno nel corso del tempo è costtuto da Numer Indc 54
Sere Terrtoral Sere Terrtorale Successone d valor d una varable quanttatva rfert ad aree geografche dverse. Esempo 2.10 Sere Terrtoral PIL procapte (n dollar) e popolazone (n mlon) d alcun paes afrcan Paese PIL Popolazone Angola 660 13,1 Camerun 560 15,7 Ertrea 160 4,4 Etopa 100 70,7 Kena 360 31,6 Mal 240 11,6 Ngera 290 12,1 Tabella 2.22 (Fonte: Il Sole-24 Ore del 22/03/2004) 55
Costo totale (n euro) de rcover al 31/12/2002 sostenuto dalle regon del Mezzogorno d Itala Regone Costo Totale Abruzzo 881.090.047 Molse 221.097.047 Campana 3.658.239.238 Pugla 2.399.922.865 Baslcata 408.984.770 Calabra 1.304.265.423 Scla 3.352.720.395 Sardegna 1.192.752.570 Tabella 2.23 (Fonte: Correre della Sera del 22/09/2004) 56
Eserczo 1. Scrvere 2 dstrbuzon d frequenze rcavando tutte le frequenze presentate; 2. Scrvere 2 dstrbuzon d frequenze n class d modaltà e rcavare tutte le frequenze presentate 3. Cercare su quotdan o su Internet due dstrbuzon d quanttà, due sere storche e due sere terrtoral. Consglo: fate l eserczo e memorzzatelo!!! 57