Unverstà C. Cattaneo Luc, Corso d Statstca, 9 Ottobre 2013 Laboratoro Excel Sessone n. 1 Venerdì 041013 Gruppo PZ Lunedì 071013 Gruppo AD Martedì 081013 Gruppo EO VERSIONE DEFINITIVA (9 Ottobre 2013) degl appunt della Sessone n. 1 (composta da due part (A) e (B)). Parte (A) (gl appunt d questa parte sono pubblcat su Internet n un fle separato): (A1) esercz sulla varable d Posson con l comando Excel DISTRIB.POISSON e altr comand Excel (A2) esercz d smulazone delle realzzazon d una varable aleatora con l generatore d numer casual d Excel n partcolare esercz con la varable d Posson (A3) Domande tpo nella prma prova ntermeda. Parte (B) (gl appunt d questa parte seguono qu sotto): (B1) Introduzone alla Statstca Descrttva o Anals Statstca de Dat ed l suo ruolo nella gestone azendale. Nozon d: (1) dat grezz (o raw data ), (2) trasformazone e/o rappresentazone de dat grezz medante grafc, tabelle, ed ndc statstc. (B2) Alcun ndc statstc d base: frequenza assoluta, frequenza relatva e frequenza relatva percentuale. Comand Excel Tabelle Pvot. Una tabella d base: la tabella delle frequenze con Comand Excel Tabelle Pvot. Nota bene: tale tabella è rpresa e completata nella prossma Sessone n. 2. (B3) Domande tpo nella prma prova ntermeda: s veda la Sessone n. 2. Appunt sulla parte (B) della Sessone n. 1. La seguente parte (B1) è da leggere e comprendere rtornando su d essa man mano che concett v menzonat verranno affrontat n concreto nelle vare Sesson Excel. Le nozon menzonate n (B1) "Base Dat", record e campo sono prerequst d Informatca. (B1) IL RUOLO DELL ANALISI STATISTICA DEI DATI NELLA GESTIONE AZIENDALE DATI GREZZI E INFORMAZIONI INDICI STATISTICI, TABELLE E GRAFICI 1
Un DB azendale (Base Dat o Data Base) può avere mglaa d record (o rghe) e decne o centnaa d varabl (o colonne). Es. 3000 record e 50 colonne, ovvero 150000 camp contenent altrettant dat (numer e/o caratter alfabetc). E charo che leggere tutt tal 150000 dat,o anche leggere solo poch d ess, non dà nessuna nformazone sull andamento della gestone azendale (es. sull andamento delle vendte nel caso del DB delle fatture attve). Infatt dat che s trovano ne camp de DB sono dett DATI GREZZI (o raw data ) perché debbono essere trasformat con metod dell anals statstca per avere nformazon sull andamento della gestone azendale. INPUT trasformazon dat grezz con metod nformazon dell'anals statstca de dat Cosa è una nformazone? OUTPUT Una nformazone è sempre un dato ma espresso n forma tale (e con propretà tal) da poter essere usato ne process decsonal azendal e nelle corrspondent azon attuatve delle decson azendal (s not: n-formaazone). Le nformazon sono espresse da ndc statstc, tabelle e grafc. Un INDICE STATISTICO è un numero che da solo ndca una caratterstca d tutt dat grezz contenut n una o pù colonne del DB, ovvero d una o pù varabl del DB. Tal ndc hanno propretà nformatve (o descrttve ) crca dat grezz che s trovano nel DB e possono avere, con opportune potes, propretà nferenzal, coè prevsve, crca cert dat futur azendal che non s trovano ancora nel DB. Le TABELLE che contengono nformazon su una sola varable del DB sono dette tabelle un-dmensonal o un-varate e fanno parte dell anals statstca detta un-dmensonale o un-varata perché analzza una sola varable del DB solatamente o dsguntamente dalle altre. Le TABELLE che contengono nformazon su due varabl del DB sono dette tabelle b-dmensonal o bvarate o anche tabelle a doppa entrata e fanno parte dell anals statstca detta b-dmensonale o b-varata perché analzza conguntamente due varabl del DB. No produrremo sa le tabelle un-dmensonal sa le tabelle b-dmensonal con gl stess comand Excel, coè quell delle TABELLE PIVOT d Excel. I GRAFICI evdenzano certe nformazon n modo ntutvo ed mmedato. No vedremo n partcolare, per l anals statstca un-dmensonale, grafc d sequenza ed grafc a barre, e per l anals statstca bdmensonale grafc che mettono n evdenza l grado d correlazone d due varabl. (B2) Alcun ndc statstc d base: frequenza assoluta, frequenza relatva e frequenza relatva percentuale. Comand Excel Tabelle Pvot. Defnzon. Dato un nseme d n realzzazon varable X: (a) La frequenza assoluta della realzzazone che essa s è rpetuta nelle n realzzazon. (b) La frequenza relatva della realzzazone rapporto o la frazone f = n n (c) La frequenza relatva percentuale è x x d una è l numero delle volte è l ( = 1,2, Kn) x f 100 = f % n Comand Excel Tabelle Pvot Per produrre tabelle e calcolare ndc statstc (tra cu le frequenze) sono molto utl Comand Excel Tabelle Pvot. I comand Excel che seguono dovrebbero essere gà not allo studente dal corso/ d Informatca. Tal comand sono comunque rportat qu sotto e verranno utlzzat n questa e nelle altre Sesson. 2
COMANDI DI INIZILIZZAZIONE DI UNA TABELLA-PIVOT COMANDI TABELLA-PIVOT: Barra generale degl strument: clk su nsersc Clk su cona tabella-pvot (n alto a snstra d barra strument d nsersc) Se compare l layout-classco d tabella-pvot (con suo camp-rga, camp o area dat, e camp-colonna) l nzalzzazone è termnata. Se non compare l layout-classco: fare clck-destro sul rquadro che compare, selezonare opzon tabella-pvot, selezonare vsualzza, selezonare layout-classco che a questo punto compare e l nzalzzazone è termnata. Esempo d tabella delle frequenze ottenuta con comand Excel Tabelle Pvot: x n f % durata op. freq ass freq rel % fr. ass. c. fr.re.% c. 1 2 1,92% 2 1,92% 1,5 4 3,85% 6 5,77% 1,7 3 2,88% 9 8,65% 1,8 7 6,73% 16 15,38% 2 36 34,62% 52 50,00% 2,3 3 2,88% 55 52,88% 2,4 4 3,85% 59 56,73% 2,5 17 16,35% 76 73,08% 3 14 13,46% 90 86,54% 3,5 4 3,85% 94 90,38% 3,9 10 9,62% 104 100,00% 104 100,00% Dove: _ la prma colonna ntestata durata op accogle valor delle n =104 realzzazon x della varable X = durata operazone (d manutenzone, n ore e frazon d ora) ordnate n modo crescente e senza ndcare se cascuna realzzazone s è rpetuta o no. _ la seconda e la terza colonna accolgono le frequenze assolute n e le frequenze relatve percentual f % d cascuna realzzazone x rportata nella prma colonna, _ la terza e quarta colonna accolgono le frequenze assolute cumulate e le frequenze relatve cumulate che vedremo nella prossma Sessone n. 2. COMANDI TABELLA-PIVOT che danno le prme due colonne della tabella delle frequenze d cu sopra Trascnamento ne camp-rga del nome durata op. della varable Clck destro su una rga della tabella-pvot Nel menù che compare,clck su raggruppa Nella fnestra che compare, n raggruppa per mettere 1 (se non c è gà) Trascnamento ne camp valore del nome durata op. della varable Clck destro su una rga della tabella-pvot Nel menù che compare, clck su separa RISULTATO:una tabella con la prma colonna contenente valor della varable ordnat dal pù pccolo al pù grande senza le rpetzon, e con la seconda colonna contenente le frequenze assolute d dett valor, coè le prme due colonne della tabella delle frequenze rprodotta sopra. ESERCIZIO. Negl ultm 200 gorn (ved colonna gg qu sotto che rporta l numero progressvo de gorn) un magazzno ha rcevuto gornalmente l numero d ordn d acqusto ndcato nella colonna x. Al fne d avere nformazon sull andamento del numero d ordn n tal 200 gorn s produca la tabella delle frequenze assolute e frequenze relatve percentual del numero d ordn. S mettano noltre n evdenza gl ndc statstc max e mn del numero d ordn. 3
Le colonne gg e x rportate qu sotto sono dat grezz del numero degl ordn d acqusto rcevut dal magazzno negl ultm 200 gorn. Nota Bene (1): Tal dat grezz sono stat prodott e sono rproducbl dallo studente (per fare questo eserczo) con comand Excel d smulazone (vst nella parte (A) d questa Sessone n.1) con una varable aleatora X d Posson d parametro lambda = 2,135 e con numero generatore, o random seed, = 2 (come gà fatto n Laboratoro con l prmo gruppo). gg x gg x gg x gg x 1 5 51 0 101 3 151 1 2 2 52 2 102 3 152 1 3 1 53 4 103 1 153 1 4 3 54 0 104 0 154 3 5 3 55 4 105 3 155 1 6 2 56 1 106 0 156 1 7 1 57 3 107 2 157 3 8 1 58 0 108 3 158 0 9 2 59 2 109 1 159 3 10 2 60 3 110 2 160 3 11 1 61 0 111 2 161 4 12 4 62 4 112 2 162 4 13 3 63 2 113 2 163 5 14 2 64 1 114 3 164 1 15 2 65 6 115 1 165 1 16 3 66 3 116 2 166 2 17 1 67 3 117 3 167 1 18 1 68 2 118 1 168 1 19 1 69 2 119 4 169 0 20 3 70 1 120 4 170 2 21 1 71 2 121 2 171 1 22 3 72 3 122 2 172 2 23 0 73 0 123 4 173 4 24 6 74 2 124 1 174 1 25 1 75 3 125 2 175 1 26 3 76 2 126 0 176 0 27 0 77 2 127 1 177 1 28 2 78 1 128 4 178 3 29 6 79 4 129 2 179 5 30 4 80 0 130 2 180 1 31 1 81 2 131 4 181 0 32 0 82 0 132 0 182 3 33 2 83 0 133 5 183 4 34 2 84 2 134 1 184 1 35 1 85 2 135 1 185 2 36 2 86 3 136 1 186 2 37 0 87 2 137 1 187 1 38 3 88 1 138 3 188 0 39 3 89 3 139 2 189 0 40 2 90 2 140 3 190 1 41 2 91 1 141 1 191 2 42 4 92 2 142 4 192 5 43 2 93 0 143 4 193 2 44 2 94 1 144 1 194 1 4
45 3 95 5 145 1 195 0 46 2 96 3 146 5 196 3 47 1 97 5 147 3 197 3 48 2 98 1 148 0 198 3 49 4 99 3 149 3 199 5 50 3 100 1 150 1 200 0 Nota Bene (2): L eserczo è rpetble (e va rpetuto da parte dello studente), p. es., generando altr n = 200 dat grezz con lambda = 3,11 e con numero generatore, o random seed, = 3 (come gà fatto n Laboratoro con l terzo gruppo, e mutats mutands cn l secondo gruppo). SOLUZIONE dell eserczo. La tabella rchesta è la seguente: x n f % Da cu rsulta che x=n.ordn freq.as. frq.rel. % 0 26 13,00% 1 53 26,50% 2 50 25,00% 3 40 20,00% 4 19 9,50% 5 9 4,50% 6 3 1,50% 200 100,00% Max n. ordn = 6 Mn n. ordn = 0 I comand Tabella Pvot per produrre le prme due colonne sono quell gà ndcat a pag. 3. I comand Tabella Pvot per produrre la terza colonna, coè quella delle frequenze relatve percentual, sono seguent: COMANDI TABELLA-PIVOT che danno la terza colonna (ed anche altre due colonne che vedremo) della tabella d cu sopra sono seguent: Clck destro su Conteggo (nell ntestazone tabella-pvot) (Nel menù che compare, clck su mpostazon campo valore) Nel menù che compare, clck su mostra valor come Nel menù che compare a fanco d mostra valor come, clck su: % d totale colonna per avere le freq. rel. % Totale parzale n per avere le freq. ass. cum. % Totale parzale n per avere le freq. rel. %. cum. RISULTATO:s ottengono le rmanent colonne della tabella delle frequenze. 5