Pivot Tables Le Pivot Tables di Excel consentono di costruire un cubo OLAP a partire da dati memorizzati in una singola tabella Le operazioni OLAP corrispondono, in Excel, ad una tecnica di analisi dei dati detta cross-tabulation a partire da una tabella di dati il comando Pivot Table consente di sintetizzare l informazione in due (o piu` modi). Per esempio: vendite raggruppate per prodotto e zona vendite raggruppate per prodotto e mese Un modo piu` colorito di fare riferimento al trattamento dei dati che si puo` realizzare con le tabelle Pivot e` slice and dice (affettare e ridurre a cubetti) i dati, ovvero organizzare e raggruppare i dati in sottopopolazioni.
Costruzione di pivot tables (1) Punto di partenza e` una tabella dei dati. Esempio: vendita di tisane (HERBALTEAS.xls) sul mercato americano Le variabili della tabella sono: mese (month) prodotto (product) stato (state) vendite in dollari (Sales $)
Esempio: Herbal Teas Month Product State Sales $ January Shining Seas California $226 January Purple Mountains California $664 January Purple Mountains Oregon $648 January Huckleberry Heat Oregon $116 January Blackbear Berry California $867 January Raspberry Rocket California $639 January Blackbear Berry Oregon $985 January Amber Waves Oregon $201 February Amber Waves Washington $37 February Huckleberry Heat Washington $831 February Purple Mountains California $785 February Raspberry Rocket California $827 February Blackbear Berry California $63
Example: snowflake schema per Herbal Teas Quarter Month Category Product State Sales
Costruzione di pivot tables (2) 1. Scegliere data->pivottable and PivotChart Report Excel attiva il relativo wizard 2. Rispondere alle domande su dove sono memorizzati i dati da analizzare (in genere una tabella Excel (Excel List)) 3. Selezionare il bottone PivotTable 4. Cliccare il bottone Next per continuare e passare alla seconda schermata 5. Rispondere alle domande per selezionare i dati da analizzare 6. Cliccare il bottone Next per continuare e passare alla seconda schermata
Costruzione di pivot tables (3) 7. Selezionare la collocazione della Pivot Table da creare 8. Cliccare Finish per generare la bozza di Pivot Table 9. Selezionare il campo Row (riga): e` necessario decidere quale variabile vogliamo analizzare usando le righe. L operazione e` effettuata col meccanismo del point-and-drag dalla Field List Box 10. Selezionare il campo colonna con la stessa procedura 11. Selezionare i dati da tabulare nella Pivot Table 12. Se i dati da tabulare sono numerici, Excel calcola le somme totali 13. Se i dati da tabulare sono categorici, Excel li conta
Realizzazione delle operazioni OLAP nelle tabelle Pivot PIVOT: (ri-)selezionare le variabili da inserire in: ROW FIELDS (asse Y) COLUMN FIELDS (asse X) PAGE FIELDS (asse Z) DATA ITEMS (valori) ROLL-UP: Grouping di una o piu dimensioni in accordo alle gerarchie stabilite dallo SNOW-FLAKE schema DRILL-DOWN: Ungrouping di una o piu` dimensioni in accordo alle gerarchie stabilite dallo SNOW-FLAKE schema SLICE&DICE: navigazione della tabella Pivot
Il processo Supponiamo di avere un data warehouse 1. Con una query si costruisce un data mart nella forma di una singola tabella. N.B. Questo è il punto di partenza nel nostro corso, ovvero una singola tabella in un foglio elettronico 2. A partire dai dati della tabella si progetta il cubo OLAP, anche con la costruzione di uno star-diagram, ovvero si stabilisce: 1. Quali attributi giocano il ruolo di fatti da analizzare 2. Con quali misure si analizzano i fatti 3. Quali attributi giocano il ruolo di dimensioni 4. Quali gerarchie si devono imporre sugli attributi-dimensioni 3. Si realizza il cubo così progettato mediante una tabella pivot.
Esercitazione Chi ha la maggior probabilità di accedere oggi ad Internet? Si consideri l inchiesta condotta su 1000 utenti Internet scelti in modo random, i cui dati sono nel file NETUSERS.XLS. Si costruiscano tabelle Pivot per rispondere alle seguenti domande: Qual è la percentuale di maschi con meno di 30 anni? Quale porzione di questi utenti di Internet corrisponde ai single col solo titolo di scuola superiore? Quale porzione di questi utenti di Internet corrisponde a impiegati? Qual è lo stipendio medio degli impiegati del campione?