OLAP On Line Analytical Processing Alfredo Cuzzocrea DEIS Dipartimento di Elettronica, Informatica e Sistemistica Università della Calabria cuzzocrea@si.deis.unical.it Testo di Riferimento: J. Han, M. Kamber Data Mining: Concepts and Techniques 1
Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Cubes Modelli Logici a Supporto della Progettazione di OLAP Data Cubes Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Cubes Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data Cubes 2
OLAP Data Cube Browsing Visualization OLAP capabilities Interactive manipulation 3
OLAP Operators/1 Roll Up decrementa il livello di dettaglio ( aggrega i dati ) Drill Down aumenta il livello di dettaglio ( naviga i dettagli ) Roll Up Nazione Regione Provincia Drill Down 4
OLAP Operators/2 Slice & Dice proiezione e selezione un set di celle OLAP corrisponde ad un query che coinvolge più dimensioni: Sales where Country = Italy and Week > 2 Product Store Store Product Slice Month Month 5
OLAP Operators/3 An Example of S&D Analysis Prodotti Regioni Vendite Noccioline Calabria 50 Noccioline Sicilia 60 Noccioline Basilicata 100 Pistacchi Calabria 40 Pistacchi Sicilia 70 Pistacchi Basilicata 80 Patatine Calabria 90 Patatine Sicilia 120 Patatine Basilicata 140 Vendite per Regione Calabria Sicilia Basilicata Noccioline 50 60 100 Pistacchi 40 70 80 Patatine 90 120 140 6
OLAP Operators/3 Pivoting riorganizza il data cube All Pivot All AllAll All All Pivot Product Time Drill-Down Store Pivot Product Time Drill-Down Time Drill-Down 7
Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Cubes Modelli Logici a Supporto della Progettazione di OLAP Data Cubes Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Cubes Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data Cubes 8
Example/1 3D OLAP Data Cube Dimensione: Tempo celle Anno 12 23 24 21 32 32 17 28 34 41 32 39 25 21 20 10 30 15 12 23 24 21 32 32 17 28 34 12 23 24 41 32 39 21 32 32 25 21 20 10 30 15 12 23 24 21 32 32 livello Semestre 1 Semestre 2 trimestre 1 trimestre 2 trimestre 3 trimestre 4 gen feb mar apr mag giu lug ago setr ott nov dic membri Vista 2D 9
Example/2 Vista 2D Dimensione: Prodotto Prodotto 12 23 24 12 32 14 56 24 59 23 13 65 34 27 38 11 73 35 26 52 11 31 42 17 18 19 22 16 53 15 38 12 37 28 29 27 Categoria 1 Categoria 2 31 21 42 18 34 76 11 26 37 45 66 74 69 37 13 24 33 53 sottocategoria 1 sottocategoria 2 sottocategoria 3 sottocategoria 4 23 13 65 34 27 38 11 73 35 26 52 11 31 42 17 18 19 22 P1 P2 P3 P4 P5 P6 P7 P8 31 21 42 18 34 76 11 26 37 10
Example/3 Anno Dimensioni Misura Anno Prodotto Zona Vendita 1999 P1 Z1 18 1999 P2 Z2 15 Z4 Z3 2003 2002 2001 2000 1999 Z1 Z2 15 10 23 17 15 12 25 15 34 16 12 18 P1 15 P2 P3 P4 Prodotto 2000 P1 Z2 12 2000 P3 Z1 16 2000 P1 Z4 15 2001 P1 Z2 15 2001 P3 Z3 34 2002 P1 Z1 17 2002 P2 Z1 15 2002 P2 Z3 25 Zona 2002 P3 Z2 12 2003 P2 Z1 10 2003 P4 Z2 23 Interpretazione Multi-Dimensionale di Dati Relazionali (RDBMS) 11
Example/4 Anno Anno 2003 2002 2001 10 17 15 25 12 23 2003 2002 2001 25 10 32 23 12 Z4 Z3 2000 1999 Z1 Z2 15 15 34 16 12 18 P1 15 P2 P3 P4 Prodotto Z4 Z3 2000 1999 Z1 Z2 15 15 12 15 34 18 C1 16 C2 Categoria Zona Zona Dimensione Prodotto: gerarchia Prodotto Categoria Aggregazione sulla Dimensione Prodotto {P1, P2} C1 {P3, P4} C2 12
Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Cubes Modelli Logici a Supporto della Progettazione di OLAP Data Cubes Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Cubes Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data Cubes 13
Physical Representation of OLAP Data/1 Multidimensional OLAP (MOLAP) Memorizzazione basata su array multidimensionali (si basa su tecniche ottimizzate di rappresentazione ed algoritmi per matrici sparse) Richiede strutture di indicizzazione dedicate (veloci) per precomputare i dati aggregati Relational OLAP (ROLAP) Utilizza tecniche basate sulla tradizionale tecnologia dei RDBMS (oppure loro estensioni) Presuppone ottimizzazione degli strati di back-end degli RDBMS server e l implementazione di tool di navigazione dei dati aggregati Consente una maggiore scalabilità 14
Physical Representation of OLAP Data/2 Hybrid OLAP (HOLAP) Flessibilità per l utente. Esempio: MOLAP per basso livello e ROLAP per alto livello Specialized SQL servers Supporto dedicato per OLAP query su schemi a stella ed a fiocco di neve Utilissimi nelle applicazioni dedicate 15
Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Cubes Modelli Logici a Supporto della Progettazione di OLAP Data Cubes Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Cubes Commercial OLAP Server Systems 16
Commercial OLAP Server Systems Oracle OLAP Business Objects Microsoft Analysis Services on SQL Server 17