OLAP On Line Analytical Processing



Documenti analoghi
Ambienti Operativi per OLAP. Casi di Studio

Lezione 7. Data Warehouse & OLAP

Lezione 9. Ambienti Operativi per OLAP Casi di Studio 08/03/2010 1

Lezione 9. Microsoft Analysis Services: Principi e Funzionalità

OLAP On Line Analytical Processing

Data warehousing e OLAP

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Data warehousing con SQL Server

Star Schema. Progettazione Logica ROLAP 30/05/2014

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data warehousing con SQL Server

Introduzione ad OLAP (On-Line Analytical Processing)

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Data warehousing con SQL Server

Il modello dimensionale

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Data warehousing con SQL Server

Cosa è un data warehouse?

Estensioni del linguaggio SQL per interrogazioni OLAP

Lorenzo Braidi. Database design. Libro_datadesign.indb :06:17

Data Warehousing (DW)

La suite Pentaho Community Edition

Data Warehousing e Data Mining

Caratteristiche principali. Contesti di utilizzo

4 Introduzione al data warehousing

SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

Basi di Dati Complementi Esercitazione su Data Warehouse

Sistemi Informativi Avanzati

Informazioni generali sul corso

Data Warehousing: concetti base e metodologie

Data Warehouse e OLAP

SQL Server BI Development Studio

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS)

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Rassegna sui principi e sui sistemi di Data Warehousing

Servizi finanziari (studio di caso)

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

SQL Server. Applicazioni principali

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Thematica Software Technologies

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi

Introduzione al data warehousing

Lezione 1. Introduzione e Modellazione Concettuale

Progettazione Logica. Sviluppo di un Database/DataWarehouse

Pivot Tables. vendite raggruppate per prodotto e zona vendite raggruppate per prodotto e mese

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Architetture per l analisi di dati

Data Warehousing. Esercitazione 1

Corso di Complementi di Basi di dati A.A Data Warehouse

DATA WAREHOUSING CON JASPERSOFT BI SUITE

SQL/OLAP. Estensioni OLAP in SQL

Data warehouse Introduzione

Corso di Laboratorio di Basi di Dati

Progetto Turismo Pisa

ESEMPIO: RITARDI & BIGLIETTI

Misure. Definizione delle misure

PBI Passepartout Business Intelligence

Governo Digitale a.a. 2011/12

Sistemi Informativi Aziendali I

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

SISTEMI INFORMATIVI AZIENDALI

02/mag/2012. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale

Data Mining a.a

ITI M. FARADAY Programmazione modulare a.s

Customer Relationship Management. Eleonora Ploncher 3 aprile 2006

Basi di Dati Corso di Laura in Informatica Umanistica

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

La qualità delle informazioni:

Introduzione alla Business Intelligence

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione

MODELLI DEI DATI PER DW DAI DATI ALLE DECISIONI. Per definire la struttura di un DW si usano i seguenti formalismi, detti modelli dei dati:

25/11/14 ORGANIZZAZIONE AZIENDALE. Tecnologie dell informazione e controllo

Introduzione alla Business Intelligence.

Introduzione al Data Warehousing per Sistemi Informativi Aziendali

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo

Introduzione al Data Warehousing

Lezione 3. Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing

Introduzione al Data Mining

SQL SQL. Definizione dei dati. Domini. Esistono 6 domini elementari:

Famiglie di tabelle fatti

Sviluppo Applicazione di BI/DWH. con tecnologia Microsoft. per il supporto della catena logistica

B C I un altro punto di vista Introduzione

DBMS (Data Base Management System)

I sistemi di reporting e i rapporti direzionali

Organizzazione delle informazioni: Database

Introduzione al Datamining. Francesco Passantino

Basi di dati. Corso di Laurea in Ingegneria Informatica Canale di Ingegneria delle Reti e dei Sistemi Informatici - Polo di Rieti

Transcript:

OLAP On Line Analytical Processing Alfredo Cuzzocrea DEIS Dipartimento di Elettronica, Informatica e Sistemistica Università della Calabria cuzzocrea@si.deis.unical.it Testo di Riferimento: J. Han, M. Kamber Data Mining: Concepts and Techniques 1

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems 2

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems 3

Motivations La tecnologia dei DB, Internet ed il recupero automatico dei dati hanno causato l esplosione della dimensione delle sorgenti di dati (large data set) I Sistemi di Supporto alle Decisioni possono trarre vantaggio da una più elevata conoscenza derivata da enormi quantità di dati Spesso i dati sono contenuti in Sistemi Informativi eterogenei, complessi e distribuiti Inadeguatezza dei tradizionali DBMS (tecnologia OLTP On Line Transactional Processing) 4

Differences between OLTP and OLAP OLTP OLAP users clerk, IT professional knowledge worker function day to day operations decision support DB design application-oriented subject-oriented data current, up-to-date detailed, flat relational isolated usage repetitive ad-hoc access read/write lots of scans index/hash on prim. key unit of work short, simple transaction complex query # records accessed tens millions # users thousands hundreds DB size 100MB-GB 100GB-TB historical, summarized, multidimensional, integrated, consolidated metric transaction throughput query throughput, response 5

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data 6

The Applicative Context Data Warehousing Environment Monitor + Integrator Metadati Server OLAP DB Operazionali Extract Transform Load Refresh Data Warehouse Serve Analisi Query Report Data mining altre sorgenti Data Marts Sorgenti Archivio Dati Motore OLAP Tool Front-End 7

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data 8

OLAP Foundamentals Si basa su un modello logico multidimensionale dei dati (dimensioni, misure, gerarchie e livelli) Consente di estrarre conoscenza da grosse moli di dati Supporta analisi di tipo qualitativa Lavora su dati storicizzati Concetto di reticolo di cuboidi 9

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data 10

Conceptual Models for supporting the OLAP Data Design Dimensional Fact Model Consente di modellare a livello concettuale lo schema multidimensionale dell OLAP data cube category brand Product description street Sales money quantity Time day store Zone city region month week year country 11

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data 12

Logic Models for supporting the OLAP Data Design Star schema Un singolo oggetto (fact table) in mezzo connesso ad un numero di oggetti (dimension tables) Snowflake schema Un raffinamento dello star schema in cui la gerarchia dimensionale è rappresentata esplicitamente (normalizzando le tabelle delle dimensioni) Fact constellations fact tables multiple condividono dimension tables 13

Star Schema Date Date Month Year Store StoreID City State Country Region Measurements Sales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_sales Product ProductNo ProdName ProdDesc Category QOH Cust CustId CustName CustCity CustCountry 14

Snowflake Schema Year Year Month Month Year Date Date Month Sales Fact Table Date Product Product ProductNo ProdName ProdDesc Category QOH Country Country Region State State Country City City State Store StoreID City Measurements Store Customer unit_sales dollar_sales Yen_sales Cust CustId CustName CustCity CustCountry 15

time time_key day day_of_the_week month quarter year Fact Constellations Sales Fact Table time_key item_key branch_key item item_key item_name brand type supplier_type Shipping Fact Table time_key item_key shipper_key from_location branch branch_key branch_name branch_type Measures location_key units_sold dollars_sold avg_sales location location_key street city province_or_street country to_location dollars_cost units_shipped shipper shipper_key shipper_name location_key shipper_type 16

Outline Motivazioni Il Contesto Applicativo I Cardini di OLAP Modelli Concettuali a Supporto della Progettazione di OLAP Data Modelli Logici a Supporto della Progettazione di OLAP Data Modello Multidimensionale dei Dati Operatori ed Operazioni OLAP Un esempio Modelli di Rappresentazione Fisica di OLAP Data Commercial OLAP Server Systems Exploitation: : Interrogazione Approssimata di OLAP Data 17

Multidimensional Data Model Sales come funzione di Product, Month, e Region Zone Product Zone Time Industry Region Year Category Country Quarter Product Product City Month Week Office Day Time 18

Dimensions, Hierarchies and Levels all all region Europe... North_America country Germany... Spain Canada... Mexico city Frankfurt... Vancouver... Toronto office L. Chan... M. Wind 19

Hierarchies and Aggregations Le gerarchie consentono di aggregare automaticamente i dati di interesse quando ci si focalizza su un livello: se ci concentriamo su Mese i fatti rappresentano i totali delle vendite per ogni mese Possiamo concentrarci su diversi livelli della gerarchia in dimensioni diverse: le vendite mensili per regione di ogni prodotto 20

Cuboids Lattice n NC = L i + 1 i = 1 all n L i = numero di dimensioni = profondità della gerarchia definita sulla dimensione i 0-D(apex) cuboid time item location supplier 1-D cuboids time,item time,location item,location location,supplier time,supplier item,supplier 2-D cuboids time,item,location time,location,supplier 3-D cuboids time,item,supplier item,location,supplier time, item, location, supplier 4-D(base) cuboid 21

OLAP Measures Distributive calcolo incrementale E.g., count, sum, min, max Algebriche risultato di una funzione algebrica di M argomenti (M costante) in cui ogni argomento è un aggregato E.g., avg, min_k, max_k, standard_deviation Olistiche non c è un limite costante nel numero di elementi necessari per definirle a partire da un sottoaggregato E.g., median, mode, rank OLAP E UNO STRUMENTO DI ANALISI 22

An Example of OLAP Data Cube Store Pisa Roma Firenze sum Product Milk Bread Orange... sum All Products January 96, Pisa. Jan 96 Feb 96... Time sum Ogni dimensione contiene una gerarchia di valori Ogni cella del cubo contiene valori aggregati (count, sum, max, etc.) 23