Datawarehouse. Proge.azione logica

Documenti analoghi
Datawarehouse. Proge.azione logica

Architetture per l analisi dei dati

Star Schema. Progettazione Logica ROLAP 30/05/2014

Definizione e calcolo delle misure

Il Dimensional Fact Model

Il modello multidimensionale. Per le slides si ringrazia il Prof. Stefano Rizzi ( e il Dott.

Sistemi Informativi Avanzati Anno Accademico 2013/2014 Prof. Domenico Beneventano. Archi multipli

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Estensioni del linguaggio SQL per interrogazioni OLAP

Sistemi Informativi Avanzati Anno Accademico 2012/2013 Prof. Domenico Beneventano. Archi multipli

Basi di Dati Direzionali

Data warehouse Analisi dei dati

Data Warehousing. Esercitazione 2

! Un arco multiplo corrisponde ad un associazione molti-a-molti: il padre (libro) non determina funzionalmente il figlio (autore)

Un arco multiplo corrisponde ad un associazione molti-a-molti: il padre (libro) non determina funzionalmente il figlio (autore)

Data warehouse Introduzione

Data warehouse Analisi dei dati

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Data warehouse: analisi dei dati

Introduzione ad OLAP Metodi e Modelli per il Supporto alle Decisioni Paolo Avallone IT Specialist Sr Consulting DB2, Data Management

Data warehouse Introduzione

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Basi di Dati e Sistemi Informativi. Analisi dei Dati: OLAP, Data Warehousing, Data Mining

Analisi dei dati. analisi dei dati 1

Data warehouse. Progettazione di un data warehouse

Le organizzazioni da sempre hanno archiviato i da7 di business ma l'incompleto sfru<amento del loro potenziale ha sempre rappresentato un problema.

Lezione 10. Basi di dati direzionali Parte II

Basi di dati - Architetture e linee di evoluzione Paolo Atzeni, Stefano Ceri, Piero Fraternali, Stefano Paraboschi, Riccardo Torlone

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

Rassegna sui principi e sui sistemi di Data Warehousing

Data warehouse: introduzione

Sistemi Informativi Avanzati

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

Data Warehousing. Sommario. Luca Cabibbo, Riccardo Torlone, Paolo Atzeni. Processi. Processi, dati e decisioni. Processi presso una banca

Elementi di Normalizzazione

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Corso integrato di Sistemi di Elaborazione. Modulo I. Prof. Crescenzio Gallo.

Sistemi Informativi Avanzati Anno Accademico 2011/2012 Prof. Domenico Beneventano. OLAP - Analysis Services

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

Data warehouse Progettazione

Introduzione al Data Warehousing

Data warehouse Progettazione

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Modellazione concettuale

Data Warehouse e OLAP

Progettazione Logica. Sviluppo di un Database/DataWarehouse

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

Data warehouse Progettazione

Data warehouse: progettazione

8. Architetture per l analisi dei dati

Appunti della lezione di Database del 17 Novembre 2016 (mattina) Studenti: D Amuri Giuseppe, De Luca Federico Professore: Mario Bochicchio

Data warehousing e OLAP (tratti da slides di C.Renso e C.Gozzi)

L ANALISI DEI DATI. EuroConsulting S.r.l. Consulenza di Direzione e Organizzazione Aziendale

Sistemi Informativi Avanzati Anno Accademico 2011/2012 Prof. Domenico Beneventano SQL-OLAP. Estensioni OLAP in SQL

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data Warehousing e Business Intelligence

02/mag/2012. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale

Introduzione al Data Warehousing

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

Lezione basi di dati 26 gennaio NORMALIZZAZIONE

Progettazione Logica

METODOLOGIE DI PROGETTAZIONE DI BD E DI DW. Gli eventi (fenomeni) di interesse, detti fatti. La granularità dei fatti da analizzare.

Introduzione al Data Warehousing

I sistemi di reporting e i rapporti direzionali

Maschere e Query. C. Marrocco. Università degli Studi di Cassino

OLAP On Line Analytical Processing

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi

Il ciclo di sviluppo del Data Warehouse

Filippo Geraci DATA WAREHOUSING

Modellazione concettuale

Data warehouse Introduzione

SQL Server BI Development Studio. SQL Server Business Intelligence Development Studio. Analysis Services

Progettazione logica. Prof. Stefano Rizzi

Gestione informatica dei dati. Dal database al Datawarehouse. Roberto Foderà Dipartimento di Giurisprudenza Corso di laurea in Economia e commercio

Progettazione Logica. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma

SQL Server Business Intelligence Development Studio. SQL Server BI Development Studio. SQL Server BI Development Studio *Analysis Services*

Sommario. Introduzione... 13

Sistemi Informativi L. Corso di Laurea in Ingegneria dei Processi Gestionali A.A. 2003/2004. Docente: Prof. Wilma Penzo

SQL Server Business Intelligence Development Studio

Prefazione. Parte Prima Basi di dati relazionali: modello e linguaggi 15

Business Intelligence HR

Università del Salento

Business Intelligence & Data Warehousing

Sistemi di Elaborazione dell Informazione

I S.I. DIREZIONALI (BUSINESS INTELLIGENCE)

Controllo degli accessi. Controllo degli accessi. Controllo degli accessi. Controllo degli accessi

Controllo degli accessi

Misure. Definizione delle misure. Sistemi Informativi Avanzati Anno Accademico 2015/2016 Prof. Domenico Beneventano. Glossario delle Misure

Architetture di Data Warehouse. PDF created with pdffactory trial version

Ristrutturazione di schemi E-R. Ridondanze. Analisi delle ridondanze. Vantaggi semplificazione delle interrogazioni

Data Warehousing. Esercitazione 2

ESEMPIO DI PROVA PRATICA

DATA WAREHOUSE E KNOWLEDGE DISCOVERY

Select From Where...

Decomposizione senza perdita

Basi di Dati Corso di Laura in Informatica Umanistica

Transcript:

Datawarehouse Proge.azione logica

1) Modello a stella implementato 3

Semplici join permettono di ricostruire i fatti. Le tabelle dimensione sono generalmente denormalizzate: contengono le dipendenze funzionali delle gerarchie. La denormalizzazione sveltisce le interrogazioni. Generalmente le gerarchie non sono soggette a modifiche, quindi la denormalizzazione è ininfluente sulle modifiche. La denormalizzazione causa ridondanza, tuttavia di norma una dimensione ha un occupazione contenuta della memoria rispetto alla fact table. La sparsità non è un problema: nella fact table vengono memorizzate solo le combinazioni di chiavi corrispondenti ad informazioni esistenti. 4

2) Modello a snowflake 4

Modello a sowflakes implementato 5

Schema snowflake di Vendite ChiaveNegozio ChiaveData Data Mese Trimestre Anno Giorno Settimana Vacanza VENDITA ChiaveNegozio ChiaveData ChiaveProdotto QuantitàVenduta Incasso PrezzoUnitario NumeroClienti Negozio ChiaveCittà Responsabile Distretto ChiaveProdotto ChiaveCittà CittàNegozio RegioneNegozio StatoNegozio ChiaveCategoria Categoria Reparto ChiaveTipo Tipo ChiaveCategoria GruppoMarketing Prodotto ChiaveTipo Marca CittàMarca Dieta* 6

Schema snowflake Lo schema snowflake attenua la denormalizzazione delle dimensioni, riducendo lo spazio delle tabelle delle dimensioni a scapito del costo dei join. La parziale normalizzazione articola meglio le dimensioni che possono essere usate con maggior facilità da più fact table. NORMALIZZATO 1) no ridondanze, occupa meno spazio in memoria 2) molti join, quesry più complesse e più lente 3) possibile aggiornamento a catena 5

Warehouse database Stru.ura conce.uale: Schema a stella o a fiocco di neve Stars denormalizzato Simple Flat (no gerarchia) snowflakes normalizzato More complex Gerarchico (naturale modo di pensare dei manager) (+) piu veloci le query ( ) piu spazio in memoria (-) piu lente le query (+) aggiornamenti a catena (+) occupa meno spazio Federica Cena- 6

Data normalisacon ObieEvo: 1. Eliminare le duplicazioni non necessarie e incontrollate di dac (ridondanze) 2. Eliminare le dipendenze funzionali tra gli a.ribuc Federica Cena- 7

Data normalisacon Dipendenze funzionali X! y il valore di y dipende da x ci.a! regione il valore di regione dipende da ci.a cliente(ci(a, regione) Ogni volta che due clienc vivono nella stesso ci.à, allora vivono anche la stessa regione ci.a[torino]=regione[piemonte] Federica Cena- 8

Warehouse database 1. Tabella al centro dei fae, sui cui vengono eseguite tu.e le query Relazione 1:m con le altre dimensioni (parte m: tabella dei fae, parte 1 dimensione) 2. Time dimension obbligatori 3. Una misura singola non interessa: Le misure devono essere sommabili, solo su alcune dimensioni ha senso:costo ha senso su prodoe, ma non su tempo (a.ribuc semisommab) 4. Aggiungere dac ai precedenc (accodarli) non sovrascriverli Federica Cena- 9

Modello logico Prodo.o (id_prodo.o, nome) Punto_vendita (id_punto, ci.à, regione) Tempo (id_tempo,mese, anno) Vendite (id_prodo.o, id_punto, id_tempo, quan3tà) Federica Cena 10

Datawarehouse Operatori OLAP

OLAP p Operatori per fare analisi multidimensionale dei dati p Operatori OLAP n Roll-up: diminuisce il dettaglio, esegue aggregazioni delle misure per riduzione di dimensioni o per generalizzazione su valori della gerarchia (indicatori aggregati su regione, nazione) n Drill-down: aumenta il dettaglio della dimensione (zoom su città) 2

OLAP p Operatori per fare analisi multidimensionale dei dati p Operatori OLAP n Roll-up: restituisci la somma dei prodotti venduti in un determinato stato n Drill-down: restituisci la somma dei prodotti venduti in una specifica regione, provincia, città 3

OLAP 4

5

OLAP n Push: elimina una dimensionale, facendolo diventare una misura (es prodotto àdiventa misura: conteggio dei diversi tipi di prodotti venduti per città e mese) n Pull: inverso del push, trasforma una misura in una dimensione (poco usato) 6

OLAP p Slice e dice: operazioni di selezione e proiezione per estrarre piani o sottocubi 7

OLAP p Slice (affettare): n taglia una fetta di cubo, fissando il valore di una dimensione n valore delle vendite di un prodotto (prodotto=matite) in tutti i punti vendita in tutti i momenti 8

OLAP p Dice (taglia a cubetti): n n taglia il cubo fissando il valore di due o più dimensioni (sottocubo) valore delle vendite di un prodotto in un punto vendita in un particolare momento T 9

10

Esercizio n Creare lo schema concettuale e logico del data warehouse che descrive un assicurazione n Individuare Operazioni OLAP appropriate per il dw in oggetto: p Drill-down- roll-up p Dice-slice 11