Data warehouse Introduzione

Documenti analoghi
Data warehouse Introduzione

Data warehouse: introduzione

Data warehouse Introduzione

Architetture di Data Warehouse. PDF created with pdffactory trial version

Lezione 2. Dati e Architetture per il Data Warehousing ETL

Sistemi Informativi Avanzati

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Prof. Giorgio Poletti

Sistemi Informativi Avanzati

Corso di basi di dati Fascicolo T04b Nota: i primi lucidi sostituiscono alcuni già proposti, in altro ordine e ccon qualche differenza, nel fascicolo

Sistemi di Elaborazione dell Informazione

Basi di Dati Direzionali

Il modello multidimensionale. Per le slides si ringrazia il Prof. Stefano Rizzi ( e il Dott.

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Pentaho: una soluzione Open per la progettazione e sviluppo di Data Warehouse

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

I S.I. DIREZIONALI (BUSINESS INTELLIGENCE)

Introduzione al Data Warehousing

PERCHÉ LA BUSINESS INTELLICENCE

Architetture Evolute nei Sistemi Informativi. architetture evolute 1

Analisi dei dati. analisi dei dati 1

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Introduzione al Data Warehousing

Business Intelligence HR

Data Warehousing. Sommario. Luca Cabibbo, Riccardo Torlone, Paolo Atzeni. Processi. Processi, dati e decisioni. Processi presso una banca

Sistemi Informativi L. Corso di Laurea in Ingegneria dei Processi Gestionali A.A. 2003/2004. Docente: Prof. Wilma Penzo

Business Intelligence & Data Warehousing

Introduzione al Data Warehousing

Prof. Giorgio Poletti

Sistemi Informativi Avanzati

Dall intuizione alla conoscenza

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data Warehousing e Data Mining

Data Warehouse Architettura e Progettazione

Sistema Informativo Statistico Regione Campania

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

Data Warehousing e Business Intelligence

I Componenti del processo decisionale 7

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

Redazione e Presentazione di Progetti Informatici

DSS. Decision Support System. 12/11/2008 Fondamenti Informatica 2 - Prof. Gregorio Cosentino 1

Data Warehousing (DW)

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Rassegna sui principi e sui sistemi di Data Warehousing

Data warehouse Analisi dei dati

Data warehouse Analisi dei dati

UTILIZZO DEI SISTEMI INFORMATIVI PER IL SUPPORTO DELLE DECISIONI ARCHITETTURA DI RIFERIMENTO

Sistemi Informativi su Web

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

BASI DI DATI E UTENTI DI BASI DI DATI

Data Science A.A. 2018/2019

Data Warehouse e OLAP

INFORMATICA PER LE SCIENZE UMANE a.a. 2016/2017

Convegno organizzato dall Associazione ICT Dott.com. Business Intelligence L utilità per le imprese. Prof. Elena Baralis. Politecnico di Torino

Corso integrato di Sistemi di Elaborazione. Modulo I. Prof. Crescenzio Gallo.

Thematica Software Technologies

Data warehousing e OLAP (tratti da slides di C.Renso e C.Gozzi)

Sistemi Informativi Avanzati Anno Accademico 2013/2014 Prof. Domenico Beneventano. Archi multipli

Logistica e nuove prospettive con le soluzioni di business analytics di SAP

INFORMATICA PER LE SCIENZE UMANE a.a. 2015/2016

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Introduzione ad OLAP Metodi e Modelli per il Supporto alle Decisioni Paolo Avallone IT Specialist Sr Consulting DB2, Data Management

Sistemi Informativi Avanzati Anno Accademico 2012/2013 Prof. Domenico Beneventano. Archi multipli

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

On Line Analytical Processing

Filippo Geraci DATA WAREHOUSING

8. Architetture per l analisi dei dati

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

Data warehouse: analisi dei dati

Fondamenti di Informatica e Programmazione

Data warehouse Progettazione

INFORMATICA PER LE SCIENZE UMANE a.a. 2017/2018

Laboratorio di Sistemi Informativi Aziendali a.a

Governo Digitale a.a. 2011/12

Basi di Dati. Corso di Laurea in Informatica Corso B A.A. 2015/16. Dr. Claudia d'amato. Dipartimento di Informatica, Università degli Studi Bari

Data warehouse Progettazione

UN DATAWAREHOUSE PER IL CONTROLLO E MONITORAGGIO DELLA SPESA FARMACEUTICA CONVENZIONATA

OLAP On Line Analytical Processing

Data warehouse Progettazione

SISTEMI INFORMATIVI DIREZIONALI BUSINESS INTELLIGENCE

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

Introduzione D B M G

Elena Baralis 2007 Politecnico di Torino 1

Elena Baralis 2007 Politecnico di Torino 1

Sistemi informativi D B M G. Introduzione. Introduzione alle basi di dati D B M G 2. Elena Baralis 2007 Politecnico di Torino 1

Data Warehousing. Esercitazione 2

SISTEMI INFORMATIVI E DATABASE

Basi di dati Architetture e linee di evoluzione

Basi di Dati e Sistemi Informativi. Analisi dei Dati: OLAP, Data Warehousing, Data Mining

Introduzione al data warehousing

Datawarehouse. Proge.azione logica

Estensioni del linguaggio SQL per interrogazioni OLAP

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

Knowledge Management E Business Intelligence

Agenda. I sistemi a supporto delle decisioni Information Directory Sviluppi futuri. Cinque anni di Data Warehouse:dai dati alle decisioni 1

Il Dimensional Fact Model

Syllabus A042 Insegnamenti disciplinari

Progettazione concettuale e logica di un data warehouse per dati genomici

Ambienti Operativi per OLAP. Casi di Studio

Transcript:

D M B G Data warehouse Introduzione INTRODUZIONE - 1

Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi di dati contenenti dati di tipo operativo queste basi di dati costituiscono una potenziale miniera di informazioni utili Sistemi per il supporto alle decisioni permettono di analizzare lo stato dell azienda prendere decisioni rapide e migliori INTRODUZIONE - 2

Supporto alle decisioni aziendali Analisi e previsione dell evoluzione della domanda Individuazione di aree critiche Chiarezza dei conti e trasparenza finanziaria reporting, pratiche antifrode e antiriciclaggio Definizione e realizzazione di strategie vincenti contenimento di costi e aumento di profitti INTRODUZIONE - 3

Business Intelligence Intelligence: da intus legere Disciplina di supporto alla decisione strategica aziendale Obiettivo: trasformazione dei dati aziendali in informazioni fruibili a livelli diversi di dettaglio per applicazioni di analisi Tipologia di utenza eterogenea Necessaria un adeguata infrastruttura hardware e software di supporto INTRODUZIONE - 4

Ambiti applicativi Industrie manifatturiere: gestione ordini e spedizioni, supporto clienti Distribuzione: profilo utenti, gestione magazzino Servizi finanziari: analisi acquisti (carta di credito) Assicurazioni: analisi richieste indennizzo, riconoscimento frodi Telecomunicazioni: analisi delle chiamate, riconoscimento frodi Servizi pubblici: analisi dell utilizzo Sanità: analisi dei risultati INTRODUZIONE - 5

Data warehouse Base di dati per il supporto alle decisioni, che è mantenuta separatamente dalle basi di dati operative dell azienda Dati orientati ai soggetti di interesse integrati e consistenti dipendenti dal tempo, non volatili utilizzati per il supporto alle decisioni aziendali W. H. Inmon, Building the data warehouse, 1992 INTRODUZIONE - 6

Perché dati separati? Prestazioni ricerche complesse riducono le prestazioni delle transazioni operative metodi di accesso diversi a livello fisico Gestione dei dati informazioni mancanti (storico) consolidamento dei dati qualità dei dati (problema di inconsistenze) INTRODUZIONE - 7

D M B G Struttura e analisi dei dati INTRODUZIONE - 8

Rappresentazione multidimensionale Dati rappresentati come un (iper)cubo con tre o più dimensioni Misure su cui si esegue l analisi: elementi individuati all intersezione delle dimensioni Data warehouse per l analisi delle vendite di una catena di supermercati assi dimensionali: prodotto, negozio, tempo misure: quantità venduta, importo della vendita, INTRODUZIONE - 9

Rappresentazione multidimensionale negozio 3 SupShop prodotto tempo 2-3-2001 INTRODUZIONE - 10 latte Tratto da Golfarelli, Rizzi, Data warehouse, teoria e pratica della progettazione, McGraw Hill 2006

Rappresentazione relazionale: modello a stella Misure numeriche memorizzate nella tabella dei fatti gli attributi contengono valori numerici Le dimensioni descrivono il contesto di ogni misura nella tabella dei fatti contengono molti attributi descrittivi INTRODUZIONE - 11

Esempio Data warehouse per l analisi delle vendite di una catena di supermercati Negozi Vendite Prodotti Tempo INTRODUZIONE - 12

Dimensione del data warehouse dimensione tempo: 2 anni x 365 giorni dimensione negozio: 300 negozi dimensione prodotto: 30.000 prodotti, di cui 3.000 venduti ogni giorno in ogni negozio numero di righe della tabella dei fatti: 730 x 300 x 3000 = 657 milioni spazio occupato dalla tabella dei fatti 21GB INTRODUZIONE - 13

Strumenti di analisi dei dati Analisi OLAP: calcolo di funzioni aggregate complesse necessità di fornire supporto a diversi tipi di funzione aggregata (esempi: media mobile, top ten) Analisi dei dati mediante tecniche di data mining varie tipologie di analisi pesante componente algoritmica INTRODUZIONE - 14

Strumenti di analisi dei dati Presentazione attività distinta dalla ricerca: i dati ottenuti da una ricerca possono essere rappresentati mediante diversi tipi di strumenti di rappresentazione Ricerca di motivazioni esplorazione dei dati mediante approfondimenti (esempio: drill down) INTRODUZIONE - 15

D M B G Architetture per data warehouse INTRODUZIONE - 16

Architetture per data warehouse Separazione tra elaborazione transazionale e analisi dei dati evitare le architetture a un livello Architetture a due o più livelli separano in misura diversa i dati in ingresso nel data warehouse dai dati oggetto dell analisi maggiormente scalabili INTRODUZIONE - 17

Elementi costitutivi di un data warehouse Metadati Gestione DW OLAP servers Strumenti ETL Strumenti di analisi Sorgenti di dati (esterne) Data warehouse Analisi dei dati Data marts INTRODUZIONE - 18

Data warehouse e data mart Warehouse aziendale: contiene informazioni sul funzionamento di tutta l azienda processo di modellazione funzionale esteso progettazione e realizzazione richiedono molto tempo Data mart: sottoinsieme dipartimentale focalizzato su un settore prefissato due possibilità alimentato dal data warehouse primario alimentato direttamente dalle sorgenti realizzazione più rapida richiede progettazione attenta, in modo da evitare problemi di integrazione in seguito INTRODUZIONE - 19

Server per data warehouse Server ROLAP (Relational OLAP) DBMS relazionale esteso rappresentazione compatta di dati sparsi estensioni SQL per aggregati metodi di accesso speciali che realizzano le operazioni di accesso in modo efficiente Server MOLAP (Multidimensional OLAP) dati rappresentati in forma matriciale (multidimensionale) proprietaria dati sparsi richiedono compressione primitive OLAP speciali Server HOLAP (Hybrid OLAP) INTRODUZIONE - 20

Strumenti ETL Processo di preparazione dei dati da introdurre nel data warehouse Extraction Transformation Loading Processo eseguito durante il primo popolamento del DW l aggiornamento periodico dei dati INTRODUZIONE - 21

Processo ETL Estrazione: acquisizione dei dati dalle sorgenti Pulitura: operazioni volte al miglioramento della qualità dei dati (correttezza e consistenza) Trasformazione: conversione dei dati dal formato operazionale a quello del data warehouse (integrazione) Caricamento: propagazione degli aggiornamenti al data warehouse INTRODUZIONE - 22

Metadati Metadati = dati sui dati Diversi tipi di metadati per trasformazione e caricamento: descrivono i dati sorgenti e le trasformazioni necessarie utile usare una notazione comune per dati sorgente e dati risultanti dalle trasformazioni CWMI (Common Warehouse Metadata Initiative): standard proposto da OMG per l interscambio di dati tra strumenti DW e repository di metadati in ambienti eterogenei e distribuiti per la gestione dei dati: descrivono la struttura dei dati presenti nel data warehouse anche per dati derivati, quali le viste materializzate per la gestione delle query: dati sulla struttura delle query e monitoraggio della loro esecuzione codice SQL della query piano di esecuzione uso di memoria e CPU INTRODUZIONE - 23

Architettura a due livelli D M BG Metadati Gestione DW OLAP servers Strumenti ETL Strumenti di analisi Sorgenti di dati (operazionali ed esterni) Data warehouse Analisi dei dati Livello delle sorgenti Data marts Livello del data warehouse INTRODUZIONE - 24

Caratteristiche delle architetture a 2 livelli Disaccoppiamento dalle sorgenti possibilità di gestire dati esterni al sistema OLTP modellazione dei dati adatta all analisi OLAP progettazione fisica del data warehouse mirata al carico analitico Facilità di gestione delle differenti granularità temporali dei dati operazionali e analitici Separazione del carico transazionale da quello analitico Necessità di svolgere al volo la preparazione dei dati (ETL) INTRODUZIONE - 25

Architettura a tre livelli D M BG OLAP servers Strumenti ETL Metadati Gestione DW Loading Strumenti di analisi Sorgenti di dati (operaz. ed esterni) Staging area Livello di alimentazione Data warehouse Analisi dei dati Livello delle sorgenti Data marts Livello del data warehouse INTRODUZIONE - 26

Caratteristiche D M BG delle architetture a 3 livelli Staging area: area di transito che permette di separare l elaborazione ET dal caricamento nel data warehouse permette operazioni complesse di trasformazione e pulizia dei dati offre un modello integrato dei dati aziendali, ancora vicino alla rappresentazione OLTP talvolta denominata Operational Data Store (ODS) Introduce ulteriore ridondanza aumenta lo spazio necessario per i dati INTRODUZIONE - 27