Architetture di Data Warehouse. PDF created with pdffactory trial version

Documenti analoghi
Data warehouse Introduzione

Data warehouse Introduzione

Lezione 2. Dati e Architetture per il Data Warehousing ETL

Data warehouse: introduzione

Redazione e Presentazione di Progetti Informatici

Data warehouse Introduzione

Sistemi Informativi L. Corso di Laurea in Ingegneria dei Processi Gestionali A.A. 2003/2004. Docente: Prof. Wilma Penzo

Data Warehousing e Data Mining

Introduzione al Data Warehousing

Prof. Giorgio Poletti

Architetture Evolute nei Sistemi Informativi. architetture evolute 1

Introduzione al Data Warehousing

Prof. Giorgio Poletti

Sistemi Informativi Avanzati

Pentaho: una soluzione Open per la progettazione e sviluppo di Data Warehouse

Sistemi Informativi Avanzati

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Introduzione al Data Warehousing

Data Warehouse Architettura e Progettazione

Dall intuizione alla conoscenza

Sistema Informativo Statistico Regione Campania

UTILIZZO DEI SISTEMI INFORMATIVI PER IL SUPPORTO DELLE DECISIONI ARCHITETTURA DI RIFERIMENTO

Business Intelligence & Data Warehousing

Sistemi di Elaborazione dell Informazione

ERP, ENTERPRISE RESOURCE PLANNING

Data Warehousing e Business Intelligence

Corso di basi di dati Fascicolo T04b Nota: i primi lucidi sostituiscono alcuni già proposti, in altro ordine e ccon qualche differenza, nel fascicolo

BASI DI DATI DISTRIBUITE

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

I sistemi di reporting e i rapporti direzionali

Data Warehousing. Esercitazione 2

Logistica e nuove prospettive con le soluzioni di business analytics di SAP

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Data Science A.A. 2018/2019

Gestione dello sviluppo software Modelli Base

Knowledge Management E Business Intelligence

Corso di Marketing Industriale

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Il modello multidimensionale. Per le slides si ringrazia il Prof. Stefano Rizzi ( e il Dott.

I Componenti del processo decisionale 7

SISTEMI INFORMATIVI DIREZIONALI BUSINESS INTELLIGENCE

Data Warehousing. Sommario. Luca Cabibbo, Riccardo Torlone, Paolo Atzeni. Processi. Processi, dati e decisioni. Processi presso una banca

DSS. Decision Support System. 12/11/2008 Fondamenti Informatica 2 - Prof. Gregorio Cosentino 1

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

UN DATAWAREHOUSE PER IL CONTROLLO E MONITORAGGIO DELLA SPESA FARMACEUTICA CONVENZIONATA

ASPETTO SOFTWARE. Estensione del sistema operativo di un pc, ovvero un software di base che permette la comunicazione con gli utenti

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

SISTEMI INFORMATIVI E DATABASE

Sistemi informativi secondo prospettive combinate

PERCHÉ LA BUSINESS INTELLICENCE

Basi di Dati Direzionali

Marco R. Bellinzona Partner Ecos. Indicatori di performance per la Pubblica Amministrazione: il caso Provincia di Milano

Master Data Management e Data Virtualization

Il Ciclo di Vita del Data Warehouse

Sistemi Informativi Avanzati

CASE HISTORY CRM PER I SERVIZI ALL IMPRESA. Servizi CGN. beantech. IT moves your business

Lezione 5. Alimentazione dei Data Warehouses Riconciliazione e Integrazione di Schemi di Dati per il Data Warehousing

Model-View- Controller

Alle ore 13:15 Buffet nel Business Innovation Center

AD HOC INFINITY GUARDA LA TUA AZIENDA DA UN NUOVO PUNTO DI VISTA

Il Data Warehouse di Ateneo

INDICE. Prefazione pag. 13. Parte prima - L'acquisizione dei dati mediante gli strumenti software di contabilità gestionale

SISTEMI INFORMATIVI AZIENDALI

BUSINESS INTELLIGENCE

Università di Pisa. Corso di Laurea Specialistica in. Ingegneria Informatica per la Gestione d Azienda

Il sistema informativo aziendale

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

Business Intelligence HR

I S.I. DIREZIONALI (BUSINESS INTELLIGENCE)

Laboratorio di Sistemi Informativi Aziendali a.a

CONFRONTA BANCA CONTABILITÀ CONTABILITÀ INCASSI

Sandro Scapellato - Gruppo ZURIGO (Resp. Area Commerciale SIA) Guido Cuzzocrea - NUNATAC

Data Warehouse. PDF created with pdffactory trial version

Controllo di gestione

Architetture dei sistemi distribuiti. Mariagrazia Fugini Impianti Como 08-09

Corso integrato di Sistemi di Elaborazione. Modulo I. Prof. Crescenzio Gallo.

IL PIANO DI QUALITA AZIENDALE

STA II ANNO: AA Ecologia e Fondamenti dei. Sistemi. Ecologici Introduzione ai. Sistemi. Informativi Geografici. Lezione del

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

INDICE GENERALE 1. SISTEMA INFORMATIVO, SISTEMA DELLE INFORMAZIONI E INFORMATICA

Strumenti e dati per il supporto alle decisioni e al sistema dei controlli

PIANO DI LAVORO DEL DOCENTE

La misurazione dei sistemi di Data Warehouse

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

ANDREA BARRESI SISTEMI INFORMATIVI OPEN

Funzione primaria del sistema informativo Supportare chi fa funzionare l azienda attraverso la propria attività Supporto necessario in aree diverse,

Basi di dati. Sistemi per basi di dati 1.1

On Line Analytical Processing

I DSS e la gestione dei dati e della conoscenza. Prof. Luca Gnan

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

COSTRUIRE UNA ROADMAP PER LA TRASFORMAZIONE DIGITALE

MIUR: Diventare un organizzazione agile e data-driven.

Modulo 2 Architetture dei SD Lezione 1

Un programma intelligente a supporto delle decisioni: il caso BCC di Roma

SISTEMA UNICO E CENTRALIZZATO

Traduzione e interpretazione

Il software ERP cloud pensato per portare la tua azienda alla massima efficienza e gestirla dal tuo pc o smartphone, ovunque tu sia

D. Gubiani Introduzione alle Basi di Dati 3. La porzione automatizzata di un sistema informativo viene in

BASI DI DATI E UTENTI DI BASI DI DATI

Transcript:

Architetture di Data Warehouse

L aspetto architetturale del DW o L aspetto architetturale è estremamente importante: il dw deve essere dotato della capacità di eseguire operazioni complesse e pesanti dal punto di vista dell impegno di capacità di elaborazione; è quindi richiesta una significativa capacità di progettazione e pianificazione dell architettura di supporto del sistema.

Kelly (1999) definisce come irrinunciabili per un sistema di data warehouse le caratteristiche di: q q q q q Separazione: l elaborazione analitica e quella operazionale devono essere mantenute il più possibile separate; Scalabilità: l architettura hardware e software deve poter essere facilmente ridimensionate a fronte della crescita nel tempo dei volumi di dati da gestire ed elaborare e del numero di utenti da soddisfare; Estendibilità: deve essere possibile accogliere nuove applicazioni e tecnologie senza riprogettare integralmente il sistema; Sicurezza: il controllo sugli accessi è essenziale a causa della natura strategica dei dati memorizzati; Amministrabilità: la complessità dell attività di amministrazione non deve risultare eccessiva;

L architettura Esistono diverse architetture tipiche dei sistemi di data warehouse, tra le quali ricordiamo: o A un livello o A due livelli o A due livelli con data-mart indipendenti o A tre livelli

A un livello o Obiettivo di questa architettura è la minimizzazione dei dati memorizzati, ottenuta eliminando le ridondanze. o Questo DW è virtuale, nel senso che viene implementato come una vista multidimensionale dei dati operazionali generata da un apposito middleware, ossia da uno strato d elaborazione intermedio (Devlin, 1997).

Virtual Data Warehouse: a un livello Database OLTP Virtual Data Warehouse Utilizzatori finali

Problemi o Il primo punto debole di questa architettura è che non rispetta il requisito di separazione tra l elaborazione analitica OLAP e quella transazionale OLTP. o Le interrogazioni di analisi vengono ridirette sui dati operazionali dopo essere state reintrepretate nel middleware, interferendo così con il normale carico di lavoro transazionale

A due livelli o Nata per evidenziare la separazione tra il livello delle sorgenti e quello del DW, in realtà essa si articola in quattro livelli distinti che descrivono stadi successivi del flusso di dati.

Architettura Multi-Tier (a due livelli) Database OLTP Meta Dati Estrazione Trasporto e Trasformazione Strumenti ETL Data Warehouse Data Mart Utilizzatori finali OLAP Data Mining Reportistica

1. Livello sorgenti o Il DW utilizza fonti di dati eterogenei: estratti dall ambiente di produzione, e quindi originariamente archiviati in database aziendali relazionali oppure provenienti da sistemi informativi esterni all azienda.

2. Livello dell alimentazione o I dati memorizzati nelle sorgenti devono essere estratti, ripuliti per eliminare le inconsistenze e completare eventuali parti mancanti, integrati per fondere sorgenti eterogenee secondo uno schema comune. I cosiddetti strumenti di ETL (Extraction-Transformation-Loading) permettono di integrare schemi eterogenei, nonché di estrarre, trasformare, ripulire, validare, filtrare e caricare i dati dalle sorgenti nel DW.

3. Livello del data warehouse o Le informazioni vengono raccolte in un singolo contenitore centralizzato logicamente: il DW. o Esso può essere direttamente consultato ma anche usato come sorgente per costruire data-mart, che ne costituiscono una parziale replica, orientati verso specifiche aree dell impresa. o Accanto al DW, il contenitore dei meta-dati mantiene informazioni sulle sorgenti, sui meccanismi di accesso, sulle procedure di pulitura e alimentazione, sugli utenti, sugli schemi dei data-mart ecc.

4. Livello di analisi o Permette la consultazione efficiente e flessibile dei dati integrati a fini di stesura di report, di analisi, di simulazione.

Definizione di Data-mart o Con il termine Data-mart si intende un sottoinsieme o un aggregazione dei dati presenti nel DW primario, contenente l insieme delle informazioni rilevanti per una particolare area del business, una particolare divisione dell azienda, una particolare categoria di soggetti. o I data-mart alimentati da DW primario sono spesso detti dipendenti.

Perché i Data-mart Sebbene non strettamente necessari essi però costituiscono un utili risorsa: o come blocchi costitutivi durante la realizzazione incrementale del DW, o in quanto delineano i contorni delle informazioni necessarie a un particolare tipo di utenti per le loro interrogazioni, o poiché, essendo di dimensioni inferiori al DW primario, permettono di raggiungere prestazioni migliori.

A due livelli (con data-mart indipendenti) o In alcuni contesti, per motivi organizzativi e politici, si preferisce adottare un architettura per il DW in cui i data-mart vengono alimentati direttamente dalle sorgenti e vengono pertanto detti indipendenti.

Architettura Multi-Tier (a due livelli con data mart indipendenti) Database OLTP Meta Dati Estrazione Trasporto e Trasformazione Strumenti ETL Data Mart Utilizzatori finali

Problemi o L assenza di un DW primario snellisce le fasi progettuali, ma determina uno schema complesso di accessi ai dati e ingenera il rischio di inconsistenze tra i data-mart. o A volte, pur rispettando l indipendenza dei data-mart, si preferisce allora creare comunque un DW centrale, ma in questo contesto i ruoli dei data-mart e del DW sono invertiti: infatti il DW viene alimentato dai data-mart e può essere direttamente interrogato al fine di semplificare i pattern degli accessi.

Architettura Multi-Tier (a due livelli con data mart indipendenti-2) Database OLTP Meta Dati Estrazione Trasporto e Trasformazione Strumenti ETL Data Mart Data warehouse Utilizzatori finali

A tre livelli o Il terzo livello introdotto è quello dei dato riconciliati, detto Operational Data Store, che materializza i dati operazionali ottenuti dal processo di integrazione e ripulitura dei dati sorgente: quindi integrati, consistenti, corretti, volatili, correnti e dettagliati.

Architettura Multi-Tier con ODS Database OLTP Estrazione Trasporto Operational Data Store Trasformazione Data Mart indipendente Enterprise Data Warehouse Data Mart dipendenti Utilizzatori finali

o Il vantaggio principale del livello dei dati riconciliati è che esso crea un modello di dati comune e di riferimento per l intera azienda, introducendo al contempo una separazione netta tra le problematiche legate all estrazione e integrazione dei dati dalle sorgenti e quelle inerenti l alimentazione del DW.

A tre livelli con Olap Server o Infine, nell architettura più complessa viene introdotto un ulteriore livello: si tratta dell utilizzo di un OLAP SERVER che si posiziona tra il livello warehouse (o data-mart) e il livello utente. o Il cui obiettivo è facilitare le interrogazioni di tipo OLAP sui dati strutturati a livello warehouse.

Architettura Multi-Tier con ODS e OLAP Server Estrazione Trasporto Database OLTP Operational Data Store Data Mart indipendente Trasformazione Enterprise Data Warehouse Data Mart dipendenti OLAP Server Utilizzatori finali

Struttura informativa centrata sul DW Fonti dati: Legacy /Erp operazionali Contabilità Operational Data store Data Warehouse Business Unit Data Marts Marketing Produzione Finanza Ordini/fatture Buget Dati esterni non strutturati, quali fogli elettronici Vendite Costi Metadata tecnici e di Business