Data warehouse Introduzione

Documenti analoghi
Data warehouse Introduzione

Data warehouse: introduzione

Data warehouse Introduzione

Architetture di Data Warehouse. PDF created with pdffactory trial version

Lezione 2. Dati e Architetture per il Data Warehousing ETL

Sistemi Informativi Avanzati

Prof. Giorgio Poletti

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Sistemi di Elaborazione dell Informazione

Basi di Dati Direzionali

Il modello multidimensionale. Per le slides si ringrazia il Prof. Stefano Rizzi ( e il Dott.

Pentaho: una soluzione Open per la progettazione e sviluppo di Data Warehouse

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Analisi dei dati. analisi dei dati 1

Architetture Evolute nei Sistemi Informativi. architetture evolute 1

Prof. Giorgio Poletti

Business Intelligence HR

Data Warehousing. Sommario. Luca Cabibbo, Riccardo Torlone, Paolo Atzeni. Processi. Processi, dati e decisioni. Processi presso una banca

I S.I. DIREZIONALI (BUSINESS INTELLIGENCE)

Introduzione al Data Warehousing

Introduzione al Data Warehousing

Introduzione al Data Warehousing

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Business Intelligence & Data Warehousing

Sistemi Informativi L. Corso di Laurea in Ingegneria dei Processi Gestionali A.A. 2003/2004. Docente: Prof. Wilma Penzo

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Sistemi Informativi Avanzati

Data Warehousing e Data Mining

Dall intuizione alla conoscenza

Data Warehouse Architettura e Progettazione

Data warehouse Analisi dei dati

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

Data warehouse Analisi dei dati

Rassegna sui principi e sui sistemi di Data Warehousing

Data Warehousing (DW)

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Redazione e Presentazione di Progetti Informatici

Data Warehousing e Business Intelligence

Sistema Informativo Statistico Regione Campania

On Line Analytical Processing

I Componenti del processo decisionale 7

Corso integrato di Sistemi di Elaborazione. Modulo I. Prof. Crescenzio Gallo.

BASI DI DATI E UTENTI DI BASI DI DATI

DSS. Decision Support System. 12/11/2008 Fondamenti Informatica 2 - Prof. Gregorio Cosentino 1

Sistemi Informativi Avanzati Anno Accademico 2012/2013 Prof. Domenico Beneventano. Archi multipli

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

Thematica Software Technologies

Data warehouse: analisi dei dati

8. Architetture per l analisi dei dati

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

Logistica e nuove prospettive con le soluzioni di business analytics di SAP

Governo Digitale a.a. 2011/12

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data warehouse Progettazione

Basi di Dati. Corso di Laurea in Informatica Corso B A.A. 2015/16. Dr. Claudia d'amato. Dipartimento di Informatica, Università degli Studi Bari

Introduzione ad OLAP Metodi e Modelli per il Supporto alle Decisioni Paolo Avallone IT Specialist Sr Consulting DB2, Data Management

UN DATAWAREHOUSE PER IL CONTROLLO E MONITORAGGIO DELLA SPESA FARMACEUTICA CONVENZIONATA

UTILIZZO DEI SISTEMI INFORMATIVI PER IL SUPPORTO DELLE DECISIONI ARCHITETTURA DI RIFERIMENTO

Sistemi Informativi Avanzati Anno Accademico 2013/2014 Prof. Domenico Beneventano. Archi multipli

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

Data Warehouse e OLAP

Data warehouse Progettazione

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Filippo Geraci DATA WAREHOUSING

Datawarehouse. Proge.azione logica

Data warehouse Progettazione

Data Warehousing. Esercitazione 2

SISTEMI INFORMATIVI DIREZIONALI BUSINESS INTELLIGENCE

Data warehousing e OLAP (tratti da slides di C.Renso e C.Gozzi)

A.s Programma di Informatica

Convegno organizzato dall Associazione ICT Dott.com. Business Intelligence L utilità per le imprese. Prof. Elena Baralis. Politecnico di Torino

OLAP On Line Analytical Processing

BASI DI DATI DISTRIBUITE

INFORMATICA PER LE SCIENZE UMANE a.a. 2016/2017

Elena Baralis 2007 Politecnico di Torino 1

Elena Baralis 2007 Politecnico di Torino 1

Sistemi informativi D B M G. Introduzione. Introduzione alle basi di dati D B M G 2. Elena Baralis 2007 Politecnico di Torino 1

Sistemi Informativi su Web

Gestione delle informazioni Base di dati Modello dei dati Indipendenza dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS

Elena Baralis 2007 Politecnico di Torino 1

Ambienti Operativi per OLAP. Casi di Studio

ASPETTO SOFTWARE. Estensione del sistema operativo di un pc, ovvero un software di base che permette la comunicazione con gli utenti

INFORMATICA PER LE SCIENZE UMANE a.a. 2015/2016

sfide, opportunitàe competenze per i professionistidell ICT

Laboratorio di Sistemi Informativi Aziendali a.a

Basi di Dati e Sistemi Informativi. Analisi dei Dati: OLAP, Data Warehousing, Data Mining

Syllabus A042 Insegnamenti disciplinari

Università degli Studi di Camerino Sabrina Di Bartolomeo. Qualcuno di voi ha mai sentito parlare di Fleet Management System? Avete idea di cosa ci

Basi di dati Architetture e linee di evoluzione

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

Informazioni generali sul corso

Introduzione al data warehousing

INFORMATICA PER LE SCIENZE UMANE a.a. 2017/2018

Agenda. I sistemi a supporto delle decisioni Information Directory Sviluppi futuri. Cinque anni di Data Warehouse:dai dati alle decisioni 1

SISTEMI INFORMATIVI E DATABASE

Il Ciclo di Vita del Data Warehouse

PROGRAMMAZIONE DIDATTICA DI DIPARTIMENTO A.S. 2017/2018

Transcript:

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, D MG B Data warehouse Introduzione INTRODUZIONE - 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi di dati contenenti dati di tipo operativo queste basi di dati costituiscono una potenziale miniera di informazioni utili Sistemi per il supporto alle decisioni permettono di analizzare lo stato dell azienda prendere decisioni rapide e migliori INTRODUZIONE - 2 Pag. 1

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Supporto alle decisioni aziendali Analisi e previsione dell evoluzione della domanda Individuazione di aree critiche Chiarezza dei conti e trasparenza finanziaria reporting, pratiche antifrode e antiriciclaggio Definizione e realizzazione di strategie vincenti contenimento di costi e aumento di profitti INTRODUZIONE - 3 Business Intelligence Database and data mining group, Disciplina di supporto alla decisione strategica aziendale Obiettivo: trasformazione dei dati aziendali in informazioni fruibili a livelli diversi di dettaglio per applicazioni di analisi Tipologia di utenza eterogenea Necessaria un adeguata infrastruttura hardware e software di supporto INTRODUZIONE - 4 Pag. 2

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Ambiti applicativi Database and data mining group, Industrie manifatturiere: gestione ordini e spedizioni, supporto clienti Distribuzione: profilo utenti, gestione magazzino Servizi finanziari: analisi acquisti (carta di credito) Assicurazioni: analisi richieste indennizzo, riconoscimento frodi Telecomunicazioni: analisi delle chiamate, riconoscimento frodi Servizi pubblici: analisi dell utilizzo Sanità: analisi dei risultati INTRODUZIONE - 5 Data warehouse Database and data mining group, Base di dati per il supporto alle decisioni, che è mantenuta separatamente dalle basi di dati operative dell azienda Dati orientati ai soggetti di interesse integrati e consistenti dipendenti dal tempo, non volatili utilizzati per il supporto alle decisioni aziendali W. H. Inmon, Building the data warehouse, 1992 INTRODUZIONE - 6 Pag. 3

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Perché dati separati? Database and data mining group, Prestazioni ricerche complesse riducono le prestazioni i delle transazioni operative metodi di accesso diversi a livello fisico Gestione dei dati informazioni mancanti (storico) consolidamento dei dati qualità dei dati (problema di inconsistenze) INTRODUZIONE - 7 Database and data mining group, D MG B Struttura e analisi dei dati INTRODUZIONE - 8 Pag. 4

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Rappresentazione multidimensionale Dati rappresentati a come un (iper)cubo con tre o più dimensioni Misure su cui si esegue l analisi: elementi individuati all intersezione delle dimensioni Data warehouse per l analisi delle vendite di una catena di supermercati assi dimensionali: prodotto, negozio, tempo misure: quantità venduta, importo della vendita, INTRODUZIONE - 9 Database and data mining group, Rappresentazione multidimensionale negozio 3 SupShop prodotto tempo 2-3-2001 INTRODUZIONE - 10 latte Tratto da Golfarelli, Rizzi, Data warehouse, teoria e pratica della progettazione, McGraw Hill 2006 Pag. 5

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Rappresentazione relazionale: modello a stella Misure numeriche memorizzate nella tabella dei fatti gli attributi contengono valori numerici Le dimensioni descrivono il contesto di ogni misura nella tabella dei fatti contengono molti attributi descrittivi INTRODUZIONE - 11 Esempio Database and data mining group, Data warehouse per l analisi delle vendite di una catena di supermercati Negozi Vendite Prodotti Tempo INTRODUZIONE - 12 Pag. 6

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Dimensione del data warehouse dimensione tempo: 2 anni x 365 giorni dimensione negozio: 300 negozi dimensione prodotto: 30.000 prodotti, di cui 3.000 venduti ogni giorno in ogni negozio numero di righe della tabella dei fatti: 730 x 300 x 3000 = 657 milioni spazio occupato dalla tabella dei fatti 21GB INTRODUZIONE - 13 Database and data mining group, Strumenti di analisi dei dati Analisi OLAP: calcolo di funzioni aggregate complesse necessità di fornire supporto a diversi tipi di funzione aggregata (esempi: media mobile, top ten) Analisi dei dati mediante tecniche di data mining varie tipologie di analisi pesante componente algoritmica INTRODUZIONE - 14 Pag. 7

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Strumenti di analisi dei dati Presentazione attività distinta dalla ricerca: i dati ottenuti da una ricerca possono essere rappresentati mediante diversi tipi di strumenti di rappresentazione Ricerca di motivazioni esplorazione dei dati mediante approfondimenti (esempio: drill down) INTRODUZIONE - 15 Database and data mining group, D MG B Architetture per data warehouse INTRODUZIONE - 16 Pag. 8

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Architetture per data warehouse Separazione tra elaborazione transazionale e analisi dei dati evitare le architetture a un livello Architetture a due o più livelli separano in misura diversa i dati in ingresso nel data warehouse dai dati oggetto dell analisi maggiormente scalabili INTRODUZIONE - 17 Database and data mining group, Elementi costitutivi di un data warehouse Metadati Gestione DW OLAP servers Strumenti ETL Strumenti di analisi Sorgenti di dati (esterne) Data warehouse Analisi dei dati Data marts INTRODUZIONE - 18 Pag. 9

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Data warehouse e data mart Warehouse aziendale: contiene informazioni sul funzionamento di tutta l azienda processo di modellazione funzionale esteso progettazione e realizzazione richiedono molto tempo Data mart: sottoinsieme dipartimentale focalizzato su un settore prefissato due possibilità alimentato dal data warehouse primario alimentato direttamente dalle sorgenti realizzazione più rapida richiede progettazione attenta, in modo da evitare problemi di integrazione in seguito INTRODUZIONE - 19 Database and data mining group, Server per data warehouse Server ROLAP (Relational OLAP) DBMS relazionale esteso rappresentazione compatta di dati sparsi estensioni SQL per aggregati metodi di accesso speciali che realizzano le operazioni di accesso in modo efficiente Server MOLAP (Multidimensional OLAP) dati rappresentati in forma matriciale (multidimensionale) proprietaria dati sparsi richiedono compressione primitive OLAP speciali Server HOLAP (Hybrid OLAP) INTRODUZIONE - 20 Pag. 10

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Strumenti ETL Database and data mining group, Processo di preparazione dei dati da introdurre nel data warehouse Extraction Transformation Loading Processo eseguito durante il primo popolamento del DW l aggiornamento periodico dei dati INTRODUZIONE - 21 Processo ETL Database and data mining group, Estrazione: acquisizione dei dati dalle sorgenti Pulitura: operazioni volte al miglioramento della qualità dei dati (correttezza e consistenza) Trasformazione: conversione dei dati dal formato operazionale a quello del data warehouse (integrazione) Caricamento: propagazione degli aggiornamenti al data warehouse INTRODUZIONE - 22 Pag. 11

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Metadati Database and data mining group, Metadati = dati sui dati Diversi tipi di metadati per trasformazione e caricamento: descrivono i dati sorgenti e le trasformazioni necessarie utile usare una notazione comune per dati sorgente e dati risultanti dalle trasformazioni CWMI (Common Warehouse Metadata Initiative): standard proposto da OMG per l interscambio di dati tra strumenti DW e repository di metadati in ambienti eterogenei e distribuiti per la gestione dei dati: descrivono la struttura dei dati presenti nel data warehouse anche per dati derivati, quali le viste materializzate per la gestione delle query: dati sulla struttura delle query e monitoraggio della loro esecuzione codice SQL della query piano di esecuzione uso di memoria e CPU INTRODUZIONE - 23 Architettura a due livelli Database and data mining group, Metadati Gestione DW OLAP servers Strumenti ETL Strumenti di analisi Sorgenti di dati (operazionali ed esterni) Livello delle sorgenti Data warehouse Data marts Analisi dei dati Livello del data warehouse INTRODUZIONE - 24 Pag. 12

DataBase and Data Mining Group of DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Caratteristiche delle architetture a 2 livelli Disaccoppiamento dalle sorgenti possibilità di gestire dati esterni al sistema OLTP modellazione dei dati adatta all analisi OLAP progettazione fisica del data warehouse mirata al carico analitico Facilità di gestione delle differenti granularità temporali dei dati operazionali e analitici Separazione del carico transazionale da quello analitico Necessità di svolgere al volo la preparazione dei dati (ETL) INTRODUZIONE - 25 Architettura a tre livelli Database and data mining group, OLAP servers Strumenti ETL Metadati Gestione DW Loading Staging area Data warehouse Sorgenti di dati (operaz. ed esterni) Livello di alimentazione Livello delle Data marts sorgenti Livello del data warehouse INTRODUZIONE - 26 Strumenti di analisi Analisi dei dati Pag. 13

DataBase and Data Mining Group of DataBase and Data Mining Group of Database and data mining group, Caratteristiche delle architetture a 3 livelli Staging area: area di transito che permette di separare l elaborazione ET dal caricamento nel data warehouse permette operazioni complesse di trasformazione e pulizia dei dati offre un modello integrato dei dati aziendali, ancora vicino alla rappresentazione OLTP talvolta denominata Operational Data Store (ODS) Introduce ulteriore ridondanza aumenta lo spazio necessario per i dati INTRODUZIONE - 27 Pag. 14