Data warehouse: introduzione

Documenti analoghi
Data warehouse Introduzione

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Basi di Dati Direzionali

Il modello multidimensionale. Per le slides si ringrazia il Prof. Stefano Rizzi ( e il Dott.

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data warehouse Analisi dei dati

Data Warehouse Architettura e Progettazione

Analisi dei dati. analisi dei dati 1

Data Warehousing e Data Mining

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

Introduzione al Data Warehousing

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Dall intuizione alla conoscenza

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Data Warehousing (DW)

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

I S.I. DIREZIONALI (BUSINESS INTELLIGENCE)

Sistema Informativo Statistico Regione Campania

Data warehouse: progettazione

Sistemi Informativi Avanzati Anno Accademico 2013/2014 Prof. Domenico Beneventano. Archi multipli

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Introduzione al data warehousing

Governo Digitale a.a. 2011/12

Rassegna sui principi e sui sistemi di Data Warehousing

Thematica Software Technologies

DSS. Decision Support System. 12/11/2008 Fondamenti Informatica 2 - Prof. Gregorio Cosentino 1

BASI DI DATI E UTENTI DI BASI DI DATI

On Line Analytical Processing

Data warehouse (parte 1)

Elena Baralis 2007 Politecnico di Torino 1

Sviluppo Applicazione di BI/DWH. con tecnologia Microsoft. per il supporto della catena logistica

Introduzione alla Business Intelligence

INFORMATICA PER LE SCIENZE UMANE a.a. 2016/2017

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

INFORMATICA PER LE SCIENZE UMANE a.a. 2015/2016

Logistica e nuove prospettive con le soluzioni di business analytics di SAP

Introduzione al Data Warehousing

Cosa è un data warehouse?

ASPETTO SOFTWARE. Estensione del sistema operativo di un pc, ovvero un software di base che permette la comunicazione con gli utenti

Architetture per l analisi di dati

Data warehouse Progettazione

Sistemi Informativi e Commercio Elettronico

Data Warehouse e OLAP

8. Architetture per l analisi dei dati

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

Architetture per l analisi dei dati

OLAP On Line Analytical Processing

Inventario (studio di caso)

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

Cap. 1-I 1 I sistemi informatici

Basi di Dati Complementi Esercitazione su Data Warehouse

SQL Server BI Development Studio. SQL Server Business Intelligence Development Studio. Analysis Services

Basi di Dati e Sistemi Informativi. Analisi dei Dati: OLAP, Data Warehousing, Data Mining

Lezione 3. Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing

Estensioni del linguaggio SQL per interrogazioni OLAP

SQL e linguaggi di programmazione. Cursori. Cursori. L interazione con l ambiente SQL può avvenire in 3 modi:

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione

SQL Server BI Development Studio

Agenda. I sistemi a supporto delle decisioni Information Directory Sviluppi futuri. Cinque anni di Data Warehouse:dai dati alle decisioni 1

Forum PA Big Data e Analytics: modelli, analisi e previsioni, per valorizzare l'enorme patrimonio informativo pubblico

Ambienti Operativi per OLAP. Casi di Studio

Informatica per le Scienze Umane. Introduzione al corso: programma

Informatica per le Scienze Umane. Introduzione al corso: programma dettagliato

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

Dynamic Warehousing: la tecnologia a supporto della Business Intelligence 2.0. Giulia Caliari Software IT Architect

Catena del valore (studio di caso)

! Un arco multiplo corrisponde ad un associazione molti-a-molti: il padre (libro) non determina funzionalmente il figlio (autore)

Data Warehousing. Esercitazione 2

Introduzione alla Business Intelligence.

sfide, opportunitàe competenze per i professionistidell ICT

UN DATAWAREHOUSE PER IL CONTROLLO E MONITORAGGIO DELLA SPESA FARMACEUTICA CONVENZIONATA

Strategie top-down. Primitive di trasformazione top-down. Primitive di trasformazione top-down

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Informazioni generali sul corso

Data Warehousing: concetti base e metodologie

CONFRONTA BANCA CONTABILITÀ CONTABILITÀ INCASSI

Syllabus A042 Insegnamenti disciplinari

Basi di dati. Elena Baralis Politecnico di Torino

Data warehousing con SQL Server

DATA WAREHOUSING CON JASPERSOFT BI SUITE

Basi di dati Architetture e linee di evoluzione

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

Il sistema informativo aziendale

4 Introduzione al data warehousing

SISTEMI INFORMATIVI AZIENDALI

2011 Politecnico di Torino 1

RRF Reply Reporting Framework

SISTEMI INFORMATIVI E DATABASE

Il Ciclo di Vita del Data Warehouse

Dipartimento di Ingegneria. Corso di Laurea classe L-8 in Ingegneria Elettronica e Informatica conforme al D.M. 270

Basi di dati Basi di dati per bioinformatica

Il Dimensional Fact Model

Il Data Warehousing. Prof. Stefano Rizzi Alma Mater Studiorum - Università di Bologna

Data warehousing e OLAP

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Supporto al Direttore (ChiefTechnologyOfficer) - nell analisi dell evoluzione tecnologica e del relativo potenziale applicato all Amministrazione

Governo Digitale a.a. 2007/08

Transcript:

atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of B MG ata warehouse: introduzione ata warehouse Introduzione atabase and data mining group, M B G Business Intelligence atabase and data mining group, isciplina di supporto alla decisione strategica aziendale Obiettivo: trasformazione aziendali in informazioni fruibili a livelli diversi di dettaglio per applicazioni di Tipologia di utenza eterogenea Necessaria un adeguata infrastruttura hardware e software di supporto INTROUZIONE - 1 INTROUZIONE - 4 atabase and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi di dati contenenti dati di tipo operativo queste basi di dati costituiscono una potenziale miniera di informazioni utili Sistemi per il supporto alle decisioni permettono di analizzare lo stato dell azienda prendere decisioni rapide e migliori Ambiti applicativi atabase and data mining group, Industrie manifatturiere: gestione ordini e spedizioni, supporto clienti istribuzione: profilo utenti, gestione magazzino Servizi finanziari: acquisti (carta di credito) Assicurazioni: richieste indennizzo, riconoscimento frodi Telecomunicazioni: delle chiamate, riconoscimento frodi Servizi pubblici: dell utilizzo Sanità: dei risultati INTROUZIONE - 2 INTROUZIONE - 5 atabase and data mining group, Supporto alle decisioni aziendali e previsione dell evoluzione della domanda Individuazione di aree critiche Chiarezza dei conti e trasparenza finanziaria reporting, pratiche antifrode e antiriciclaggio efinizione e realizzazione di strategie vincenti contenimento di costi e aumento di profitti ata warehouse atabase and data mining group, Base di dati per il supporto alle decisioni, che è mantenuta separatamente dalle basi di dati operative dell azienda ati orientati ai soggetti di interesse integrati e consistenti dipendenti dal tempo, non volatili utilizzati per il supporto alle decisioni aziendali W. H. Inmon, Building the, 1992 INTROUZIONE - 3 INTROUZIONE - 6 Pag. 1

atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of B MG ata warehouse: introduzione Perché dati separati? atabase and data mining group, atabase and data mining group, Rappresentazione multidimensionale Prestazioni ricerche complesse riducono le prestazioni delle transazioni operative metodi di accesso diversi a livello fisico Gestione informazioni mancanti (storico) consolidamento qualità (problema di inconsistenze) INTROUZIONE - 7 tempo 3 2-3-2001 INTROUZIONE - 10 negozio SupShop latte prodotto Tratto da Golfarelli, Rizzi, ata warehouse, teoria e pratica della progettazione, McGraw Hill 2006 Struttura e atabase and data mining group, M B G atabase and data mining group, Rappresentazione relazionale: modello a stella Misure numeriche memorizzate nella tabella dei fatti gli attributi contengono valori numerici Le dimensioni descrivono il contesto di ogni misura nella tabella dei fatti contengono molti attributi descrittivi INTROUZIONE - 8 INTROUZIONE - 11 atabase and data mining group, Rappresentazione multidimensionale ati rappresentati come un (iper)cubo con tre o più dimensioni Misure su cui si esegue l : elementi individuati id all intersezione i delle dimensionii i ata warehouse per l delle vendite di una catena di supermercati assi dimensionali: prodotto, negozio, tempo misure: quantità venduta, importo della vendita, Esempio atabase and data mining group, ata warehouse per l delle vendite di una catena di supermercati Negozi Vendite Prodotti Tempo INTROUZIONE - 9 INTROUZIONE - 12 Pag. 2

atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of B MG ata warehouse: introduzione atabase and data mining group, imensione del atabase and data mining group, M B G dimensione tempo: 2 anni x 365 giorni dimensione negozio: 300 negozi dimensione prodotto: 30.000 prodotti, di cui 3.000 venduti ogni giorno in ogni negozio numero di righe della tabella dei fatti: 730 x 300 x 3000 = 657 milioni spazio occupato dalla tabella dei fatti 21GB Architetture per INTROUZIONE - 13 INTROUZIONE - 16 atabase and data mining group, atabase and data mining group, Architetture per OLAP: calcolo di funzioni aggregate complesse necessità di fornire supporto a diversi tipi di funzione aggregata (esempi: media mobile, top ten) mediante tecniche di data mining varie tipologie di pesante componente algoritmica Separazione tra elaborazione transazionale e evitare le architetture a un livello Architetture a due o più livelli separano in misura diversa i dati in ingresso nel data warehouse dai dati oggetto dell maggiormente scalabili INTROUZIONE - 14 INTROUZIONE - 17 atabase and data mining group, Presentazione attività distinta dalla ricerca: i dati ottenuti da una ricerca possono essere rappresentati mediante diversi tipi di strumenti di rappresentazione Ricerca di motivazioni esplorazione mediante approfondimenti (esempio: drill down) atabase and data mining group, Elementi costitutivi di un Gestione W dati (esterne) ata warehouse ata marts INTROUZIONE - 15 INTROUZIONE - 18 Pag. 3

atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of B MG ata warehouse: introduzione atabase and data mining group, ata warehouse e data mart Warehouse aziendale: contiene informazioni sul funzionamento di tutta l azienda processo di modellazione funzionale esteso progettazione e realizzazione richiedono molto tempo ata mart: sottoinsieme dipartimentale focalizzato su un settore prefissato due possibilità alimentato dal primario alimentato direttamente dalle sorgenti realizzazione più rapida richiede progettazione attenta, in modo da evitare problemi di integrazione in seguito Processo ETL atabase and data mining group, Estrazione: acquisizione dalle sorgenti Pulitura: operazioni volte al miglioramento della qualità (correttezza e consistenza) Trasformazione: conversione dal formato operazionale a quello del (integrazione) Caricamento: propagazione degli aggiornamenti al INTROUZIONE - 19 INTROUZIONE - 22 atabase and data mining group, Server per Server ROLAP (Relational OLAP) BMS relazionale esteso rappresentazione compatta di dati sparsi estensioni SQL per aggregati metodi di accesso speciali che realizzano le operazioni di accesso in modo efficiente i Server MOLAP (Multidimensional OLAP) dati rappresentati in forma matriciale (multidimensionale) proprietaria dati sparsi richiedono compressione primitive OLAP speciali Server HOLAP (Hybrid OLAP) INTROUZIONE - 20 atabase and data mining group, = dati sui dati iversi tipi di metadati per trasformazione e caricamento: descrivono i dati sorgenti e le trasformazioni necessarie utile usare una notazione comune per dati sorgente e dati risultanti dalle trasformazioni CWMI (Common Warehouse Metadata Initiative): standard proposto da OMG per l interscambio di dati tra strumenti W e repository di metadati in ambienti eterogenei e distribuiti per la gestione : descrivono la struttura presenti nel anche per dati derivati, quali le viste materializzate per la gestione delle query: dati sulla struttura delle query e monitoraggio della loro esecuzione codice SQL della query piano di esecuzione uso di memoria e CPU INTROUZIONE - 23 atabase and data mining group, Processo di preparazione da introdurre nel Extraction Transformation Loading Processo eseguito durante il primo popolamento del W l aggiornamento periodico Architettura a due livelli Gestione W dati (operazionali ed esterni) ata warehouse atabase and data mining group, Livello delle sorgenti ata marts Livello del INTROUZIONE - 21 INTROUZIONE - 24 Pag. 4

atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of atabase and ata Mining Group of B MG ata warehouse: introduzione atabase and data mining group, Caratteristiche delle architetture a 2 livelli isaccoppiamento dalle sorgenti possibilità di gestire dati esterni al sistema OLTP modellazione adatta all OLAP progettazione fisica del mirata al carico analitico Facilità di gestione delle differenti granularità temporali operazionali e analitici Separazione del carico transazionale da quello analitico Necessità di svolgere al volo la preparazione dei dati (ETL) INTROUZIONE - 25 Architettura a tre livelli atabase and data mining group, Strumenti ETL dati (operaz. ed esterni) Livello delle sorgenti Gestione W Staging area Loading Livello di alimentazione ata warehouse INTROUZIONE - 26 ata marts Livello del atabase and data mining group, Caratteristiche delle architetture a 3 livelli Staging area: area di transito che permette di separare l elaborazione ET dal caricamento nel permette operazioni complesse di trasformazione e pulizia ia offre un modello integrato aziendali, ancora vicino alla rappresentazione OLTP talvolta denominata Operational ata Store (OS) Introduce ulteriore ridondanza aumenta lo spazio necessario per i dati INTROUZIONE - 27 Pag. 5