Data warehouse Introduzione



Documenti analoghi
Data warehouse Introduzione

Data warehouse Introduzione

Data warehouse: introduzione

Data Warehousing (DW)

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Rassegna sui principi e sui sistemi di Data Warehousing

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data Warehouse Architettura e Progettazione

Data Warehousing e Data Mining

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Cosa è un data warehouse?

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Ciclo di vita dimensionale

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

On Line Analytical Processing

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Lezione 3. Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing

Data Mining a.a

Business Intelligence CRM

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

AICA - Workshop 01/03/2011

UNIVERSITÀ DEGLI STUDI DI PADOVA

Customer Relationship Management. Eleonora Ploncher 3 aprile 2006

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence.

Marketing relazionale

Data warehouse (parte 1)

B C I un altro punto di vista Introduzione

Governo Digitale a.a. 2011/12

Lezione 1. Introduzione e Modellazione Concettuale

Introduzione al data warehousing

DATA WAREHOUSING CON JASPERSOFT BI SUITE

ISTITUTO TECNICO ECONOMICO MOSSOTTI

Architetture per l analisi di dati

Business Intelligence & Data Mining. In ambiente Retail

SQL Server. Applicazioni principali

PBI Passepartout Business Intelligence

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

Relazione sul data warehouse e sul data mining

RRF Reply Reporting Framework

Convegno 6 giugno 2013 Federlazio Frosinone

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Data warehousing con SQL Server

Data warehousing con SQL Server

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione

Ambienti Operativi per OLAP. Casi di Studio

sfide, opportunitàe competenze per i professionistidell ICT

BLU.Energy Tecnologia & Servizi gestiti

Scenario di Progettazione

Basi di Dati Relazionali

Il Data Warehousing. Prof. Stefano Rizzi Alma Mater Studiorum - Università di Bologna

Basi di Dati Complementi Esercitazione su Data Warehouse

Sistemi Informativi Aziendali I

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Introduzione al Data Warehousing

Sviluppo Applicazione di BI/DWH. con tecnologia Microsoft. per il supporto della catena logistica

Dominio applicativo. Analisi e ricognizione delle fonti dati

SQL Server BI Development Studio

Lorenzo Braidi. Database design. Libro_datadesign.indb :06:17

Corso di Basi di Dati e Conoscenza

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

comscore: costruire un grande data warehouse per i Big Data

Convegno organizzato dall Associazione ICT Dott.com. Business Intelligence L utilità per le imprese. Prof. Elena Baralis. Politecnico di Torino

Architetture di Data Warehouse. PDF created with pdffactory trial version

Business Intelligence

Data Warehousing: concetti base e metodologie

Agenda. I sistemi a supporto delle decisioni Information Directory Sviluppi futuri. Cinque anni di Data Warehouse:dai dati alle decisioni 1

Introduzione al Data Warehousing

REALIZZARE UN MODELLO DI IMPRESA

Introduzione alla teoria dei database relazionali. Come progettare un database

Al giorno d oggi, i sistemi per la gestione di database

PROPOSTA PER RAFFORZARE DATA WAREHOUSE PER LA CONTABILITA DIREZIONALE

Controllo di Gestione

Sfrutta appieno le potenzialità del software SAP in modo semplice e rapido

SQL/OLAP. Estensioni OLAP in SQL

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

INDICE :25 Pagina V. Indice

La Business Intelligence Ready to go Ready to work

ref building AREA ASSET AREA PROPERTY AREA FACILITY AREA AGENCY SCHEDA DI PRODOTTO CONSISTENZA CATASTO FISCALITA GESTIONE DOCUMENTALE CAD GIS

Specifiche tecniche e funzionali del Sistema Orchestra

Prefazione Sistemi informativi e basi di dati Il modello relazionale Il modello ER

Data warehouse. della spesa sanitaria. acquisizione della conoscenza. Statistical Learning & Information Management

Corso di Access. Prerequisiti. Modulo L2A (Access) 1.1 Concetti di base. Utilizzo elementare del computer Concetti fondamentali di basi di dati

Progettazione Logica. Sviluppo di un Database/DataWarehouse

Beyond Consulting s.r.l. Andrea Pistore Padova, 24 Maggio 2006

DSCube. L analisi dei dati come strumento per i processi decisionali

Business Intelligence. strumento per gli Open Data

SOFTWARE PER LA GESTIONE DELLA MENSA TIME & MEAL

7.1 Livello di completezza degli esempi

OBIETTIVI FORME E STRUMENTI DI SUPPORTO ALL ELABORAZIONE INTEGRATA DEI DATI 51 3/001.0

Informazioni generali sul corso

OGGETTO DELL INFORMATICA AZIENDALE 1 1/002.0

Plurima Katalog. Soluzione di Catalogo Elettronico

Progettaz. e sviluppo Data Base

Cosa bisogna fare per aprire un negozio online? Perché un e-commerce

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena

Transcript:

Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1

Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi di dati contenenti dati di tipo operativo queste basi di dati costituiscono una potenziale miniera di informazioni utili Sistemi per il supporto alle decisioni permettono di analizzare lo stato dell azienda prendere decisioni rapide e migliori INTRODUZIONE - 2 Pag. 2

Database and data mining group, Supporto alle decisioni aziendali Analisi e previsione dell evoluzione della domanda Individuazione di aree critiche Chiarezza dei conti e trasparenza finanziaria reporting, pratiche antifrode e antiriciclaggio Definizione e realizzazione di strategie vincenti contenimento di costi e aumento di profitti INTRODUZIONE - 3 Pag. 3

Business Intelligence Database and data mining group, Disciplina di supporto alla decisione strategica aziendale Obiettivo: trasformazione dei dati aziendali in informazioni fruibili a livelli diversi di dettaglio per applicazioni di analisi Tipologia di utenza eterogenea Necessaria un adeguata infrastruttura hardware e software di supporto INTRODUZIONE - 4 Pag. 4

Ambiti applicativi Database and data mining group, Industrie manifatturiere: gestione ordini e spedizioni, supporto clienti Distribuzione: profilo utenti, gestione magazzino Servizi finanziari: analisi acquisti (carta di credito) Assicurazioni: analisi richieste indennizzo, riconoscimento frodi Telecomunicazioni: analisi delle chiamate, riconoscimento frodi Servizi pubblici: analisi dell utilizzo Sanità: analisi dei risultati INTRODUZIONE - 5 Pag. 5

Data warehouse Database and data mining group, Base di dati per il supporto alle decisioni, che è mantenuta separatamente dalle basi di dati operative dell azienda Dati orientati ai soggetti di interesse integrati e consistenti dipendenti dal tempo, non volatili utilizzati per il supporto alle decisioni aziendali W. H. Inmon, Building the data warehouse, 1992 INTRODUZIONE - 6 Pag. 6

Perché dati separati? Database and data mining group, Prestazioni ricerche complesse riducono le prestazioni delle transazioni operative metodi di accesso diversi a livello fisico Gestione dei dati informazioni mancanti (storico) consolidamento dei dati qualità dei dati (problema di inconsistenze) INTRODUZIONE - 7 Pag. 7

Database and data mining group, Struttura e analisi dei dati INTRODUZIONE - 8 Pag. 8

Database and data mining group, Rappresentazione multidimensionale Dati rappresentati come un (iper)cubo con tre o più dimensioni Misure su cui si esegue l analisi: elementi individuati all intersezione delle dimensioni Data warehouse per l analisi delle vendite di una catena di supermercati assi dimensionali: prodotto, negozio, tempo misure: quantità venduta, importo della vendita, INTRODUZIONE - 9 Pag. 9

Database and data mining group, Rappresentazione multidimensionale negozio 3 SupShop prodotto tempo 2-3-2001 INTRODUZIONE - 10 latte Tratto da Golfarelli, Rizzi, Data warehouse, teoria e pratica della progettazione, McGraw Hill 2006 Pag. 10

Database and data mining group, Rappresentazione relazionale: modello a stella Misure numeriche memorizzate nella tabella dei fatti gli attributi contengono valori numerici Le dimensioni descrivono il contesto di ogni misura nella tabella dei fatti contengono molti attributi descrittivi INTRODUZIONE - 11 Pag. 11

Esempio Database and data mining group, Data warehouse per l analisi delle vendite di una catena di supermercati Negozi Vendite Prodotti Tempo INTRODUZIONE - 12 Pag. 12

Database and data mining group, Dimensione del data warehouse dimensione tempo: 2 anni x 365 giorni dimensione negozio: 300 negozi dimensione prodotto: 30.000 prodotti, di cui 3.000 venduti ogni giorno in ogni negozio numero di righe della tabella dei fatti: 730 x 300 x 3000 = 657 milioni spazio occupato dalla tabella dei fatti 21GB INTRODUZIONE - 13 Pag. 13

Database and data mining group, Strumenti di analisi dei dati Analisi OLAP: calcolo di funzioni aggregate complesse necessità di fornire supporto a diversi tipi di funzione aggregata (esempi: media mobile, top ten) Analisi dei dati mediante tecniche di data mining varie tipologie di analisi pesante componente algoritmica INTRODUZIONE - 14 Pag. 14

Database and data mining group, Strumenti di analisi dei dati Presentazione attività distinta dalla ricerca: i dati ottenuti da una ricerca possono essere rappresentati mediante diversi tipi di strumenti di rappresentazione Ricerca di motivazioni esplorazione dei dati mediante approfondimenti (esempio: drill down) INTRODUZIONE - 15 Pag. 15

Database and data mining group, Architetture per data warehouse INTRODUZIONE - 16 Pag. 16

Database and data mining group, Architetture per data warehouse Separazione tra elaborazione transazionale e analisi dei dati evitare le architetture a un livello Architetture a due o più livelli separano in misura diversa i dati in ingresso nel data warehouse dai dati oggetto dell analisi maggiormente scalabili INTRODUZIONE - 17 Pag. 17

Database and data mining group, Elementi costitutivi di un data warehouse Metadati Gestione DW OLAP servers Strumenti ETL Strumenti di analisi Sorgenti di dati (esterne) Data warehouse Analisi dei dati Data marts INTRODUZIONE - 18 Pag. 18

Database and data mining group, Data warehouse e data mart Warehouse aziendale: contiene informazioni sul funzionamento di tutta l azienda processo di modellazione funzionale esteso progettazione e realizzazione richiedono molto tempo Data mart: sottoinsieme dipartimentale focalizzato su un settore prefissato due possibilità alimentato dal data warehouse primario alimentato direttamente dalle sorgenti realizzazione più rapida richiede progettazione attenta, in modo da evitare problemi di integrazione in seguito INTRODUZIONE - 19 Pag. 19

Database and data mining group, Server per data warehouse Server ROLAP (Relational OLAP) DBMS relazionale esteso rappresentazione compatta di dati sparsi estensioni SQL per aggregati metodi di accesso speciali che realizzano le operazioni di accesso in modo efficiente Server MOLAP (Multidimensional OLAP) dati rappresentati in forma matriciale (multidimensionale) proprietaria dati sparsi richiedono compressione primitive OLAP speciali Server HOLAP (Hybrid OLAP) INTRODUZIONE - 20 Pag. 20

Strumenti ETL Database and data mining group, Processo di preparazione dei dati da introdurre nel data warehouse Extraction Transformation Loading Processo eseguito durante il primo popolamento del DW l aggiornamento periodico dei dati INTRODUZIONE - 21 Pag. 21

Processo ETL Database and data mining group, Estrazione: acquisizione dei dati dalle sorgenti Pulitura: operazioni volte al miglioramento della qualità dei dati (correttezza e consistenza) Trasformazione: conversione dei dati dal formato operazionale a quello del data warehouse (integrazione) Caricamento: propagazione degli aggiornamenti al data warehouse INTRODUZIONE - 22 Pag. 22

Metadati INTRODUZIONE - 23 Database and data mining group, Metadati = dati sui dati Diversi tipi di metadati per trasformazione e caricamento: descrivono i dati sorgenti e le trasformazioni necessarie utile usare una notazione comune per dati sorgente e dati risultanti dalle trasformazioni CWMI (Common Warehouse Metadata Initiative): standard proposto da OMG per l interscambio di dati tra strumenti DW e repository di metadati in ambienti eterogenei e distribuiti per la gestione dei dati: descrivono la struttura dei dati presenti nel data warehouse anche per dati derivati, quali le viste materializzate per la gestione delle query: dati sulla struttura delle query e monitoraggio della loro esecuzione codice SQL della query piano di esecuzione uso di memoria e CPU Pag. 23

Architettura a due livelli Database and data mining group, Metadati Gestione DW OLAP servers Strumenti ETL Strumenti di analisi Sorgenti di dati (operazionali ed esterni) Data warehouse Analisi dei dati Livello delle sorgenti Data marts Livello del data warehouse INTRODUZIONE - 24 Pag. 24

Database and data mining group, Caratteristiche delle architetture a 2 livelli Disaccoppiamento dalle sorgenti possibilità di gestire dati esterni al sistema OLTP modellazione dei dati adatta all analisi OLAP progettazione fisica del data warehouse mirata al carico analitico Facilità di gestione delle differenti granularità temporali dei dati operazionali e analitici Separazione del carico transazionale da quello analitico Necessità di svolgere al volo la preparazione dei dati (ETL) INTRODUZIONE - 25 Pag. 25

Architettura a tre livelli Database and data mining group, OLAP servers Strumenti ETL Sorgenti di dati (operaz. ed esterni) Livello delle sorgenti Metadati Gestione DW Staging area Loading Livello di alimentazione Data warehouse INTRODUZIONE - 26 Data marts Livello del data warehouse Strumenti di analisi Analisi dei dati Pag. 26

Database and data mining group, Caratteristiche delle architetture a 3 livelli Staging area: area di transito che permette di separare l elaborazione ET dal caricamento nel data warehouse permette operazioni complesse di trasformazione e pulizia dei dati offre un modello integrato dei dati aziendali, ancora vicino alla rappresentazione OLTP talvolta denominata Operational Data Store (ODS) Introduce ulteriore ridondanza aumenta lo spazio necessario per i dati INTRODUZIONE - 27 Pag. 27