4 Introduzione al data warehousing



Documenti analoghi
Introduzione al data warehousing

Cosa è un data warehouse?

Corso di basi di dati Fascicolo T04b Nota: i primi lucidi sostituiscono alcuni già proposti, in altro ordine e ccon qualche differenza, nel fascicolo

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Governo Digitale a.a. 2011/12

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Architetture per l analisi di dati

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data Warehousing: concetti base e metodologie

Data warehouse Introduzione

On Line Analytical Processing

Ciclo di vita dimensionale

Data Warehousing (DW)

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

Il modello dimensionale

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Data Warehousing e Data Mining

Sistemi Informativi Aziendali I

Basi di Dati Complementi Esercitazione su Data Warehouse

Sistemi informativi secondo prospettive combinate

B C I un altro punto di vista Introduzione

Rassegna sui principi e sui sistemi di Data Warehousing

Introduzione ad OLAP (On-Line Analytical Processing)

BI: la genesi di un progetto Gruppo FINSA

Sistemi di supporto alle decisioni

OLAP On Line Analytical Processing

Customer Relationship Management. Eleonora Ploncher 3 aprile 2006

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione

Business Intelligence Revorg. Roadmap. Revorg Business Intelligence. trasforma i dati operativi quotidiani in informazioni strategiche.

Introduzione a data warehousing e OLAP

Informazioni generali sul corso

Il database management system Access

DSCube. L analisi dei dati come strumento per i processi decisionali

Ambienti Operativi per OLAP. Casi di Studio

Lezione 1. Introduzione e Modellazione Concettuale

Gestione di ordini (studio di caso)

SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

INDICE CONROLLO DI GESTIONE E SISTEMI INFORMATIVI AZIENDALI IL CONTROLLO DI GESTIONE E GLI ALTRI MECCANISMI OPERATIVI

Introduzione alla Business Intelligence

Il ruolo dei sistemi di supporto alle decisioni nel recupero di efficienza aziendale. 18 aprile 2005 Carlo Masseroli

Data Warehousing. Sommario. Luca Cabibbo, Riccardo Torlone, Paolo Atzeni. Processi. Processi, dati e decisioni. Processi presso una banca

Data warehousing con SQL Server

Convegno 6 giugno 2013 Federlazio Frosinone

slogan Datawarehouse e Datamining Una verità attuale Esigenze degli utenti (Kimball 1996) a.a. 2006/2007 Introduzione

Introduzione alla Business Intelligence.

02/mag/2012. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

PBI Passepartout Business Intelligence

Il modello di ottimizzazione SAM

Basi di dati. Corso di Laurea in Ingegneria Informatica Canale di Ingegneria delle Reti e dei Sistemi Informatici - Polo di Rieti

25/11/14 ORGANIZZAZIONE AZIENDALE. Tecnologie dell informazione e controllo

Marketing relazionale

Data warehousing e OLAP

CAPITOLO CAPIT Tecnologie dell ecnologie dell info inf rmazione e controllo

Overview. Le soluzioni Microsoft per la Business Intelligence

REALIZZARE UN MODELLO DI IMPRESA

Integrazione dei processi aziendali Sistemi ERP e CRM. Alice Pavarani

AICA - Workshop 01/03/2011

Sistema informativo. Combinazione di risorse umane, materiali e procedure per la gestione. (raccolta, archiviazione, elaborazione, scambio )

LEZIONE 2 SISTEMI INFORMATIVI DIREZIONALI

Data warehousing con SQL Server

Data Mining a.a

Data warehousing con SQL Server

IL PERFORMANCE MANAGEMENT

SQL Server. Applicazioni principali

SISTEMA INFORMATIVO DIREZIONE E CONTROLLO

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi

SQL Server BI Development Studio

RRF Reply Reporting Framework

Lezione 9. Microsoft Analysis Services: Principi e Funzionalità

DATA WAREHOUSING CON JASPERSOFT BI SUITE

Lezione 4. Controllo di gestione. Il controllo direzionale

Introduzione al Data Warehousing

Enrico Pedemonte 19 Febbraio 2013 Club Finanza d Impresa

Corso di Complementi di Basi di dati A.A Data Warehouse

UNA SOLUZIONE PER IL PERFORMANCE MANAGEMENT


Data Warehouse Architettura e Progettazione

INDICE :25 Pagina V. Indice

Data Warehousing. Paolo Atzeni. (con materiale di Luca Cabibbo e Riccardo Torlone) 5 giugno 2008

L orientamento gestionale delle informazioni contabili. Nicola Castellano

Data Warehousing. LucaCabibbo, Riccardo Torlone, Paolo Atzeni. Sommario

Database Commerciali/ Marketing. Indice: 1. Gli elementi chiave del db commerciale/ marketing 2. Come si costruisce un db commerciale/ marketing

Data warehouse (parte 1)

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Specifiche tecniche e funzionali del Sistema Orchestra

BASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015

I sistemi di reporting e i rapporti direzionali

ersità Carlo Ca/aneo - LIUC emi di Business Intelligence

IL CONTROLLO DI GESTIONE

PRODUCT LIFECYCLE MANAGEMENT

Lorenzo Braidi. Database design. Libro_datadesign.indb :06:17

EasyMACHINERY ERPGestionaleCRM. partner

d 2 i e Visual Data Mining : Un ambiente integrato per l estrazione della conoscenza dai dati della produzione industriale

ILMS. Integrated Learning Management System

Transcript:

Che cosa è un data warehouse? Introduzione al data warehousing 22 maggio 2001 Un data warehouse è una base di dati collezione di dati di grandi dimensioni, persistente e condivisa gestita in maniera efficace, efficiente ed affidabile con delle caratteristiche peculiari utilizzata principalmente per il supporto alle decisioni direzionali integrata aziendale e non dipartimentale con dati storici con un ampio orizzonte temporale con dati tipicamente aggregati per effettuare stime fuori linea aggiornata periodicamente mantenuta separatamente dalle basi di dati 2 Introduzione al data warehousing Motivazioni I sistemi informatici permettono di aumentare la produttività delle organizzazioni automatizzandone la gestione quotidiana dei processi operativi vendite nelle catene di supermercati instradamento e la contabilizzazione delle telefonate Questi dati se opportunamente accumulati e analizzati possono essere utilizzati per supportare i processi gestionali e direzionali, ovvero per la pianificazione e il supporto alle decisioni promozioni dei prodotti offerta di contratti diversificati dei dati Un data warehouse ha lo scopo di supportare le decisioni direzionali, ad esempio permettendo di calcolare (in modo efficiente) le seguenti interrogazioni quali sono stati i volumi di vendita dello scorso anno per regione e categoria di prodotto? quali prodotti hanno aumentato il livello delle vendite a fronte di una certa offerta promozionale? qual è stata la profittabilità delle campagne promozionali degli ultimi cinque anni? quali prodotti vanno pubblicizzati e venduti in offerta nella prossima campagna promozionale estiva? Una corretta gestione dei dati storici può essere occasione di un grande vantaggio competitivo 3 Introduzione al data warehousing 4 Introduzione al data warehousing

OLTP I sistemi di gestione di basi di dati relazionali sono normalmente ottimizzati per supportare le operazioni transazionali (OLTP, On Line Transaction Processing) le transazioni sono predefinite e di breve durata i dati di interesse sono dettagliati, aggiornati e recenti i dati risiedono su una unica base di dati leggono e/o modificano pochi record le proprietà transazionali sono critiche architettura (principalmente) centralizzata I sistemi di supporto alle decisioni dovrebbero invece supportare l elaborazione analitica (, On-Line Analytical Processing), che ha le seguenti caratteristiche le interrogazioni sono complesse e casuali i dati di interesse sono tipicamente storici e aggregati i dati possono provenire da più basi di dati possibilmente non omogenee leggono un numero enorme di record non scrivono mai le risposte alle interrogazioni sono attese in linea la visualizzazione dei dati è fondamentale architettura client-server 5 Introduzione al data warehousing 6 Introduzione al data warehousing OLTP e OLTP Utente impiegato dirigente Funzione operazioni giornaliere supporto alle decisioni Progettazione orientata all'applicazione orientata ai dati Dati correnti, aggiornati, dettagliati, relazionali, omogenei storici, aggregati, multidimensionali, eterogenei Uso ripetitivo casuale Accesso read-write, indicizzato read, sequenziale Unità di lavoro transazione breve interrogazione complessa Record acc. decine milioni N. utenti migliaia centinaia Dimensione 100MB - 1GB 100GB - 1TB Metrica throughput tempo di risposta Definizione di data warehouse Un data warehouse è una base di dati utilizzata principalmente per il supporto alle decisioni direzionali integrata aziendale e non dipartimentale con dati storici con un ampio orizzonte temporale, e indicazione di almeno un elemento di tempo con dati tipicamente aggregati per effettuare stime fuori linea i dati sono aggiornati periodicamente mantenuta separata dalle basi di dati 7 Introduzione al data warehousing 8 Introduzione al data warehousing

Architettura generale per il data warehousing Architettura per il data warehousing (Inmon) Data Warehouse Data Warehouse Data Mart dei dati dei dati 9 Introduzione al data warehousing 10 Introduzione al data warehousing Architettura per il data warehousing (Kimball) Elementi di un data warehouse dei dati Data Mart source systems extract data staging area Storage: file, RDBMS, other Processing: clean, prune, combine, remove duplicates, household, standardize, conform dimensions, store awaiting replication, archive, export to data marts populate, replicate, recover data warehouse presentation servers Data Mart #1: (R/M/H) dimensional query services, subject oriented, locally implemented, user group driven, may store atomic data, may be frequently refreshed, conforms to DW bus DW BUS Data Mart #2 Data Mart #3 feed Conformed dimensions Conformed facts end user data access Ad hoc query tools Report writers End user applications Models: forecasting, scoring, allocating, data mining, other 11 Introduzione al data warehousing upload cleaned dimensions upload model results 12 Introduzione al data warehousing

Dati multidimensionali L analisi dei dati avviene su dati rappresentati in forma multi, ovvero organizzati mediante i seguenti concetti fatto (o processo) un concetto sul quale centrare l analisi misura una proprietà atomica o misura di un fatto da analizzare le misure sono solitamente valori numerici e additivi su un dominio continuo dimensione una prospettiva rispetto alla quale effettuare l analisi le dimensioni descrivono domini discreti, solitamente organizzati in livelli di aggregazione 13 Introduzione al data warehousing Dati multidimensionali Data mart delle vendite fatto: vendite dei prodotti, giornaliere, per negozio dimensioni: prodotto, tempo (giorno), negozio, promozione misure: quantità venduta, incasso, costo, conteggio dei clienti Data mart delle telefonate fatto: telefonata dimensioni: chiamante, chiamato, tariffa, tempo (giorno), tempo (ora del giorno) misure: durata, costo 14 Introduzione al data warehousing Rappresentazione di dati multidimensionali Rappresentazione multi dei dati Time Dimension time_key data anno mese trimestre periodo_fiscale Promotion Dimension promotion_key nome_promozione tipo_riduzione tipo_pubblicità media_pubblicità tipo_esposizione Sales Fact time_key product_key store_key promotion_key dollar_sales units_sales dollar_cost customer_count tabella fatti tabelle dimensione Product Dimension product_key SKU codice_sku marca categoria reparto Store Dimension store_key nome direttore indirizzo città provincia Gli analisti sono abituati a ragionare in termini di dimensioni e misure non di schemi, tabelle e record Vendita Mercati Periodi di tempo Prodotti 15 Introduzione al data warehousing 16 Introduzione al data warehousing

Viste su dati multidimensionali Dimensioni e gerarchie di livelli Il manager regionale esamina la vendita dei prodotti in tutti i periodi relativamente ai propri mercati Il manager finanziario esamina la vendita dei prodotti in tutti i mercati relativamente al periodo corrente e quello precedente Ciascuna dimensione è organizzata in una gerarchia che rappresenta i possibili livelli di aggregazione per i dati negozio, città, provincia, regione prodotto, categoria, marca giorno, mese, trimestre, anno Mercati Prodotti regione anno provincia categoria marca trimestre Tempo città mese Il manager di prodotto esamina la vendita di un prodotto in tutti i periodi e in tutti i mercati Il manager strategico si concentra su una categoria di prodotti, una area regionale e un orizzonte temporale medio negozio prodotto giorno 17 Introduzione al data warehousing 18 Introduzione al data warehousing Operazioni classiche su dati multidimensionali Ciclo di vita Roll up aggrega i dati (rispetto all interrogazione corrente), ovvero mostra dati a un maggior livello di aggregazione Drill down disaggrega i dati (rispetto all interrogazione corrente), ovvero mostra dati a un minor livello di aggregazione Drill across combina i dati associati a più fatti Project Planning Business Requirement Definition Technical Architecture Design Dimensional Modeling Product Selection & Installation Physical Design Data Staging Design & Development Deployment Maintenance & Growth Slice & dice seleziona e proietta solitamente su un piano bi Pivot re-orienta il cubo End-User Application Specification End-User Application Development Project Management 19 Introduzione al data warehousing 20 Introduzione al data warehousing