Introduzione a data warehousing e OLAP



Documenti analoghi
Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data Warehousing (DW)

OLAP On Line Analytical Processing

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Data warehousing con SQL Server

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

On Line Analytical Processing

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Cosa è un data warehouse?

Data warehousing con SQL Server

Data warehousing con SQL Server

Rassegna sui principi e sui sistemi di Data Warehousing

SQL Server BI Development Studio

OLAP On Line Analytical Processing

Data Warehousing e Data Mining

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Data warehouse Introduzione

Data warehousing con SQL Server

SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

Sistemi Informativi Aziendali I

Business Intelligence & Data Mining. In ambiente Retail

Data warehousing e OLAP

La Metodologia adottata nel Corso

Lezione 1. Introduzione e Modellazione Concettuale

Introduzione ad OLAP (On-Line Analytical Processing)

B C I un altro punto di vista Introduzione

Governo Digitale a.a. 2011/12

Relazione sul data warehouse e sul data mining

Introduzione alla Business Intelligence.

Business Intelligence CRM

SQL Server. Applicazioni principali

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

Progetto Turismo Pisa

Caratteristiche principali. Contesti di utilizzo

02/mag/2012. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale. Il Modello Multidimensionale

Progettazione di Basi di Dati

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Architetture per l analisi di dati

REALIZZARE UN MODELLO DI IMPRESA

Introduzione alla Business Intelligence

Data mining e rischi aziendali

Estensioni del linguaggio SQL per interrogazioni OLAP

BI: la genesi di un progetto Gruppo FINSA

SEGMENTAZIONE INNOVATIVA VS TRADIZIONALE

Meno rischi. Meno costi. Risultati migliori.

Misure. Definizione delle misure

DBMS (Data Base Management System)

Data Warehousing. Esercitazione 1

Basi di Dati Complementi Esercitazione su Data Warehouse

Introduzione alla teoria dei database relazionali. Come progettare un database

La georeferenziazione delle banche dati gli Uffici Giudiziari in Toscana

Uso delle tabelle e dei grafici Pivot

SQL/OLAP. Estensioni OLAP in SQL

Introduzione al data warehousing

Misure (parte II) Gerarchie Incomplete

Data Warehousing: concetti base e metodologie

SOMMARIO. 9- Basi di dati direzionali. Tipi di sistemi direzionali SISTEMI INFORMATIVI DIREZIONALI. Basi di Dati per la gestione dell Informazione

ANALISI DEI DATI. OLAP (On Line Analytical Processing) Data Warehousing Data Mining

I sistemi di reporting e i rapporti direzionali

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

INDICE CONROLLO DI GESTIONE E SISTEMI INFORMATIVI AZIENDALI IL CONTROLLO DI GESTIONE E GLI ALTRI MECCANISMI OPERATIVI

Compito Sistemi Informativi LA. Tempo concesso : 90 minuti 25 Marzo 03 Nome: Cognome: Matricola: Esercizio 1

Sistema informativo. Combinazione di risorse umane, materiali e procedure per la gestione. (raccolta, archiviazione, elaborazione, scambio )

Dispensa di database Access

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Introduzione al Data Warehousing

Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena

Ambienti Operativi per OLAP. Casi di Studio

I database relazionali (Access)

Informatica Generale Andrea Corradini Sistemi di Gestione delle Basi di Dati

Database Commerciali/ Marketing. Indice: 1. Gli elementi chiave del db commerciale/ marketing 2. Come si costruisce un db commerciale/ marketing

DSCube. L analisi dei dati come strumento per i processi decisionali

SQL, NoSQL, o entrambi?

Data Mining a.a

4 Introduzione al data warehousing

Data warehouse. della spesa sanitaria. acquisizione della conoscenza. Statistical Learning & Information Management

Sistemi Informativi. Catena del valore di PORTER

Nuove funzionalità Max 4i

L offerta per il mondo Automotive. gennaio 2008

Il modello dimensionale

Il linguaggio SQL. è di fatto lo standard tra i linguaggi per la gestione di data base relazionali.

Customer Relationship Management. Eleonora Ploncher 3 aprile 2006

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

Test e collaudo del software Continuous Integration and Testing

per immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel


Informazioni generali sul corso

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

per immagini guida avanzata Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel

Olga Scotti. Basi di Informatica. Excel

Operazioni sui database

Corsi di MIGLIORAMENTO CONTINUO

1. BASI DI DATI: GENERALITÀ

Ottimizzazione delle interrogazioni (parte I)

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

InfiXor. il programma facile e versatile per preventivi veloci e completi. il software di preventivazione per produttori e rivenditori di infissi

Transcript:

Corso di informatica Introduzione a data warehousing e OLAP La Value chain Information X vive in Z S ha Y anni X ed S hanno traslocato Data W ha del denaro in Z Stile di vita Punto di vendita Dati demografici Dati geografici Knowledge Una quantità Y del prodotto A è usata per lo più nella regione Z I clienti di classe Y usano x% di C durante il periodo D Decision Promuoviamo il prodotto A nei negozi della regione Z Spediamo i cataloghi alle famiglie di profilo P Offriamo dei servizi addizionali ai clienti C

Decision Support Systems Domande tipiche Quante sono le unità vendute per ogni promozione effettuata nel 1997? Qual è l incremento mensile dei profitti per ogni categoria di prodotto? Come sono incrementate le vendite di prodotti alcolici nel Canada rispetto alle vendite negli USA nel 1998? Data Warehouse Database per il supporto alle decisioni, mantenuto separatamente dal database operazionale subject-oriented integrated time-variant non-volatile Supporta l information analysis fornendo una piattaforma di dati storici consolidati

Data Warehouse Subject-Oriented Orientato alle aree dell attività di principale interesse E.g., in una compagnia d assicurazione: cliente, prodotti, attività, polizza, denuncia, conto, ecc. Applicazioni e database operazionali possono essere organizzati deversamente E.g., basati sul tipo d assicurazione: auto, vita, incendi-furti, ecc. Data Warehouse - Integrated Ci possono essere inconsistenze nella codifica, rappresentazione, ecc. tra sorgenti differenti di dati Le inconsistenze sono eliminate nel warehouse

Data Integration Da sorgenti eterogenee a data repositories consolidati RDBMS Legacy DBMS Flat Files External Data Consolidation and Cleaning Warehouse Object/Relation DBMS Multidimensional DBMS Deductive Database Flat files Data Warehouse - Non-Volatile I dati operazionali sono regolarmente acceduti e manipolati una tupla alla volta L update di dati operazionali viene fatto nello stesso ambiente operazionale I dati in un warehouse sono caricati un unica volta Non si può fare aggiornamento

Data Warehouse Time-Variant La struttura di un data warehouse contiene quasi sempre la dimensione temporale DB operazionali contengono valori correnti Un data warehouse contiene una serie di istantanee, prese in momenti differenti nel tempo La dimensione temporale dei dati è molto ampia Data Warehouse vs. Operational DBMS OLTP (On Line Transactional Processing) Esempi market: inserisci un ordine nel database, aggiornando lo stato dell ordine nel tempo banking: trasferisci $100 dal conto XXX al conto YYY dati fortemente dinamici attività strutturate e ripetitive transazioni corte lettura e/o aggiornamento di poche tuple isolamento, recovery ed integrità sono critici OLAP (On Line Analytical Processing) Operazione principale di un data warehouse Data analysis e decision making

OLTP vs. Decision Support OLAP: On-Line Analytical Processing Visione multidimensionale dei dati Analisi interattiva Modellazione analitica: derivazione delle proporzioni, delle varianze, etc. Aggregazioni per ogni intersezione di ogni dimensione Previsione, trend analysis, e statistical analysis Visualizzazione di dati in 2D o 3D

Modello multidimensionale Un datawarehouse si basa sul modello di dati multidimensionale Matrici multidimensionali In un cubo (data cube) i dati sono rappresentati in dimensioni multiple intorno ad un soggetto centrale (fatti) Dimensioni Misure Tre categorie di misure distributive: calcolo incrementale E.g., count(), sum(), min(), max() algebriche: risultato di una funzione algebrica di n argomenti in cui ogni argomento è un aggregato E.g., avg(), standard_deviation() olistiche: non c e un limite costante nel numero di elementi necessari per definirle a partire da un sottoaggregato E.g., median(), mode()

Dimensioni, livelli, gerarchie all all region Europe... North_America country Germany... Spain Canada... Mexico city Frankfurt... Vancouver... Toronto office L. Chan... M. Wind Multidimensional data Sales come funzione di product, month, e region Industry Region Year Category Country Quarter City Month Week Office Day Month

Pre-aggregazione Store Pisa Roma Firenze sum Milk Bread Orange... sum All s January 96, Pisa. Jan 96 Feb 96... Time sum Gerarchie ed aggregati L idea delle gerarchie é di aggregare automaticamente i dati di interesse quando ci si focalizza su un livello se ci concentriamo su mese i fatti rappresentano i totali delle vendite per ogni mese Possiamo concentrarci su diversi livelli della gerarchia in dimensioni diverse vendite mensili per regione di ogni prodotto

Operazioni tipiche Roll up: riassumi i dati: passa da un livello di dettaglio alto ad un livello basso il volume totale di vendite per categoria di prodotto e per regione Roll down, drill down, drill through: passa da un livello di dettaglio basso ad un livello alto per un particolare prodotto, trova le vendite dettagliate per ogni venditore e per ogni data Slice and dice: select & project Vendite delle bevande nel West negli ultimi 6 mesi Pivot: riorganizza il cubo Operazioni tipiche: Slice and Dice Slice Month Month

Operazioni tipiche: Roll-Up Roll-up Year Roll-up Year Drill-Down Month Drill-Down Data Mining Automated Exploration/Discovery Clustering Association Rules Prediction/Classification Inductive Decision Trees Regression Reti neurali Algoritmi genetici Explanation/Description Inductive Decision Trees Rule systems

Approcci Verification-Driven Metodologie Analisi passiva, atta a verificare se un certo modello (ipotesi) è coerente con i dati a disposizione L ipotesi o il modello sono formulati dall utente sulla base della sua esperienza Approcci Discovery-Driven Analisi attiva, in cui i dati stessi suggeriscono possibili ipotesi sul significato del loro contenuto Individuazione di fatti significativi, relazioni, tendenze, pattern, associazioni, eccezioni e anomalie, che sfuggono all analisi manuale per la loro complessità