Thematica Software Technologies



Похожие документы
Ambienti Operativi per OLAP. Casi di Studio

Data warehouse Introduzione

Lezione 9. Microsoft Analysis Services: Principi e Funzionalità

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Data Warehousing. Argomenti della lezione. Rappresentazioni dei dati. Rappresentazione dei dati. Parte II Analisi multidimensionale

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

OLAP On Line Analytical Processing

Rassegna sui principi e sui sistemi di Data Warehousing

SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

Lorenzo Braidi. Database design. Libro_datadesign.indb :06:17

SQL Server BI Development Studio

Data Warehousing (DW)

Lezione 9. Ambienti Operativi per OLAP Casi di Studio 08/03/2010 1

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

DATA WAREHOUSING CON JASPERSOFT BI SUITE

4 Data Transformation Services

Data warehousing con SQL Server

Training sulle soluzioni SAP BusinessObjects BI4

Data Warehousing. Esercitazione 1

DSCube. L analisi dei dati come strumento per i processi decisionali

Data warehousing con SQL Server

un insieme di processi per raccogliere e analizzare informazioni e dare risposta a esigenze di:

SQL Server. Applicazioni principali

PBI Passepartout Business Intelligence

La suite Pentaho Community Edition

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

Data Warehouse Architettura e Progettazione

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Analisi dei Dati. Lezione 10 Introduzione al Datwarehouse

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

RRF Reply Reporting Framework

PROGETTAZIONE E IMPLEMENTAZIONE DI UN DATAWAREHOUSE

Il Business Performance Management & QlikView

Data warehousing con SQL Server

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Business Intelligence. strumento per gli Open Data

Supporto alle decisioni e strategie commerciali/mercati/prodotti/forza vendita;

Cosa è un data warehouse?

Data Warehousing e Data Mining

. Scheduling. Modalità d invio.

Web Intelligence. Argomenti 10/5/2010.

OLAP Evolus Suite. Analsysis and Reporting per tutte le Imprese

Business Intelligence

UN PROGRAMMA APPLICATIVO: ACCESS Access è un programma del pacchetto Office che permette di realizzare database

InfoTecna ITCube Web

APPENDICE 7 AL CAPITOLATO TECNICO

Misura delle prestazioni dei processi aziendali con sistemi di integrazione dati open source

Moka. Ing. Giovanni Ciardi Servizio Sistemi Informativi Geografici. Moka: come cambiera la diffusione dei dati e servizi della Regione Emilia-Romagna

Ciclo di vita dimensionale

Capitolo 4 Pianificazione e Sviluppo di Web Part

Access. P a r t e p r i m a

Caratteristiche principali. Contesti di utilizzo

Architetture per l analisi di dati

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

SISTEMI INFORMATIVI AZIENDALI

Lezione 1. Introduzione e Modellazione Concettuale

Dispensa di database Access

BASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015

Organizzazione delle informazioni: Database

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

Architetture Informatiche. Dal Mainframe al Personal Computer

MICHELANGELO REPORT è un

Architetture Informatiche. Dal Mainframe al Personal Computer

Corso di Access. Prerequisiti. Modulo L2A (Access) 1.1 Concetti di base. Utilizzo elementare del computer Concetti fondamentali di basi di dati

PROGRAMMAZIONE MODULARE DI INFORMATICA CLASSE QUINTA - INDIRIZZO MERCURIO SEZIONE TECNICO

idw INTELLIGENT DATA WAREHOUSE

DATABASE RELAZIONALI

Al giorno d oggi, i sistemi per la gestione di database

Sistemi informativi secondo prospettive combinate

Progettazione di Basi di Dati

Governo Digitale a.a. 2011/12

Sistemi Informativi e Basi di Dati

Sviluppo Applicazione di BI/DWH. con tecnologia Microsoft. per il supporto della catena logistica

DBMS (Data Base Management System)

Lezione 3. Modello Multidimensionale dei Dati Metadati per il Data Warehousing Accesso ai Data Warehouses Implementazioni per il Data Warehousing

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS)

Data warehousing con SQL Server

Progettaz. e sviluppo Data Base

Basi di dati. Corso di Laurea in Ingegneria Informatica Canale di Ingegneria delle Reti e dei Sistemi Informatici - Polo di Rieti

Introduzione all Architettura del DBMS

Business Analytics. Business Unit Offering: Business Intelligence. Copyright 2014 Alfa Sistemi

Desktop Intelligence. Terminologia. strato semantico intelligibile che isola dai problemi tecnici legati al database

DATA WAREHOUSE E CRUSCOTTO DIREZIONALE PER L ANALISI DEL PERSONALE IN UN AZIENDA DI SERVIZI

Confronto tra Microsoft Office Project Standard 2007 e le versioni precedenti

Pianificazione Controllo Analisi Reporting. Progetti Srl - PCPro 1

Introduzione al data warehousing

Agenda. DBS01 Reports for your app: Reporting Services pros and cons. Gestione del ciclo di vita di un report ARCHITETTURA REPORTING SERVICES

un occhio al passato per il tuo business futuro

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Analisi dei dati di Navision con Excel

Corso di Informatica RDBMS RDBMS. Corso di Laurea in Conservazione e Restauro dei Beni Culturali

Risorsa N DATI ANAGRAFICI: FORMAZIONE E CORSI: ISTRUZIONE E CERTIFICAZIONI: LINGUE STRANIERE: COMPETENZE INFORMATICHE:

Basi di Dati Complementi Esercitazione su Data Warehouse

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Транскрипт:

Sperimentazione di Servizi Innovativi alle Imprese Produttrici di Software Università della Calabria 21-10-2004 Giovanni Laboccetta Thematica s.r.l. www.thematica.it glaboccetta@thematica.it

Perché i data warehouse? L idea di base del concetto di Data Warehouse consiste nell osservare come le esigenze dei processi operativi processi decisionali siano profondamente diverse e che sia quindi sbagliato tentare di soddisfarle tutte con uno stesso ambiente.

Confronto tra DW e OLTP DATA WAREHOUSE SISTEMA OPERAZIONALE 90% di query estemporanee 90% di query predefinite Accessi in sola lettura Denormalizzato Gestisce versioni storiche dei dati Ottimizzato per accessi che coinvolgono gran parte del database Contiene prevalentemente dati numerici Basato su dati di sintesi On Line Analytical Processing (OLAP) Accessi in lettura/scrittura Normalizzato Non gestisce versioni storiche dei dati Ottimizzato per accessi che coinvolgono una piccola frazione del database Contiene sia dati numerici che alfanumerici Basato su dati elementari On Line Transaction Processing (OLTP)

A chi serve? Un management che dispone di un sistema informativo e che si domandi: "cosa è successo? "perché è successo?" e "come posso ripeterlo?" oppure "come posso evitarlo? è un buon candidato all'installazione di un sistema decisionale

Integrazione Nel Data Warehouse il significato di un dato deve essere concorde a livello aziendale e definito con precisione in termini informatici. Sistemi Operazionali Appl A Description1 Appl B Description2 Appl C Description3 Appl A m,f Appl B 1,0 Appl C x,y Appl A Date(yymmdd yymmdd) Appl B Data(mmddaa mmddaa) Appl C Data (assoluta) Popolamento Data Warehouse Description m,f Data(ddmmyy ddmmyy)

Struttura di un DW

Architettura concettuale di un DW Ad un livello A due livelli A tre livelli

Architettura ad un livello Decision Support System Dati Real-Time Operational System Vantaggi Svantaggi Minimizzazione del volume di dati memorizzati Sviluppo rapido e costi ridotti Evita il problema della sincronizzazione dei dati ripetuti Esecuzione ripetuta della stessa query Mancanza di storicizzazione dei dati Contesa sui dati tra sistemi operazionali e sistemi decisionali

Architettura a due livelli Decision Support System Dati Derivati Dati Real-Time Operational System Vantaggi Svantaggi Assenza di concorrenza tra applicazioni operazionali e decisionali Diverse derivazioni degli stessi dati Alto livello di duplicazione dei dati, spesso incontrollato

Architettura a tre livelli Decision Support System Dati Derivati Dati Riconciliati Dati Real-Time Operational System Vantaggi Svantaggi Dati storici memorizzati nel livello dei dati riconciliati Supporto ad esigenze non previste Notevole riduzione dei problemi di duplicazione dei dati Inadeguatezza del modello nel caso di sorgenti operazionali particolarmente eterogenee fra loro

Architettura logica a tre livelli A questo livello vi sono le applicazioni per il supporto alle decisioni Staging BIW

Un modello concettuale per i DW Per i DBMS relazionali viene usato il modello Entity/Relatioship (E/R) Non utilizzabile per i DW perché: 1. I DW utilizzano una visione multidimensionale dei dati, mentre l'e/r propone una visione piatta degli stessi 2. Non risulta semplice formulare le interrogazioni sullo schema E/R 3. Il modello E/R è difficilmente comprensibile dai non addetti ai lavori, quindi non rende semplice il dialogo tra progettista ed utente 4. L'E/R produce una documentazione non sempre priva di ambiguità e non sempre sufficientemente espressiva

Dimensional Fact Model (DFM) Modello Multidimensionale Fatto Fatto Dimensione Dimensione Gerarchie Gerarchie Misure Misure Processo di business da modellare Rappresentazione della granularità dei fatti Aggregazione delle istanze dei fatti Attributo numerico di un fatto

Esempio di uno schema DFM

Analisi multidimensionale I dati raccolti vengono visti come un ipercubo in cui ogni dimensione rappresenta una classe di dati

Principali tecniche per esplorare i dati Drilling Down/Up Drill Up Nazione Regione Provincia Drill Down

Slice and Dice Prodotti Regioni Vendite Noccioline Calabria 50 Noccioline Sicilia 60 Noccioline Basilicata 100 Pistacchi Calabria 40 Pistacchi Sicilia 70 Pistacchi Basilicata 80 Patatine Calabria 90 Patatine Sicilia 120 Patatine Basilicata 140 Vendite per Regione Calabria Sicilia Basilicata Noccioline 50 60 100 Pistacchi 40 70 80 Patatine 90 120 140

OLAP (On Line Analytical Processing) Supportare complesse analisi del processo decisionale Analizzare i dati da varie prospettive Agire dinamicamente su enormi quantità di dati Per supportare un sistema OLAP, i dati devono essere organizzati attraverso modelli multidimensionali

OLAP ROLAP (Relational OLAP) Uso di strutture relazionali MOLAP (Multidimensional OLAP) Uso di strutture fisiche specializzate

ETL L ETL (extract transform and load) è il processo di estrazione, trasformazione e consolidamento di dati da sorgenti eterogenee in un data warehouse. Supportato da tools grafici: Microsoft SQL Server 2000 DTS (Data Transformation Services) DB2 Warehouse Manager Oracle Warehouse Builder Business Objects Data Integrator

ETL Operazioni ETL Extract: accesso alle sorgenti di dati Interne vs Esterne, Localizzazione e formato Transform: trasformazione, pulizia e integrazione dei dati (eta=999) Selezione dati non necessari, duplicati, corrotti, fuori dai limiti Valori mancanti default, valor medio, filtro Codifiche e normalizzazioni dei dati al fine di risolvere differenti codifiche della stessa informazione (metri, pollice; formato data ecc.) Splitting/merging

La piattaforma Business Objects Supervisor: permette di installare ed amministrare un ambiente sicuro per tutto il sistema Business Objects. Designer: permette di creare lo strato semantico su cui si farà OLAP. Infoview: portale web per l accesso ai vari strumenti di reporting BusinessObject: Applicazione client con cui si definiscono i report WebIntelligence: estende le capacità del DSS alle intranet, extranet ed Internet. Permette di creare e modificare reports attraverso un ActiveX (o un applet) scaricato in un browser Web Repository: utilizzato come contenitore dei dati e dei metadati della sicurezza, degli universi e dei report Data Integrator: utilizzato per le operazioni di ETL

BO Architettura

B.O. (Supervisor)

B.O. (Designer)

Universo IMPRESE Dimensioni condivise Dimensioni locali Misure

BO Reporting

BO Reporting

Microstrategy ROLAP(Relational On-Line Analytical Processing ) Pseudo MOLAP(Multidimensional On-Line Analytical Processing ) con Olap Services ed Intelligent Cubes

Componenti Microstrategy Desktop Microstrategy Web

Microstrategy Desktop Architect : mappatura verso schema multidimensionale (fatti, metriche, attributi, gerarchie, ) Administrator : gestione utenti, privilegi sui singoli oggetti, configurazione server microstrategy, accesso al warehouse catalog, Report Editor : creazione report, advanced reporting,

Architect : oggetti di design Public Objects (Metriche, Filtri, Prompt, Report, ) : oggetti utilizzabili dall utente finale evoluto, sviluppatore del reporting layer. Schema Objects (Attributi, Fatti, Gerarchie, ) : tipici oggetti di design per la modellizzazione multidimensionale.

Administrator User Manager : gestione utenti e gruppi, diritti di accesso al singolo oggetto Microstrategy. Database Instance Manager : gestione connessioni alle origini dati. Schedule Manager : gestione schedulazione eventi. Cache Monitor : gestione oggetti in cache

Report Editor Creazione report tramite drag and drop dei Public/Schema Objects. Gestione parametri singolo report (cache, tipi di join, ). Gestione dei report objects per la definizione degli Intelligence Cubes.

Microstrategy Desktop

Microstrategy Web Interfaccia web per il reporting e l analisi dei dati Accesso tramite browser Semplicità nelle Analisi e nel Reporting Possibilità di salvare i report in aree riservate al singolo utente

Microstrategy Web

Oracle Discoverer ROLAP(Relational On-Line Analytical Processing )

Componenti Discoverer Administrator Edition : progettazione strato multidimensionale intermedio(componente stand-alone) Discoverer Plus : progettazione reporting Discoverer Viewer : componente per la visualizzazione

Architettura

Concetti chiave EUL (End User Layer) : metalayer che protegge l utente finale dalla complessità del database, concettualmente risiede tra il DB e Discoverer e comprende un certo numero di viste e tabelle del DB. Business Area : sotto insieme di oggetti(tabelle, viste, gerarchie, misure, filtri, condizioni, ) costituenti un raggruppamento logico (Data Mart), rappresentante l area di lavoro da cui ottenere I report.

Analysis server Strumento MOLAP Fornito con Microsoft Sql-Server 2000 Server di livello intermedio per la gestione di cubi multi-dimensionali Rapido accesso dei client alle informazioni del cubo Organizzazione dei dati in cubi con dati aggregati precalcolati

Concetti chiave Tabelle dei Fatti Dimensioni Gerarchie Misure Reporting tramite MS Excel con il supporto degli Office Web Components

Server Architettura Analysis Server Custom Applications Analysys Manager Client Client Application Source data DSO Client Application ADO MD Relational Database ROLAP data OLE DB Cube HOLAP MOLAP Analysis Server PivotTable Service Data Storage

ADO MD Modello a oggetti semplificato, concettualmente vicino a ADO Incapsula l accesso attraverso OLEDB MD Accede a dati e metadati Utilizzabile da qualsiasi tool di sviluppo (VB, VC++, VBScript, JScript,...) Facile da usare

Cube Meta Data Catalog Oggetti ADOMD CellSet Data Access CubeDef Connection Axis Cube Cell

Analysis server

Analysis Manager Editor dei cubi

Analysis Manager: browsing

Client Excel

Data Transformation Services DTS Designer Il DTS designer permette di creare, modificare e configurare un DTS package utilizzando un interfaccia grafica con funzionalità drag and drop.

Struttura di un DW

Oracle

Oracle

Oracle