La misurazione dei sistemi di Data Warehouse

Documenti analoghi
Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS)

ITIS A. Volta Flavia Lollis pag. 1

Basi di dati attive. Una base di dati è ATTIVA quando consente la definizione e la gestione di regole di produzione (regole attive o trigger).

Data warehouse Introduzione

Data warehouse Introduzione

Prof. Giorgio Poletti

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Sistemi di Elaborazione dell Informazione

Architetture di Data Warehouse. PDF created with pdffactory trial version

Sistemi Informativi Avanzati

Business Intelligence HR

Data warehouse: introduzione

Lezione 2. Dati e Architetture per il Data Warehousing ETL

Corso di basi di dati Fascicolo T04b Nota: i primi lucidi sostituiscono alcuni già proposti, in altro ordine e ccon qualche differenza, nel fascicolo

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

Datawarehouse. Proge.azione logica

Architetture Evolute nei Sistemi Informativi. architetture evolute 1

Data Warehousing e Data Mining

Thematica Software Technologies

Ricerca e Sviluppo. Simple Function Point. Metrica funzionale del software completamente. Data Processing Organization Srl

18/05/2014. Università di Ferrara Corso di Ingegneria del Software AA 2013/2014

Introduzione. A Tecnologie 1

Estensioni del linguaggio SQL per interrogazioni OLAP

IS Corso di Ingegneria del Software 1

BASI DI DATI. basi di dati - introduzione ai sistemi informativi 1

Ingegneria del Software MINR Giuseppe Santucci Il metodo dei FP

Data Warehousing. Esercitazione 2

UTILIZZO DEI SISTEMI INFORMATIVI PER IL SUPPORTO DELLE DECISIONI ARCHITETTURA DI RIFERIMENTO

Sistemi Informativi I Function Point Analisys

Data warehouse Introduzione

SISTEMI INFORMATIVI DIREZIONALI BUSINESS INTELLIGENCE

Basi di Dati Direzionali

Simulazione di valorizzazione comparata di portafogli iniziative misurati in FP. Pierfranco Gennai

COCOMO II. Note basate su COCOMO II Model Definition Manual - Center for Software Engineering USC

I Componenti del processo decisionale 7

SISTEMI INFORMATIVI AZIENDALI

Università degli Studi di Ferrara Facoltà di Ingegneria Corso di Ingegneria del Software (IIa parte) - Prova scritta

Gestione delle misurazioni in Function Point FPManager. Marino Quirico

SISTEMI INFORMATIVI AZIENDALI. introduzione ai sistemi informativi 1

Marco R. Bellinzona Partner Ecos. Indicatori di performance per la Pubblica Amministrazione: il caso Provincia di Milano

Redazione e Presentazione di Progetti Informatici

IT Project Management

STUDIO DEI FUNCTION POINT

Corso di Ingegneria del Software. Metriche Parte I

Stima della size- Esercitazioni

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

Data Warehouse e OLAP

Sistemi informativi secondo prospettive combinate

Operations Management Team

Operations Management Team

Function Point: Il conteggio, la stima, l'introduzione in azienda. Marino Quirico

Costi. Studio di fattibilità Progetto di massima. 5. Progetto di massima. M.Rumor. Studio di fattibilità. Studio di fattibilità Progetto di massima

Sistemi Informativi Avanzati

Software Size Estimation

Introduzione al Data Warehousing

Analisi dei dati. analisi dei dati 1

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

SQL Server Business Intelligence Development Studio. SQL Server BI Development Studio. SQL Server BI Development Studio *Analysis Services*

SQL Server Business Intelligence Development Studio

ESEMPIO A: Arco multiplo su LIBRO- AUTORE

MercurBusiness Control

SQL Server Architettura Client-Server. SQL Server Introduzione all uso di SQL Server Dutto Riccardo.

SQL Server Introduzione all uso di SQL Server Dutto Riccardo. Dutto Riccardo - SQL Server 2008.

Introduzione al Data Warehousing

Thematica Software Technologies

Data Warehousing (DW)

STIMA DEI COSTI DI SVILUPPO DEL SOFTWARE

AICA - Workshop 01/03/2011

SQL Server BI Development Studio. SQL Server Business Intelligence Development Studio. Analysis Services

Pentaho: una soluzione Open per la progettazione e sviluppo di Data Warehouse

I DSS e la gestione dei dati e della conoscenza. Prof. Luca Gnan

Data Warehousing. Sommario. Luca Cabibbo, Riccardo Torlone, Paolo Atzeni. Processi. Processi, dati e decisioni. Processi presso una banca

Prof. Giorgio Poletti

Catena del valore (studio di caso)

Gestione parte IIA. Linee di codice. Function points. KLOC come misura di produttività. Misura della dimensione Versioni più utilizzate:

Inventario (studio di caso)

Metriche basate sulla LOC

Corso di Basi di Dati

Analisi delle tecniche IFPUG e COSMIC per la stima della dimensione delle funzionalità di un prodotto software

Un indagine sull uso dei metodi di stima dei progetti software e delle metriche del software

SQL e linguaggi di programmazione. Cursori. Cursori. L interazione con l ambiente SQL può avvenire in 3 modi:

Introduzione al Data Warehousing

I I SISTEMI INFORMATIVI INTEGRATI. Baan IV IV - Finance NOTE

Esercitazione sul metodo dei FP. 05fpex1.1

Il Data Warehouse di Ateneo

Lezione 12. Differenziazione e integrazione (Cap. 6 (2): pp , Decastri 2016)

Corso di Ingegneria del Software. I costi del software

Architetture per l analisi dei dati

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

METODOLOGIE DI PROGETTAZIONE DI BD E DI DW. Gli eventi (fenomeni) di interesse, detti fatti. La granularità dei fatti da analizzare.

PROGETTO UN SERVIZIO GESTITO DA PROFESSIONISTI

Analisi dei punti funzione

Definizione e calcolo delle misure

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

I sistemi di reporting e i rapporti direzionali

Sommario. Prefazione...xi. Capitolo 1 Introduzione...1. Capitolo 2 Basi concettuali... 19

Sistemi Informativi Avanzati Anno Accademico 2011/2012 Prof. Domenico Beneventano SQL-OLAP. Estensioni OLAP in SQL

Data warehouse Analisi dei dati

I sistemi informativi integrati per il controllo

ORDINE DEGLI ATTUARI

Transcript:

La misurazione dei sistemi di Data Warehouse Luca Santillo (CFPS) AIPA, 17/5/01

Sommario Introduzione Definizioni & Modelli FP & Data Warehouse? Stima dell impegno Conclusioni Misurazione Data Warehouse, AIPA, 17/5/01 2

Introduzione Ipotesi I metodi di Misurazione Funzionale del Software (IFPUG, COSMIC, NESMA, ) sono indipendenti dalle tecniche e dalle tecnologie di implementazione Considerazioni Contesti speciali (es. Data Warehouse) possono fare uso di specifiche tecnologie. E Possono assumere specifiche tipologie di utente ( punto di vista ) & specifici approcci all analisi ( modelli ). Misurazione Data Warehouse, AIPA, 17/5/01 3

Introduzione In pratica I concetti generali, le definizioni e le regole di conteggio possono essere difficili da applicare a contesti specifici (es. Data Warehouse). L approccio proposto Istanza di un metodo generale per la misurazione e la stima di impegno (non un metodo alternativo ). Linee Guida per la misura e la stima dei sistemi di Data Warehouse. Misurazione Data Warehouse, AIPA, 17/5/01 4

Definizioni & Modelli Data Warehousing Enterprise DW & Data Mart Fasi del Flusso dei Dati (ETL, OLAP) Cubo Multi-dimensionale (modello dati) Star Schema (modello dati) Meta-dati IFPUG Function Point COSMIC Full FP Misurazione Data Warehouse, AIPA, 17/5/01 5

Data Warehousing Raccolta di un insieme di dati che sia: Subject-oriented in supporto Integrato all analisi del business & Time-variant al processo decisionale. Non volatile DW Misurazione Data Warehouse, AIPA, 17/5/01 6

Confronto tra tipologie MIS vs DW Scopo Struttura Sistemi Operazionali Operazioni routinarie, Fotografia del presente DB ottimizzato per data entry e query singola Sistemi Data Warehouse Reperimento & Analisi dati, Mantenimento dello storico DB ottimizzato per data query globale Modello dati Normalizzato Multi-dimensionale Natura dei dati Dettaglio Sintesi & Dettaglio Dati duplicati No (DB normalizzato) Sì (DB de-normalizzato) Dati Derivati Raramente Comuni Tipo Utente Basso livello / Operativo Alto livello / Manageriale Misurazione Data Warehouse, AIPA, 17/5/01 7

Peculiarità del DW Il DW possiede specifici: Tipi di utente Top level, Decision-makers Modelli di analisi (dati) Star Schema, Cubo Multi-dimensionale Tecnologie Elevata dimensione fisica dei dati Performance Tools per l implementazione Personalizzazione di Pacchetto più che Sviluppo Misurazione Data Warehouse, AIPA, 17/5/01 8

Enterprise DW & Data Marts EDW DM Raccolta di dati per l intera organizzazione DW temativo ( subject-specific ) Può essere dipendente o indipendente DM EDW DM DM Misurazione Data Warehouse, AIPA, 17/5/01 9

Fasi del Flusso dei Dati Amministrazione ETL DW Accesso (OLAP) ETL = Extraction, Transformation, Loading OLAP = On-Line Analytical Processing Misurazione Data Warehouse, AIPA, 17/5/01 10

Cubo Multi-dimensionale Fatti Misure, o valori (Quanto) Dimensioni Categorie, o attributi (Chi, Cosa, Dove, Quando) Permettono lo slice & dice del cubo Misurazione Data Warehouse, AIPA, 17/5/01 11

Star Schema Istanza di un cubo È composto da dimensioni gerarchizzate Permette il drill up & down sui Fatti Tempo ----- Anno Mese Settimana Vendite ----- Importo Regione ----- Area Regione ----- Stato Prodotto ----- Modello Regione ----- Città Misurazione Data Warehouse, AIPA, 17/5/01 12

Meta-dati Dati riguardanti i dati I meta-dati tengono traccia di cosa è dove nel DW: Profili utente Statistiche d uso Mapping fisico-logico dei dati Misurazione Data Warehouse, AIPA, 17/5/01 13

IFPUG Function Point (1) Utente EIF EQ ILF ILF Utente EI EO Utente Misurazione Data Warehouse, AIPA, 17/5/01 14

IFPUG Function Point (2) La complessità dei file dipende da: Attributi dati (contenuti) (DET) Sottogruppi di attributi dati (RET) La complessità delle transazioni dipende da: Attributi dati (elaborati) (DET) File referenziati (letti/scritti) (FTR) La complessità si converte in Unadjusted FP Si applica il Value Adjustment Factor (VAF) Per includere requisiti tecnici e sulla qualità Misurazione Data Warehouse, AIPA, 17/5/01 15

COSMIC Full FP (1) Componente dati non conteggiata Nessun limite superiore alla complessità (size) del singolo processo Somma flussi (Entries, Exits, Reads, Writes) Nessun VAF Software Functional User Requirements Functional Process type Data Movement type Misurazione Data Warehouse, AIPA, 17/5/01 16

COSMIC Full FP (2) Si distinguono gli strati ( layers ) secondo la vista utente e/o le necessità gestionali HUMAN USER PC «Back office» Server «Front end» Processor Mainframe WAN New client application Enhancement to server software Enhancement to FEP New Server application Misurazione Data Warehouse, AIPA, 17/5/01 17

FP & Data Warehouse? Relazione EDW / DMs Peculiare rappresentazione logica dei dati (e loro aggregazione dal punto di vista utente) Gerarchie dimensionali dei dati Meta-dati Procedure ETL Procedure di accesso (OLAP) Misurazione Data Warehouse, AIPA, 17/5/01 18

FP & Data Warehouse! È possibile un mapping tra concetti della misurazione funzionale e caratteristiche dei sistemi data warehouse, ma occorre specificare alcuni criteri Linee Guida Non occorrono metriche alternative Misurazione Data Warehouse, AIPA, 17/5/01 19

Punto di vista dell utente & Confine Punto di vista dell utente Composizione di vari ruoli/viste Utente finale Amministratore per fase (ETL, DB DW, Accesso) Sistemi sorgente Confine dell Applicazione Coerente con la struttura organizzativa (dipartimenti/settori) Autonomia di gestione dell EDW da ogni DM Autonomia di gestione di un DM da ogni altro DM Ri-definizione dei confini in casi eccezionali Misurazione Data Warehouse, AIPA, 17/5/01 20

Funzioni Dati: Sorgenti Esterne EIFs per l EDW (o DM INDIP ) Distinti come ILF dei sistemi esterni Strutturati in DET/RET come da vista utente del DW I duplicati fisici su aree/piattaforme differenti non sono conteggiati. Nessun EIF, se flussi di dati comandati dal sistema sorgente (EO sorgenti) Misurazione Data Warehouse, AIPA, 17/5/01 21

Funzioni Dati: Dati Interni 1 ILF per ogni stella logica distinta Struttura RET secondo le dimensioni e le misure Fact Table N Tabelle dimensionali al 1 ordine (es. area, nazione, città = 1 RET regione ). Linee guida specifiche per i DET Non tutti i dati pre-calcolati sono riconosciuti dall utente. DET ricorsivi su tabelle gerarchiche. Misurazione Data Warehouse, AIPA, 17/5/01 22

Funzioni Dati: Meta-dati Meta-dati tecnici solitamente non contati: Es: Mappatura fisico-logica dei dati Alcuni riconoscibili dall utente : Es: Archivio dei profili utente Es: Statistiche d utilizzo del sistema Meta-dati di business solitamente contati: Es. Dizionario dei dati Informazioni sulla proprietarietà dei dati Misurazione Data Warehouse, AIPA, 17/5/01 23

Transazioni: ETL 1 solo EI per ogni ILF di tipo stella logica Lettura file esterni sorgenti + pulizia & trasformazione contenuti + eventuale lettura meta-dati + caricamento in tabelle destinatarie: un unico processo dal punto di vista dell utente. FTR: ILF di destinazione + EIFs sorgenti necessari + eventuali meta-dati. DET: in accordo con i DET degli FTR. Misurazione Data Warehouse, AIPA, 17/5/01 24

Transazioni: Amministrazione La fase di amministrazione è composta da processi di tipo tradizionale sui meta-dati. CRUD (Create, Read, Update, Delete). Misurata come i sistemi tradizionali. Misurazione Data Warehouse, AIPA, 17/5/01 25

Transazioni: Accesso (OLAP) (Almeno) 1 processo (EO/EQ) per ogni ILF di tipo stella logica Drill down/up su 1 stella non costituisce differente output (equivalente a filtro di query). Il meccanismo in sé per il drill è solitamente fornito dai tool come una listbox su ogni attributo drillabile = 1 EQ di bassa complessità (per ogni distinto attributo di ogni distinta stella). Misurazione Data Warehouse, AIPA, 17/5/01 26

VAF e Calcolo FP Finale VAF non considerato (o sempre = 1) ISO 14143 (Functional Measurement Methods). La teoria della misurazione dimostra l inadeguatezza del VAF. Requisiti tecnici e di qualità inclusi nella fase successiva di stima dell impegno. Il risultato finale della misura è la somma degli Unadjusted FP. Misurazione Data Warehouse, AIPA, 17/5/01 27

Stima dell Impegno Numerosi aspetti peculiari di produttività per DW: Cut-off della complessità delle funzioni Matrici IFPUG: complessità Bassa, Media, Alta. Il riuso (interno ed esterno) è rilevante. Attenzione alla strutturazione dei dati del DW ha impatto rilevante (negativo) sulla fase di analisi. Tools e tecnologie specifiche hanno impatto rilevante sulla fase di implementazione, In particolare, per la fase di Accesso (personalizzazione di pacchetti). Non esistono adeguati benchmarks. Misurazione Data Warehouse, AIPA, 17/5/01 28

Modello di Stima Strutturato 1. La misura è aggiustata per: Classi di intervento/funzioni Specifici coefficienti moltiplicatori per EI ETL, ILF Stella, Riuso In termini di comunanza di DET/RET/FTR tra funzioni simili. Tecnologia Specifici coefficienti moltiplicatori per EO/EQ Accesso, EQ Drill, Misurazione Data Warehouse, AIPA, 17/5/01 29

Modello di Stima Strutturato 2. Si applica una formula generica (benchmarking/regressione statistica): Eff avg = A Size B (o analoga formula) Misurazione Data Warehouse, AIPA, 17/5/01 30

Modello di Stima Strutturato 3. Si applica un modello à la COCOMO II, per calibrare la stima ai fattori locali di progetto: Eff = Eff avg x ΠCD i dove i Cost Drivers contemplano solo gli aspetti non implicitamente considerati ai passi precedenti. Misurazione Data Warehouse, AIPA, 17/5/01 31

Miglioramenti COSMIC Full FP: Nessun cut-off sulla complessità delle funzioni. Il concetto di layer permette di applicare valori di produttività differenziati ai vari segmenti. Ma: misurano solo indirettamente la componente dati. Quindi: si attendono valori di produttività estremamente differenti rispetto ai FP IFPUG. Statistiche e Benchmarking: Le analisi di benchmarking in corso includeranno necessariamente campioni di DW, a causa dell elevata diffusione in corso di tali sistemi. Misurazione Data Warehouse, AIPA, 17/5/01 32

Conclusioni È possibile realizzare un set completo di linee guida di conteggio sulla base di elementi tipici dell analisi dei sistemi DW. Le linee guida sono scalabili (EDW/DM). Le linee guida possono essere formulate e organizzate conformemente alle regole standard. La trasformazione della metrica in Impegno non può prescindere da specifiche differenziazioni per tipologia e tecnologia. Il metodo dei COSMIC FFP si preannuncia più solido, eliminando la necessità di alcuni aggiustamenti sulla misura, per la stima d impegno. Misurazione Data Warehouse, AIPA, 17/5/01 33

La Fine? è solo l inizio! Futuri sviluppi: Evoluzione teorica del metodo, Sperimentazioni sul campo, Benchmarking mirato, Misure COSMIC FFP. Grazie! luca.santillo@gmail.com Misurazione Data Warehouse, AIPA, 17/5/01 34