Modellazione concettuale

Documenti analoghi
Il Dimensional Fact Model

Modellazione concettuale

Modellazione concettuale

Sistemi Informativi Avanzati Anno Accademico 2013/2014 Prof. Domenico Beneventano. Archi multipli

Sistemi Informativi Avanzati Anno Accademico 2012/2013 Prof. Domenico Beneventano. Archi multipli

! Un arco multiplo corrisponde ad un associazione molti-a-molti: il padre (libro) non determina funzionalmente il figlio (autore)

Un arco multiplo corrisponde ad un associazione molti-a-molti: il padre (libro) non determina funzionalmente il figlio (autore)

Progettazione concettuale:

Sistemi Informativi Avanzati

Indice. Prefazione. Capitolo 1 Introduzione al data warehousing 1

Progettazione concettuale

3.1. CorsodiElementidiBasididati Il modello Entita Relazione (72) vendita ordine studente. Impiegato. Dipartimento. città. Città.

Progettazione di Basi di Dati

Progettazione concettuale di una base di dati

Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill, Capitolo 6: Progettazione di basi di dati: Metodologie e modelli

Informatica Industriale Modello funzionale: Informazione Modello Entità-Relazione

Entità. Relazioni. Cardinalità delle relazioni. Ogni entità ha un nome che la identifica

DATABASE - MODELLO E-R ENTITÀ E RELAZIONI TRATTO DA CAMAGNI-NIKOLASSY, CORSO DI INFORMATICA, VOL 2, HOEPLI. Informatica

Unità A2. Progettazione concettuale. Obiettivi. Astrazione. Astrazione per aggregazione

Entità. Modello Entità-Relazione (E-R) Relazioni (associazioni) Attributi

Sistemi Informativi Avanzati Anno Accademico 2011/2012 Prof. Domenico Beneventano SCENARI TEMPORALI

Cardinalità degli attributi

Le Basi di dati: progettazione concettuale

Modellazione dei dati

Il modello relazionale. A. Ferrari

INTRODUZIONE ALLA PROGETTAZIONE. Patrizio Dazzi a.a

Progettazione concettuale usando il modello Entità-Relazione (ER)

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Ma: progettazione dei dati progettazione delle applicazioni. Progettazione di basi di dati

Unità Due. Modello E/R

Le basi di dati. Lez. 2: Progettazione di un DB. Laboratorio di informatica gestionale

Ma: progettazione dei dati. progettazione delle applicazioni. Progettazione di basi di dati

A. Ferrari modello relazionale

Sistemi Informativi Territoriali

Progetto concettuale delle basi di dati

Il ciclo di vita del Data Warehouse

Basi di dati (Sistemi Informativi)

2 - Metodologie e modelli per la progettazione di BD. Informatica II Basi di Dati (08/09) Parte 1. Introduzione alla progettazione

Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill, La normalizzazione

Progettazione del Data Warehouse

Atzeni, Ceri, Paraboschi, Torlone Basi di dati. Progettazione di basi di dati: Metodologie e modelli

Forme normali. Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill. La normalizzazione. Normalizzazione. Una relazione con anomalie.

IL MODELLO CONCETTUALE ENITÀ-RELAZIONE (ER) (CAPITOLO 5 DELLA VERSIONE ITALIANA)

Estensioni del linguaggio SQL per interrogazioni OLAP

Generalizzazione. Docente : Alfredo Cuzzocrea Tel. : Informatica

Perché preoccuparci?

Sviluppo di un Data Warehouse

Il modello Entità-Relazioni (entity-relationship)

Il Modello Concettuale Enità-Relazione (ER)

Database. Cos è un database? Intro Tipi di entità Mapping ER/EER à Relazionale

Modello Entità - Relazione. Basi di dati. Elena Baralis 2007 Politecnico di Torino D B M G D B M G2 D B M G4 D B M G6. Progettazione di basi di dati

Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw -Hill, Progettazione logica. Dati di ingresso e uscita

Definizione e calcolo delle misure

D B M G D B M G 2. Sistemi informativi. Progettazione di basi di dati

Modello Entità-Relazione (E-R)

La progettazione concettuale

Laboratorio di Basi di Dati

Unità 3. Modello Relazionale

SISTEMI INFORMATIVI GEOGRAFICI (GIS)

Data warehouse. Progettazione di un data warehouse

Prima di iniziare. Diamo qualche definizione :

La Progettazione Logica

Il Modello Concettuale Enità-Relazione (ER)

Corso di Basi di Dati

D B M G D B M G 2. Basi di dati. Progettazione di basi di dati. Elena Baralis 2007 Politecnico di Torino 1. Modello Entità-Relazione

Basi di dati I 27 gennaio 2016 Esame Compito A Tempo a disposizione: un ora e quarantacinque minuti. Libri chiusi.

Tecnologie dei sistemi informatici: Basi di Dati e Reti. Lezione 3. Parte I Il modello ERA: introduzione e concetti base

GESTIONE MAGAZZINO 1

Laboratorio di Basi di Dati

Basi di dati (nuovo ordinamento) 16 giugno 2008 Compito A

Sistemi informativi D B M G

Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni

Traduzione. Scelta degli identificatori principali

Laboratorio di Basi di Dati

Progettazione Concettuale/1

Il modello Entity-Relationship: elementi avanzati

Sistemi Informativi Avanzati Anno Accademico 2011/2012 Prof. Domenico Beneventano. OLAP - Analysis Services

Introduzione. Il Modello Relazionale. Relazioni e Tabelle. Relazioni Matematiche - 1. Relazioni Matematiche - 2. Relazioni Matematiche - 3

Gerarchia di Generalizzazione. Esempio. Rappresentazione grafica. Cap. 4 - Modello E/R avanzato: Gerarchie di Generalizzazione/ specializzazione

Forme normali. Le forme normali sono di solito definite sul modello relazionale, ma hanno senso in altri contesti, ad esempio il modello E-R

ESEMPIO TELEFONATE. Esempio di progettazione con indicazioni per lo svolgimento della Tesina. DIAGRAMMA RELAZIONALE

Basi di dati Prova di autovalutazione 17 gennaio 2011

Laboratorio di Basi di Dati

Il modello Entity-Relationship: elementi avanzati

Star Schema. Progettazione Logica ROLAP 30/05/2014

IL MODELLO ENTITÀ- RELAZIONE. Gli altri costruttori

Progettazione concettuale usando il modello Entità-Relazione (ER) II parte

U.D. 3 : Il digramma E/R Prof. Di Capua G.

La progettazione concettuale

I modelli logici dei dati

Atzeni, Ceri, Paraboschi, Torlone Basi di dati McGraw-Hill, Progettazione logica. Dati di ingresso e uscita

Modello Relazionale. Chiavi

Transcript:

Sistemi Informativi Avanzati Anno Accademico 2013/2014 Prof. Domenico Beneventano Modellazione concettuale Dal Capitolo 5 del libro Data Warehouse - teoria e pratica della Progettazione Autori: Matteo Golfarelli, Stefano Rizzi; Editore: McGraw-Hill Quale formalismo?! Mentre è universalmente riconosciuto che un DW si appoggia sul modello multidimensionale, non c è accordo sul formalismo di modellazione concettuale e quindi sulla metodologia di progettazione concettuale.! Il modello Entity/Relationship è molto diffuso nelle imprese come formalismo per la documentazione dei sistemi informativi relazionali, ma non può essere usato per modellare il DW. 2

Il Dimensional Fact Model (DFM)! E un modello concettuale grafico per mart, pensato per: " supportare efficacemente il progetto concettuale; " creare un ambiente su cui formulare in modo intuitivo le interrogazioni dell utente; " permettere il dialogo tra progettista e utente finale per raffinare le specifiche dei requisiti; " creare una piattaforma stabile da cui partire per il progetto logico (indipendentemente dal modello logico target); " restituire una documentazione a posteriori espressiva e non ambigua.! La rappresentazione concettuale generata dal DFM consiste in un insieme di schemi di fatto. Gli elementi di base modellati dagli schemi di fatto sono i fatti, le misure, le dimensioni e le gerarchie 3 Il DFM: costrutti di base! Un fatto è un concetto di interesse per il processo decisionale; tipicamente modella un insieme di eventi che accadono nell impresa (ad esempio: vendite, spedizioni,...). È essenziale che un fatto abbia aspetti dinamici, ovvero evolva nel tempo! Una misura è una proprietà numerica di un fatto e ne descrive un aspetto quantitativo di interesse per l analisi (ad esempio, ogni vendita è misurata dal suo )! Una dimensione è una proprietà con dominio finito di un fatto e ne descrive una coordinata di analisi (dimensioni tipiche per il fatto vendite sono,, ) fatto Un fatto esprime una associazione molti-a-molti tra le dimensioni dimensione misura quantità v enduta prezzo unitario 4

Il DFM: costrutti di base! Con attributo dimensionale si intendono le dimensioni e gli altri attributi, che le descrivono (per esempio, un è descritto dal suo tipo, dalla categoria cui appartiene, dalla sua, dal reparto in cui è venduto)! Una gerarchia è un albero direzionato i cui nodi sono attributi dimensionali e i cui archi rappresentano associazioni molti-auno tra coppie di attributi dimensionali: l arco da X a Y rappresenta la dipendenza funzionale X!Y! La gerarchia racchiude una dimensione, posta alla radice dell albero, e tutti gli attributi dimensionali che la descrivono attributo dimensionale trime stre mese gio rn o gruppo di marketing prodot to tipo VENDIT A quan tità ve nduta num. clie nti prezzo unitario categoria reparto cit tà dell a delle vendite distretto di vendita nego zio gerarchia cit tà del regio ne sta to nego zio 5 Il DFM: corrispondenza con l E/R stato regione città STATO REGIONE CITT reparto tipo REPARTO categoria CATEGORIA TIPO PRODOTTO gruppo marketing GRUPPO MARKETING CITT MARCA MARCA città ANNO TRIMESTRE MESE trimestre mese NEGOZIO vendita DATA qtà venduta prezzo unitario RESP. VENDITE DISTRETTO VACANZA GIORNO delle vendite distretto di vendita SETTIMANA giorno 6

Naming conventions! Tutti gli attributi dimensionali in ciascuno schema di fatto devono avere nomi diversi! Eventuali nomi uguali devono essere differenziati qualificandoli con il nome di un attributo dimensionale che li precede nella gerarchia " Ad esempio, warehouse city è la città in cui si trova un magazzino, mentre store city è la città in cui si trova un! I nomi degli attributi non dovrebbero riferirsi esplicitamente al fatto a cui appartengono " Ad esempio, si evitino shipped product e shipment date! Attributi con lo stesso significato in schemi diversi devono avere lo stesso nome 7 Eventi primari e dimensioni! Un evento primario è una particolare occorrenza di un fatto, individuata da una ennupla costituita da un valore per ciascuna dimensione. A ciascun evento primario è associato un valore per ciascuna misura " Nelle vendite, un possibile evento primario registra per esempio che, il 10/10/2001, nel NonSoloPappa sono state vendute 10 confezioni di detersivo Brillo per un complessivo di 25 euro " Un fatto F con n dimensioni Dim 1,!, Dim n e k misure Mis 1,!, Mis k si può considerare come una relazione F(Dim 1,!, Dim n, Mis 1,!, Mis k ) che ha come chiave D = { Dim 1,!, Dim n } quindi ciascuna misura dipende funzionalmente da D " Questo parallelo con il modello relazionale ci consente di parlare di dipendenze funzionali tra le dimensioni, tra le dimensioni e le misure! 8

Eventi secondari e pattern! Dato un insieme di attributi dimensionali (pattern), ciascuna ennupla di loro valori individua un evento secondario che aggrega tutti gli eventi primari corrispondenti. A ciascun evento secondario è associato un valore per ciascuna misura, che riassume in sé tutti i valori della stessa misura negli eventi primari corrispondenti " Pertanto, le gerarchie definiscono il modo in cui gli eventi primari possono essere aggregati e selezionati significativamente per il processo decisionale; mentre la dimensione in cui una gerarchia ha radice ne definisce la granularità più fine di aggregazione, agli altri attributi dimensionali corrispondono granularità via via crescenti! Pattern Primario e Pattern Secondari " Pattern primario: è il pattern formato dall insieme delle dimensioni " Pattern secondario: è un qualsiasi altro pattern diverso dal primario, ovvero contenente almeno un attributo dimensionale che non è una dimensione 9 Eventi e aggregazione Evento secondario (1-2001,Roma,Viteria) Evento secondario (1-2001,Viteria) città!! tipo!! tipo!! mese! Pattern secondario {mese,tipo-} mese!! Evento primario (10-1-2001,BigWare,Vite)!! Pattern primario {,,} 10

gruppo marketing GRUPPO stato MARKETING STATO ANNO categoria CATEGORIA! Utile per spiegare la semantica dei costrutti del modello DFM a città CITT regione MARCA trimestre REGIONE TRIMESTRE tipo Un fatto esprime TIPO una associazione MARCA città molti-a-molti mese CITT MESE PRODOTTO tra le dimensioni NEGOZIO reparto REPARTO Corrispondenza tra DFM ed E/R partire da quella del modello E/R (e quindi del modello relazionale) prezzo unitario vendita qtà venduta prezzo unitario DATA Le istanze sono gli eventi primari (si riporta solo Incasso) RESP. VENDITE delle vendite DISTRETTO distretto di vendita VACANZA GIORNO giorno SETTIMANA 11 Corrispondenza tra DFM ed E/R! L associazione molti-a-molti si può anche esprimere, in modo del tutto equivalente, in forma reificata (nello schema E/R sono riportate solo le entità e non gli attributi) prezzo unitario DATA (0,N) (0,N) NEGOZIO (0,N) PRODOTTO 12

CITT regione MARCA REGIONE tipo TIPO Corrispondenza tra DFM ed E/R MARCA città CITT PRODOTTO! Dimensione Opzionale TRIMESTRE MESE trimestre mese prezzo unitario RESP. VENDITE NEGOZIO DISTRETTO vendita qtà venduta (0,N) prezzo unitario VACANZA DATA GIORNO Promoz delle vendite distretto di vendita Promoz SETTIMANA giorno! Corrispondenza non del tutto esatta : nello schema di fatto Promoz è opzionale (cioè ci sono vendite senza la Promoz) mentre nello schema E/R Vendita è un associazione quaternaria che per esistere necessita anche di Promoz! Per una corrispondenza esatta si dovrebbe reificare e specializzare in _IN_PROMO che ha associata una promozione! #! si semplifica tutto considerando un particolare valore di PROMOZIONE: 13 Corrispondenza tra DFM ed E/R! L opzionalità viene codificata con un opportuno valore a livello di eventi primari prezzo unitario PROMOZ Prodotto Negozi Data Incasso Estate P1 o A 18/4 13 NO_PROMO P2 B 18/4 12 Estate P2 B 18/4 12 Promoz " In un DW i valori nulli derivanti dalle opzionalità sono codificati. 14

Modellazione e progettazione concettuale! Modellazione: sintassi e semantica del modello DFM " la semantica dei costrutti del modello DFM viene spiegata a partire dalla semantica del modello E/R! Progettazione: metodi per progettare uno schema secondo il modello DFM " Progettazione da schemi E/R: dato uno schema E/R ed i requisiti del Data Warehouse, progettare lo schema di fatto " Le scelte fondamentali che deve fare il progettista sono 1. Dimensioni (granularità) 2. Misure e relativi operatori di aggregazione 3. Gerarchia associata a ciascuna dimensione 15 Esempio di progettazione concettuale! Consideriamo la gerarchia di PRODOTTO in DBO! Lo schema di fatto può riportare tutta la gerarchia!!! oppure si decide che TIPO non è utile ai fini dell analisi: CATEGORIA PRODOTTO TIPO PRODOTTO CATEGORIA!! oppure si sceglie una granularità meno fine, non considerando PRODOTTO (schema di fatto temporale): CATEGORIA TIPO 16

Il DFM: costrutti avanzati! Un attributo descrittivo contiene informazioni aggiuntive su un attributo dimensionale, a cui è connesso da una associazione uno-a-uno. Non è usato per l aggregazione poiché ha valori continui e/o poiché deriva da un associazione uno-a-uno! Alcuni archi dello schema di fatto possono essere opzionali attributo descrittivo trimestre mese giorno peso capo reparto gruppo di marketing tipo categoria prezzo unitario (AVG) reparto città della dieta arco opzionale delle vendite distretto di vendita città del stato regione indirizzo telefono 17 Il DFM: costrutti avanzati non-additività trimestre mese giorno peso capo reparto gruppo di marketing tipo categoria prezzo unitario (AVG) reparto città della dieta delle vendite distretto di vendita IVA attributo cross-dimensionale città del stato regione indirizzo convergenza telefono inizio fine costo promozione pubblicità sconto dimensione opzionale 18

Il DFM: costrutti avanzati gerarchia condivisa uso chiamante CHIAMATA ora distretto telefonico uso del num. chiamante distretto del chiamante distretto del chiamato uso del num. chiamato chiamato chiamante SPEDIZIONE costo chiamato durata ruolo CHIAMATA durata magazzino ordine di spedizione cliente mese ora mese mese città regione stato La gerarchia è sicuramente condivisa: il del chiamante deve essere diverso dal del chiamato È il di chiamate, mentre la durata è quella complessiva. 19 Convergenza Vincolo di integrità (non esprimibile in E/R): gruppo capo lo stato della marketing città del deve reparto essere reparto lo stesso di quello del distretto del GRUPPO MARKETING REPARTO Questa informazione è esprimibile sullo schema di fatto indicando tipouna per convergenza: categoria per la convergenza rappresenta un vincolo di integrità. num. distretto DISTRETTO in regione STATO TIPO di CATEGORIA di REGIONE (0,N) Il Pattern prezzo dieta di unitario vendite di { Negozio.DistrettoVendite.Stato, (0,1) peso (0,N) (0,N) Negozio.Citta.Regione.Stato PRODOTTO vendita } SCONTRINO in NEGOZIO in CITT stato di quantità ammette come dimensione eventi secondari solo da num. coppie di valori magazzino uguali: scontrino si considera solo {Stato } indirizzo MAGAZZINO indirizzo telefono città In un pattern con un attributo di MARCA prodotta in Di condivisione per distinguere le due occorrenza occorre qualificare con Il percorso nella gerarchia 20

Archi e dimensioni opzionali! Derivano da una cardinalità minima pari a zero nelle associazioni, ovvero da associazioni opzionali! Arco Opzionale Prodotto!Dieta " Un Prodotto ha una sola Dieta; per alcuni prodotti la dieta è indefinita, ovvero assume un valore NULL " A livello di analisi dei dati, normalmente tale valore NULL viene rappresentato con un valore significativo, quale NESSUNA DIETA! Dimensione Opzionale Promozione " Un evento primario è identificato dalle dimensioni; se una dimensione è opzionale alcuni eventi primari sono identificati solo dalle altre dimensioni: le vendite senza promozione sono identificate da -- e con un valore significativo per Promozione, es. NESSUNA PROMOZIONE! L opzionalità si propaga ai discendenti nella gerarchia " Gli eventi senza promozione non h sconto " A livello di analisi dei dati, al valore NESSUNA PROMOZIONE faremo corrispondere NESSUN SCONTO per l attributo dimensionale sconto. 21 Copertura di un arco opzionale copertura di arco opzionale Prodotto (p,e) cliente codord LINEA D'ORDINE quantità importo scadenza taglia P-E tipo codprod Alimentare scadenza Abbigliamento taglia! La proprietà di copertura influisce sul di eventi secondari ammissibili " Il Pattern {Data scadenza, Taglia} in caso di copertura esclusiva non ammette eventi secondari 22

Arco Multiplo genere autore libro mese arco multiplo! Un arco multiplo corrisponde ad un associazione molti-a-molti: il padre (libro) non determina funzionalmente il figlio (autore) " Nell esempio si aggregano le vendite dei libri sulla base dei loro autori: un libro è scritto da più autori quindi non si può associare ad un unico autore! Gli archi multipli verr trattati a parte: in particolare si vedrà che per definire in modo consistente l aggregazione anche per gli archi multipli sia a volte necessario definire un peso " Nell esempio delle vendite di un libro, il peso stabilisce la percentuale dell di un libro che deve essere attribuita a ciascuno dei suoi autori 23 Dipendenze funzionali tra dimensioni! Una FD tra le dimensioni si ha quando, dato l insieme delle dimensioni D, esistono due sottoinsiemi X ed Y di D tali che X! Y. " ogni misura M dipende solo da X, cioè X! M! Con FD tra dimensioni il pattern primario è ridondante! In questo caso lo schema di fatto F è equivalente ad uno schema di fatto F con dimensioni X e con le restanti vecchie dimensioni in Y sono inclusi come attributi cross-dimensionali determinate da X " Rappresentare gli attributi di Y come dimensioni è comunque più utile per dare maggiore risalto al loro ruolo nell aggregazione. 24

Dipendenze funzionali tra dimensioni! Schema di Fatto Esame con D = {STUDENTE,FACOLTA,ANNO} e con FD: {STUDENTE,ANNO} $ FACOLTA UNIVERSITA STUDENTE STUDENTE FACOLTA ESAME ANNO UNIVERSITA FACOLTA ESAME ANNO Fare report UNIVERSITA ANNO STUDENTE con e senza la dipendenza 25 Dipendenze funzionali tra dimensioni trimestre mese giorno peso capo reparto gruppo di marketing tipo categoria prezzo unitario (AVG) reparto città della dieta delle vendite distretto di vendita IVA città del stato regione indirizzo telefono attributo cross-dimensionale IVA {Prodotto, Negozio}! IVA " inizio fine costo promozione pubblicità sconto 26