Capitolo 4. Studio dei problemi di progetto. 4.1 Data Quality

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Capitolo 4. Studio dei problemi di progetto. 4.1 Data Quality"

Transcript

1 Capitolo 4 Studio dei problemi di progetto Dal primo approccio con il progetto, è risultato chiaro che una semplice analisi della teoria sulla progettazione concettuale non sarebbe stata sufficiente ad inquadrare interamente il problema. Gli strumenti da noi sviluppati, basati principalmente sull analisi dei dati, affondavano le loro radici nel Data Quality. Nella prima parte di questo capitolo affronteremo appunto questo argomento, con particolare attenzione ai suoi legami con l informatica ed agli elementi fondamentali per l analisi qualitativa di una sorgente dati. Fonte principale di questi paragrafi è stato lo scritto Data Quality: a statistical perspective di Alan F. Karr, Ashish P. Sanil, David L. Banks. Dovendo sviluppare una metodologia d aiuto alla progettazione concettuale di datawarehouse, si è ottenuto un grande appoggio dalla lettura di un importante articolo Automating Data Warehouse Conceptual Schema Design and Evaluation, nel quale gli autori Cassandra Phipps ed Karen C. Davis presentano uno dei primi piani per la creazione di uno strumento dagli scopi similari. Le soluzioni adottate in questo elaborato sono sicuramente uno dei maggiori aiuti nell elaborazione e confronto delle politiche implementate nello strumento da noi proposto. 4.1 Data Quality Il Data Quality, applicato alla progettazione concettuale di sistemi Data Warehouse, studia la capacità del dato di essere utilizzato con efficienza, economicità e rapidità per informare e prendere decisioni. Necessariamente, il Data Quality deve assicurare l accuratezza del contenuto,l accessibilità, la rilevanza, la velocità d utilizzo, la correttezza ed esaustività della documentazione, l adattamento alle conoscenze e aspettative dell utente, e l adattamento ai costi ed alle specifiche di contesto del dominio di conoscenza. Data Quality è un argomento di studio che affonda le sue radici nella misura degli errori e nel controllo dell incertezza. La situazione attuale, che vede un massiccio ricorso all informatica, per la rilevazione e mantenimento di insiemi di dati da utilizzare per adottare politiche decisionali complesse, fa sì che problemi di Data Quality possano creare significanti inefficienze dai risvolti economici importanti Informatica e Data Quality Il processo di DataWarehouse solitamente richiede l assemblaggio di dati proveniente da una varietà di risorse e l analisi a supporto decisionale. Questa necessità di integrazione fra sorgenti diverse, ognuna con i suoi standard e la sua politica, porta ad un degrado dell informazione. Per questo comportamento il processo di DataWarehouse attende dal Data Quality nuovo impegno nell identificazione degli elementi dell informazione non validi, in quanto violanti vincoli fisici, logici o di dominio. 23

2 4.1.2 Elementi di analisi di Data Quality Il Data Quality in realtà non si ferma alla sola analisi dei dati, ma si divide in tre branche: - Qualità dei processi: analisi della qualità relativa alle operazioni di generazione, assemblaggio, descrizione e mantenimento dei dati. Gli strumenti fondamentali di questo campo analizzano Affidabilità, Metadata, Sicurezza, e Riservatezza. Essi si basano solo su una valutazione qualitativa e sono altamente legati al contesto, perciò risultano essere soggettivi e non adatti ad uno strumento che si propone di essere di uso generale. - Qualità dei dati: questa fase del Data Quality è ovviamente strettamente legata ai dati (ed è appunto la parte a cui noi ci rifacciamo nello sviluppo dello strumento più avanti presentato). Nell analisi dei record, delle tabelle e degli attributi, si fa particolare ricorso alla rilevazione delle seguenti proprietà: Accuratezza, Completezza, Consistenza e Validità. Nell analisi qualitativa dei database gli strumenti preferiti analizzano Identificabilità e Joinability. Basandosi sull analisi dei dati,effettuano valutazioni di tipo quantitativo, e perciò sono facilmente verificabili ed implementabili. - Qualità del trattamento: Analisi sul metodo di trattamento dell informazione da parte dell utenza e fruibilità del dato. Strumenti utilizzati in questa fase guardano ad: Accessibilità, Integrabilità, Interpretabilità, Retificabilità, Rilevanza, Timeliness. Anche questi sono valutabili solo qualitativamente, e perciò altamente soggettivi e legati al contesto, dunque non adatti ad uno strumento di utilizzo generale, come vuole essere il progetto che abbiamo sviluppato. Benché nella nostra trattazione sia stata utilizzata solamente l analisi della Qualità dei dati (in quanto unico settore slegato dal contesto), qui di seguito proponiamo una descrizione dettagliata tutte le branche in cui si può suddividere il Data Quality, in quanto si vuole mantenere ancora nel lettore una visione larga del problema di analisi della qualità. I problemi e le politiche adottate nello sviluppo del progetto verranno affrontate nello specifico nei capitoli successivi Qualità dei processi Tale segmento di ricerca è basato sullo studio dei metodi Best practice o Stato dell arte. I loro risultati derivano da analisi qualitative e soggettive, usualmente notevolmente influenzate dal dominio in analisi. Per valutazione della Affidabilità di un processo si intende la valutazione della correttezza ed efficienza dei metodi adottati, comparati con le politiche di esecuzione considerate stato dell arte. Ci sono tre principali suddivisioni corrispondenti a generazione, editing ed analisi. Esaminare l Affidabilità a livello di generazione dati significa eseguire controlli in modo da massimizzare il Data Quality durante la raccolta e controllo dati, misurando quanto la conduzione di interviste impatta sulla qualità ed attendibilità finale del dato. Gli argomenti principali trattati in questa fase sono: - progettazione strumenti di controllo qualitativo dei processi - selezione del metodo di raccolta dati - strategie per la minimizzazione delle non risposte - strategie per la riduzione dei tempi di processo dei dati Analizzare l Affidabilità a livello di editing del dato prevede una ampia varietà di metodi per evitare la perdita di dati sugli attributi, con lo scopo di identificare e se possibile correggere inconsistenze tra dati, o tra dati e loro domini. Studiare l Affidabilità a livello di analisi dei dati comprende la rilevare l incertezza nelle valutazioni statistiche, per identificare le non risposte e la ripartizione dei dati rilevati sul dominio di competenza, allo scopo di ottimizzare l analisi. 24

3 Con il controllo dei Metadata (dove per metadata si considera l insieme di informazioni utili a definire il dominio e la struttura di un database) ci si preoccupa di assicurare che il contenuto, la collezione dei processi, la proprietà e l affidabilità dei dati siano documentati chiaramente, senza ambiguità ed in una forma che sia accessibile dall utenza. La qualità ed accuratezza della documentazione sui dati ha un impatto critico sul Data Quality, influenzato in particolar modo dalla utilizzabilità del dato stesso. Inoltre il mantenimento di metadati precisi e ben strutturati risulta essenziale nel momento in cui si deve integrare i dati provenienti da varie sorgenti. All interno di un organizzazione avere un gruppo assegnato a rivedere i metadata può rivelarsi in molti casi una strategia efficace ed non costosa. Tale gruppo può inoltre formulare linee guida e liste di controllo da seguire nel momento dell archiviazione dei dati. I principi di progettazione ed analisi dei Sistemi Informativi prevedono l uso di Dizionari dei dati come strumento di raccolta dei metadati. Un più sofisticato approccio è legato alla definizione di precisi standard per la documentazione dei dati, e quindi della creazione di software per la verifica, il parsing,il processo e la generazione di metadati. Strumenti di analisi della Sicurezza di un sistema si occupano di analizzare la sicurezza ottenuta attraverso l adozione di hardware e software specifico, per la prevenzione da accessi ed usi di servizi non autorizzati. Infine abbiamo strumenti di analisi della Riservatezza che misurano il grado di robustezza di un sistema informativo dall accesso non autorizzato a dati confidenziali. Qualità dei dati Come visto in precedenza la qualità dei dati viene analizzata in due livelli: il livello dei Record/Tabelle ed il livello dei Database. Nel livello Record troviamo delle misure che sono prettamente di tipo binario (Ad esempio il valore di un attributo può essere o corretto o scorretto ) e riassunte nel livello Tabelle da metriche Data Quality come ad esempio la frazione di record corretti. Una prima proprietà da osservare in questo settore è l Accuratezza, la quale misura appunto la correttezza di un dato. In alcuni casi proprio per il dominio dell informazione in esame il rilevamento di questo fattore è estremamente semplice (Es: la correttezza dell età di una persona è una misurazione oggettiva) mentre in altri (aperti a considerazioni soggettive) giudicare la correttezza di un dato è molto più arduo. Fondamentale in questo frangente è dunque la determinazione del livello di correttezza, soprattutto nei casi in cui la sua rilevazione sia molto difficile. Nell effettuare tali misurazioni però ci si deve scontrare oltre che con le limitazioni tecnologiche per il rilevamento, anche con la convenienza economica dello stesso. Difatti esistono molti casi in cui il rilevamento è possibile ma non economicamente vantaggioso. Altra proprietà binaria è Completezza, la quale indica se un record è stato compilato o meno. In questo caso possono nascere problemi confondendosi tra valori mancanti e legittimi, e proprio alla luce di ciò proponiamo due metriche che si occupano di questo settore che sono: - percentuale di attributi senza valori mancanti (i valori che indicano che manca una vera rilevazione non vengono considerati validi) - percentuale di attributi contenenti valori (conta anche i valori che indicano un valore mancante come validi) 25

4 Ulteriore proprietà dal dominio booleano è Consistenza, la quale rileva se le relazioni intra-record, definite in una base di dati sono rispettate. Una volta definita una regola di consistenza, la rilevazione dello stato (consistente od inconsistente) è pressoché istantanea e può facilmente essere utilizzata per rilevare metriche come la frazione di record consistenti. Altra misura, questa volta piuttosto debole, è Validità. Tale dato indica non la correttezza del dato rilevato, ma semplicemente la sua plausibilità, cioè l appartenenza al dominio dell attributo in esame. Ovviamente anche in questo caso ci sono complicazioni derivanti dal ricorso a diversi tipi di risorse, ognuna delle quali avrà delle regole diverse di rappresentazione dei dati. Analizziamo ora le metriche che si trovano a livello Database. Tali misure servono principalmente per comprendere se l insieme di tabelle che attualmente cerchiamo di combinare permettano tale operazione. Solitamente questi indici vengono utilizzati nella costruzione di Database, in quanto ne analizzano le principali peculiarità, mentre perdono di interesse nel Data Warehousing, dato che le sorgenti di tali elementi del sistema informativo sono già state testate. La prima proprietà è Identificabilità, e si basa sulla presenza in una tabella di un identificatore univoco (il quale può essere sia un unico attributo che combinazione di diversi attributi), chiamato chiave primaria. Ovviamente anche questa misura è di tipo binario (una tabella può avere o non avere la chiave primaria), ed è di immediata rilevazione. Ultima proprietà di questo insieme è Joinability, che indica la possibilità di due tabelle di fondersi insieme e creare una nuova tabella. Requisito fondamentale è che la chiave primaria di una tabella sia presente come semplice attributo nell altra (della quale sarà considerato chiave esterna). Qualità del trattamento Tutte le metriche sopra citate si occupano o delle sequenze di esecuzione di alcune operazioni o del trattamento del dato. Nessuna ha tenuto conto però dell elemento umano, sebbene la maggior parte degli strumenti elettronici siano human-centric, e quindi sia necessaria un analisi sulla utilizzabilità dello strumento stesso. Proprio per tale necessità sono stati studiati degli indicatori che misurano tali gradi di soddisfazione dell utente. Una prima proprietà è l Accessibilità, vale a dire la facilità di utilizzo del sistema. Tale indicatore deve analizzare se il traffico normale del sistema è supportato correttamente, assicurare sulla modernità dei formati dei file utilizzati, sull efficienza dei sistemi legacy che vengono eseguiti su vecchie piattaforme, e testare l efficacia delle interfacce dei moderni software. Altra caratteristica fondamentale è l Integrabilità, che mostra il livello di integrazione tra diversi Database. In questo settore le problematiche vanno dalla necessità di unire Database con diverse definizioni di dominio per Attributi simili, alla impossibilità di eseguire dei join tra tabelle a causa dell utilizzo di chiavi diverse. Attualmente gli strumenti di integrazione dei Database sono in avanzato sviluppo, ciò che impedisce veramente le corrette fusioni sono gli errori commessi nella fase della progettazione concettuale dei Database. 26

5 Altro strumento rilevante è quello che si occupa dell Interpretabilità. Esso deve guardare a due aspetti fondamentali: - la consistenza del dato. Un certo tipo di dato può essere riportato nel Database in molti modi (ad esempio per un mutamento delle politiche di immagazzinamento dati nel tempo), oppure Database diversi che cooperano tra loro possono utilizzare definizioni diverse per lo stesso attributo. Questi comportamenti influenzano notevolmente la fruibilità del dato e la correttezza dei risultati. - L abilità nell estrazione dell informazione dai dati, che viene trattata dagli statistici come inferenza. Proprietà importante e degna di rilevamento è inoltre Retificabilità, che indica quanto è facile per l utente finale (sia esso il gestore dei Sistema Informativo, oppure un semplice soggetto tracciato dal Database), richiedere una modifica nei dati immessi nel sistema. Grande peso è dato dalle aziende a questo processo, e precise linee guida vengono redatte per informare l utenza sulle modalità di modifica dati. Importante elemento di analisi è la Rilevanza, che indica se un dato presente nel Database è di interesse per l utente. Due sono i problemi che devono essere rilevati: - le omissioni di dati nei risultati, che possono essere trovate solo dall utente finale - la presenza nel database di dati irrilevanti per l uso degli utenti, che devono essere valutate dall amministratore di database confrontando le tipologie di informazione mantenute nel database con quelle utili alle varie categorie di utenti. Ultimo dato da presentare per questo settore d analisi è Timeliness, che indica la corretta datazione nel rilevamento di informazioni. La corretta datazione è un elemento fondamentale nei database: difatti un analisi eseguita con una datazione inadeguata può portare a false certezze, compotrando un accuratezza peggiore di quella derivante da un analisi slegata dal tempo. 27

6 4.2 Un caso di studio Cassandra Phipps e Karen C. Davis hanno proposto un procedimento per la creazione automatica di uno schema concettuale per Data Warehouse, a partire da uno schema concettuale di una base di dati operazionale. Tale strumento, nella prima parte precede automaticamente alla creazione di diversi schemi concettuali, rappresentati col modello ME/R (Multidimensional Entity/Relationship). Nella seconda parte il modello è rifinito grazie ad input aggiuntivi, seguendo un approccio basato sui requisiti, e ponendo domande all utente atte alla selezione dei migliori schemi candidati alla realizzazione degli obiettivi. Viene inoltre presentata una linea guida con le principali operazioni di rifinitura da svolgere per aggiungere nel modello concettuale le funzionalità richieste dall utente Presentazione del modello ME/R utilizzato nella rappresentazione dello schema concettuale L obbiettivo nella creazione di uno schema concettuale è trasferire i requisiti utente in una rappresentazione astratta e comprensibile dall utente, indipendente dall implementazione finale, ma comunque formale e completa, tale da poter essere trasformata nel successivo schema logico senza ambiguità. Cassandra Phipps e Karen Davis propongono il modello ME/R per la creazione degli schemi concettuali, scelto soprattutto per l efficacia e la chiarezza espositiva. I costrutto centrale del ME/R è il fact node, rappresentato da un rombo, che contiene le misure di business. Un level node, rappresentato da un rettangolo, contenente informazioni sulle misure. Ogni livello o fact node ha degli attributi, rappresentati come elissi, che sono descrittori per questa entità. Questi sono i tre construtti principali che compongono l ME/R model, e sono connessi da diverse relazioni. Un fact node è legato a un livello da un arco dimensionale visualizzata come una retta senza verso. La relazione has connette fatti o livelli ai relativi attributi, sempre attraverso una retta non direzionata. La classificazione degli archi indica le relazioni tra i livelli. Questa è rappresentata dal simbolo di una forchetta posta alla fine di una retta con verso. Tutti i livelli del fact node, legati da archi di classificazione, rappresentano una dimensione del modello. Gli archi diretti tra livello sono importanti in quanto indicano aggregazioni gerarchiche. Questo è particolarmente importante quando un nodo di livello può essere un nodo di classificazione per più di un livello. Con soli tre costrutti, il modello ME/R è semplice per la lettura degli utenti finali, e l aggregazione è mostrata attraverso la gerarchia di livelli rappresentante le dimensioni Problemi dell approccio automatizzato alla progettazione concettuale L iniziale determinazione di misure, fatti, o eventi è la parte più difficile ed è solitamente eseguita manualmente. Diversi approcci nel trovare misure sono stati suggeriti: 1. derivare la tabella dei fatti da uno schema a stella selezionando le relazioni molti a molti nel modello ER contenente fatti numerici ed additivi non chiave 2. trovare le misure candidate analizzando le queries di business alla ricerca dei tipi di dato che indicanti le performance di business 28

7 3. trovare i fatti basati sulle entità che sono più frequentemente aggiornate 4. osservare che le proprietà dei fatti sono usualmente dati numerici, e quindi sono di facile aggregazione Prima della proposta del processo di progettazione di Cassandra Phipps e Karen C. Davis, erano stati proposti diversi approcci semiautomatici o automatici per la creazione di schemi da sistemi OLTP, nessuno dei quali includeva un meccanismo automatico di rilevamento delle misure, pertanto lo studio da loro affrontato è stato il primo tentativo di automazione della creazione di uno schema concettuale a partire da un OLTP schema, incluse l iniziale determinazione di fatti e misure Creazione dello schema concettuale Questo approccio alla generazione di schemi ha due premesse fondamentali. La prima è che attributi numerici rappresentano misure di potenziale interesse di business e maggiore è il numero di questi attributi in un entità e maggiore è la probabilità che tale entità sia un evento od un fatto. La seconda premessa è che la cardinalità di una relazione determina quanto sia importate una entità nella creazione di uno schema. Ogni entità dotata di una relazione a molti è di grande importanza (ed ognuna delle sue entità può essere parimenti importante), dato che potenzialmente è dotata di un alto livello di astrazione. L algoritmo qui presentato per la creazione di schemi concettuali consta di cinque passi il cui schema risultante è centrato sugli eventi di business, con relazioni ad altre entità dalle quali rilevare le dimensioni descriventi tali eventi. Benché ci siano istanze dove gli eventi scelti hanno poco o nessun significato per l utente, e le analisi più comuni devono essere aggiunte dal progettista, comunque la creazione dello schema iniziale è automatizzata. Gli schemi così ottenuti devono essere rifiniti manualmente come descritto nel paragrafo successivo. L input dell algoritmo è uno schema ER rappresentante la struttura dati sorgente, mentre l output è un set di schemi ME/R rappresentante i fact nodes, i relativi sottolivelli ed attributi. I passi dell algoritmo sono riassunti come segue: 1. trovare le entità con attributi numerici e creare un fact node per ogni entità identificata. In questo frangente si ordina le entità con i campi numerici in ordine discendente. Processando le entità in questo modo i migliori candidati sono creati prima e vengono inseriti in un rombo. 2. creare attributi numerici per ogni fact node basato sugli attributi numerici delle entità, che vengono posti all interno di elissi collegate alle relative entità 3. creare livelli del tempo per ogni tipo di livello temporale (data od ora) usato per ciascun fact node. Innanzitutto si individuano tutte le informazioni riguardanti le datazioni o gli orari; esse diverranno dimensioni nel ME/R schema. A questo punto nel processo automatizzato non siamo a conoscenza della granularità di questi attributi, perciò sarà necessario l intervento umano per determinare la rappresentazione migliore di tali dimensioni, e saranno rappresentate nel grafico non come rettangoli, bensì come esagoni, appunto per questa loro necessità di essere rielaborate. 4. creare un livello (dimensione) contenente i rimanenti attributi delle entità (non numerici, non chiave). Questi attributi mantengono un informazione generalmente di tipo stringa, che porta alla creazione di livelli rappresentati come rettangoli. 5. ricorsivamente esaminare le relazioni di un entità per aggiungere livelli in un sistema di gerarchie (creazione della dimensione). In questa fase ciascun fact node è valutato. Ogni entità connessa è posta in un level node con i suoi attributi. Se questa level entity è il verso a molti della relazione, le sue relazioni sono pure valutate e processate chiamando ancora 29

8 la subprocedura. Se incontriamo una relazione che non è molti a molti od uno a molti, non l aggiungiamo nello schema. L algoritmo si ferma nel momento in cui nessun event entity ha relazioni a molti ancora da analizzare. In questo frangente nasce la necessità di introdurre un nuovo simbolo: la nuvoletta, che denoterà che un livello, seppure necessario per il data warehouse non è stato automaticamente rilevato, e perciò per la sua introduzione sarà necessario l intervento dell uomo. In generale, gli schemi concettuali così generati non sono completamente fruibili dall utente, e necessitano di un affinamento da parte del progettista Selezione di schemi candidati e rifinitura In questa sezione vengono utilizzate delle queries per valutare quali tra gli schemi candidati ottenuti nel punto precedente siano quelli che meglio si adattano alle necessità dell utente. Ci sono due aspetti di una query che sono usati per determinare se uno schema candidato può darle risposta:le tabelle menzionate nella FROM e gli attributi nominati nella SELECT. Infatti affinché l esecuzione di una query abbia buon fine deve essere possibile ritrovare il dato desiderato, e per fare questo deve essere reperibile sia la tabella che l attributo di cui il dato che stiamo cercando è istanza. Per comparare gli schemi candidati è necessario creare una tabella nella quale per ogni riga viene posto il risultato di una certa query, mentre ad ogni colonna corrisponde uno schema nel quale tale richiesta viene eseguita. Il dato immagazzinato in tale tabella indicherà se una certa query eseguita su un certo schema è stata eseguita correttamente, ha ottenuto una risposta solo parziale, o addirittura non ha ricevuto risposta. Al termine dell esecuzione delle query nei vari domini rappresentati negli schemi, è possibile processare automaticamente i risultati ottenuti attraverso un algoritmo di copertura del grafo, oppure attraverso una valutazione manuale, in modo da determinare quali schemi candidati mantenere e quali eliminare. L algoritmo utilizzato in questo frangente ha i seguenti scopi: - rispondere al maggior numero di domande possibili - rispondere a ciascuna domanda con la massima esattezza possibile - ottenere un insieme di schemi che sia il più piccolo possibile Da questa prima analisi otteniamo un insieme di schemi, alcuni dei quali utili perché sono gli unici a rispondere ad una determinata query. E necessario dunque l intervento umano per comprendere se è possibile eliminare tali schemi, modificando gli altri candidati che rispondono ad un alto numero di query, e strutturarli in modo da permettere la soluzione anche dell unica query per cui viene accettato lo schema in esame. In generale, durante il raffinamento manuale dello schema si deve tenere conto dei seguenti passi: 1. Eliminare i schemi candidati non necessari 2. Controllare la validità delle misure rilevate per un fact node 3. Determinare il giusto livello di granularità dell informazione, in particolar modo per quanto riguarda le date (la dimensione temporale) 4. Controllare che non sia stata omessa la rilevazione di particolari attributi necessari 5. Analizzare la possibilità di combinazione delle informazioni contenute negli schemi 6. Eliminare gli attributi non necessari all utente 7. Controllare che la mancanza di dati necessari all utente non derivi da una mancanza del database di partenza 30

TEORIA sulle BASI DI DATI

TEORIA sulle BASI DI DATI TEORIA sulle BASI DI DATI A cura del Prof. Enea Ferri Cos è un DATA BASE E un insieme di archivi legati tra loro da relazioni. Vengono memorizzati su memorie di massa come un unico insieme, e possono essere

Dettagli

PROGETTAZIONE CONCETTUALE

PROGETTAZIONE CONCETTUALE Fasi della progettazione di basi di dati PROGETTAZIONE CONCETTUALE Parte V Progettazione concettuale Input: specifiche utente Output: schema concettuale (astrazione della realtà) PROGETTAZIONE LOGICA Input:

Dettagli

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Data warehousing Introduzione A partire dalla metà degli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

Pianificazione del data warehouse

Pianificazione del data warehouse Pianificazione del data warehouse Dalla pianificazione emergono due principali aree d interesse: area commerciale focalizzata sulle agenzie di vendita e area marketing concentrata sulle vendite dei prodotti.

Dettagli

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011 Data warehousing Introduzione A partire dagli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa lezione vedremo

Dettagli

Modellazione di sistema

Modellazione di sistema Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Modellazione di sistema E. TINELLI Contenuti Approcci di analisi Linguaggi di specifica Modelli di

Dettagli

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Roccatello Ing. Eduard L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Agenda Presentazione docente Definizione calendario Questionario pre corso

Dettagli

Database. Organizzazione di archivi mediante basi di dati. ing. Alfredo Cozzi 1

Database. Organizzazione di archivi mediante basi di dati. ing. Alfredo Cozzi 1 Database Organizzazione di archivi mediante basi di dati ing. Alfredo Cozzi 1 Il database è una collezione di dati logicamente correlati e condivisi, che ha lo scopo di soddisfare i fabbisogni informativi

Dettagli

Basi di dati. Le funzionalità del sistema non vanno però ignorate

Basi di dati. Le funzionalità del sistema non vanno però ignorate Basi di dati La progettazione di una base di dati richiede di focalizzare lo sforzo su analisi, progettazione e implementazione della struttura con cui sono organizzati i dati (modelli di dati) Le funzionalità

Dettagli

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2)

Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2) Tecnologie per i sistemi informativi Breve introduzione ai data warehouse (per gli allievi che non hanno seguito BD2) Letizia Tanca lucidi tratti dal libro: Atzeni, Ceri, Paraboschi, Torlone Introduzione

Dettagli

Data warehousing con SQL Server

Data warehousing con SQL Server Data warehousing con SQL Server SQL Server è un RDBMS (Relational DataBase Management System) Analysis Services è un componente di SQL Server che offre un insieme di funzionalità di supporto al data warehousing

Dettagli

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Le Basi di dati: generalità. Unità di Apprendimento A1 1 Le Basi di dati: generalità Unità di Apprendimento A1 1 1 Cosa è una base di dati In ogni modello di organizzazione della vita dell uomo vengono trattate informazioni Una volta individuate e raccolte devono

Dettagli

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni Data warehouse Data warehouse La crescita dell importanza dell analisi dei dati ha portato ad una separazione architetturale dell ambiente transazionale (OLTP on-line transaction processing) da quello

Dettagli

Ingegneria del Software Progettazione

Ingegneria del Software Progettazione Ingegneria del Software Progettazione Obiettivi. Approfondire la fase di progettazione dettagliata che precede la fase di realizzazione e codifica. Definire il concetto di qualità del software. Presentare

Dettagli

Considera tutti i requisiti funzionali (use cases) NON deve necessariamente modellare i requisiti non funzionali

Considera tutti i requisiti funzionali (use cases) NON deve necessariamente modellare i requisiti non funzionali Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Progettazione OO E. TINELLI Punto di Partenza Il modello di analisi E una rappresentazione minima del

Dettagli

Basi di Dati Complementi Esercitazione su Data Warehouse

Basi di Dati Complementi Esercitazione su Data Warehouse Sommario Basi di Dati Complementi Esercitazione su Data Warehouse 1. Riassunto concetti principali dalle slide della lezione di teoria 2.Studio di caso : progettazione di un Data Warehouse di una catena

Dettagli

Ingegneria dei Requisiti

Ingegneria dei Requisiti Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Ingegneria dei Requisiti E. TINELLI Contenuti I requisiti del software Documento dei requisiti I processi

Dettagli

Data warehousing con SQL Server

Data warehousing con SQL Server Data warehousing con SQL Server! SQL Server è un RDBMS (Relational DataBase Management System)! Analysis Services è un componente di SQL Server che offre un insieme di funzionalità di supporto al data

Dettagli

Architetture per l analisi di dati

Architetture per l analisi di dati Architetture per l analisi di dati Basi di dati: Architetture e linee di evoluzione - Seconda edizione Capitolo 8 Appunti dalle lezioni Motivazioni I sistemi informatici permettono di aumentare la produttività

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Governo Digitale a.a. 2011/12

Governo Digitale a.a. 2011/12 Governo Digitale a.a. 2011/12 I sistemi di supporto alle decisioni ed il Data Warehouse Emiliano Casalicchio Agenda Introduzione i sistemi di supporto alle decisioni Data warehouse proprietà architettura

Dettagli

Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica. Ingegneria del Software.

Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica. Ingegneria del Software. Università degli Studi di Parma Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica Ingegneria del Software La fase di Test Giulio Destri Ing. del Software: Test - 1 Scopo del modulo Definire

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Progettazione base dati relazionale

Progettazione base dati relazionale Progettazione base dati relazionale Prof. Luca Bolognini E-Mail:luca.bolognini@aliceposta.it Progettare una base di dati Lo scopo della progettazione è quello di definire lo schema della base di dati e

Dettagli

1.1 I componenti di un DBMS... 5

1.1 I componenti di un DBMS... 5 Indice 1 Introduzione ai DBMS.......................................................... 1 1.1 Scopi di un DBMS............................................................ 1 1.2 Modelli dei dati..............................................................

Dettagli

Verifica e Validazione del Simulatore

Verifica e Validazione del Simulatore Verifica e del Simulatore I 4 passi principali del processo simulativo Formulare ed analizzare il problema Sviluppare il Modello del Sistema Raccolta e/o Stima dati per caratterizzare l uso del Modello

Dettagli

Introduzione ad OLAP (On-Line Analytical Processing)

Introduzione ad OLAP (On-Line Analytical Processing) Introduzione ad OLAP (On-Line Analytical Processing) Metodi e Modelli per il Supporto alle Decisioni 2002 Dipartimento di Informatica Sistemistica e Telematica (Dist) Il termine OLAP e l acronimo di On-Line

Dettagli

Data Warehousing e Data Mining

Data Warehousing e Data Mining Università degli Studi di Firenze Dipartimento di Sistemi e Informatica A.A. 2011-2012 I primi passi Data Warehousing e Data Mining Parte 2 Docente: Alessandro Gori a.gori@unifi.it OLTP vs. OLAP OLTP vs.

Dettagli

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Sistemi Informativi Aziendali II

Sistemi Informativi Aziendali II Modulo 2 Sistemi Informativi Aziendali II 1 Corso Sistemi Informativi Aziendali II - Modulo 2 Modulo 2 La gestione delle informazioni strutturate nell impresa: La progettazione di un Data Base; Le informazioni

Dettagli

Introduzione al data base

Introduzione al data base Introduzione al data base L Informatica è quella disciplina che si occupa del trattamento automatico dei dati con l ausilio del computer. Trattare i dati significa: raccoglierli, elaborarli e conservarli

Dettagli

Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali

Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali Base Di Dati II Anno accademico 2011/2012 Progettazione di un Data mart per l'analisi dei servizi bibliotecari universitari

Dettagli

Data warehouse Introduzione

Data warehouse Introduzione Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi

Dettagli

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File system verso DBSM Vantaggi di un DBMS Modelli dei dati Utenti

Dettagli

Istituto Angioy Informatica BASI DI DATI. Prof. Ciaschetti

Istituto Angioy Informatica BASI DI DATI. Prof. Ciaschetti Istituto Angioy Informatica BASI DI DATI Prof. Ciaschetti Introduzione e prime definizioni Una Base di dati o Database è un archivio elettronico opportunamente organizzato per reperire in modo efficiente

Dettagli

Lorenzo Braidi. Database design. Libro_datadesign.indb 1 23-11-2004 10:06:17

Lorenzo Braidi. Database design. Libro_datadesign.indb 1 23-11-2004 10:06:17 Lorenzo Braidi Database design Libro_datadesign.indb 1 23-11-2004 10:06:17 Sommario Introduzione...XI Capitolo 1 Le basi di dati relazionali... 1 Le basi di dati... 1 Un po di storia... 2 I database gerarchici...

Dettagli

Introduzione ai sistemi di basi di dati

Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Alessandro.bardine@gmail.com alessandro.bardine@iet.unipi.it Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File

Dettagli

Gestione Requisiti. Ingegneria dei Requisiti. Requisito. Tipi di Requisiti e Relativi Documenti. La gestione requisiti consiste in

Gestione Requisiti. Ingegneria dei Requisiti. Requisito. Tipi di Requisiti e Relativi Documenti. La gestione requisiti consiste in Ingegneria dei Requisiti Il processo che stabilisce i servizi che il cliente richiede I requisiti sono la descrizione dei servizi del sistema Funzionalità astratte che il sistema deve fornire Le proprietà

Dettagli

13. Datawarehouse (parte 2) Analisi e riconciliazione delle fonti dati progettista amministratori dei database modello a tre livelli

13. Datawarehouse (parte 2) Analisi e riconciliazione delle fonti dati progettista amministratori dei database modello a tre livelli 13. Datawarehouse (parte 2) Analisi e riconciliazione delle fonti dati Questa fase richiede di definire e documentare lo schema del livello dei dati operazionali, a partire dal quale verrà alimentato il

Dettagli

Data Warehouse Architettura e Progettazione

Data Warehouse Architettura e Progettazione Introduzione Data Warehouse Architettura! Nei seguenti lucidi verrà fornita una panoramica del mondo dei Data Warehouse.! Verranno riportate diverse definizioni per identificare i molteplici aspetti che

Dettagli

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS)

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS) Introduzione La misurazione dei sistemi di Data Warehouse Luca Santillo (CFPS) AIPA, 17/5/01 In pratica I concetti generali, le definizioni e le regole di conteggio possono essere difficili da applicare

Dettagli

I Sistemi Informativi

I Sistemi Informativi I Sistemi Informativi Definizione Un Sistema Informativo è un mezzo per acquisire, organizzare, correlare, elaborare e distribuire le informazioni che riguardano una realtà che si desidera descrivere e

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

Sistemi Informativi e Basi di Dati

Sistemi Informativi e Basi di Dati Sistemi Informativi e Basi di Dati Laurea Specialistica in Tecnologie di Analisi degli Impatti Ecotossicologici Docente: Francesco Geri Dipartimento di Scienze Ambientali G. Sarfatti Via P.A. Mattioli

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi Sistemi Informativi La Modellazione Dimensionale dei Fatti Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi Obiettivi Nelle lezioni precedenti abbiamo modellato i processi

Dettagli

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

ITI Galilei Salerno Corso Database ed SQL

ITI Galilei Salerno Corso Database ed SQL ITI Galilei Salerno Corso Database ed SQL prof Carmine Napoli Introduzione Database: Si definisce Database un insieme di dati, di solito di notevoli dimensioni, raccolti, memorizzati ed organizzai in modo

Dettagli

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse Politecnico di Milano View integration 1 Integrazione di dati di sorgenti diverse Al giorno d oggi d la mole di informazioni che viene gestita in molti contesti applicativi è enorme. In alcuni casi le

Dettagli

La guida CRM per eliminare le incertezze: prendete il controllo del vostro business

La guida CRM per eliminare le incertezze: prendete il controllo del vostro business 2 La guida CRM per eliminare le incertezze: prendete il controllo del vostro business (2 - migliorate la vostra credibilità: i 5 passi per dimostrare l efficacia del Marketing) Pagina 1 di 9 SOMMARIO PREMESSA...

Dettagli

PBI Passepartout Business Intelligence

PBI Passepartout Business Intelligence PBI Passepartout Business Intelligence TARGET DEL MODULO Il prodotto, disponibile come modulo aggiuntivo per il software gestionale Passepartout Mexal, è rivolto alle Medie imprese che vogliono ottenere,

Dettagli

Appunti lezione Database del 07/10/2015

Appunti lezione Database del 07/10/2015 Appunti lezione Database del 07/10/2015 Nelle lezioni precedenti si è visto come qualunque applicazione informativa è almeno formata da tre livelli o layers che ogni progettista conosce e sa gestire: Livello

Dettagli

Cosa è un data warehouse?

Cosa è un data warehouse? Argomenti della lezione Data Warehousing Parte I Introduzione al warehousing cosa è un data warehouse classificazione dei processi aziendali sistemi di supporto alle decisioni elaborazione OLTP e OLAP

Dettagli

Basi di dati. (Sistemi Informativi) teoria e pratica con Microsoft Access. Basi di dati. Basi di dati. Basi di dati e DBMS DBMS DBMS

Basi di dati. (Sistemi Informativi) teoria e pratica con Microsoft Access. Basi di dati. Basi di dati. Basi di dati e DBMS DBMS DBMS Basi di Basi di (Sistemi Informativi) Sono una delle applicazioni informatiche che hanno avuto il maggiore utilizzo in uffici, aziende, servizi (e oggi anche sul web) Avete già interagito (magari inconsapevolmente)

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it Data Mining Gabriella Trucco gabriella.trucco@unimi.it Perché fare data mining La quantità dei dati memorizzata su supporti informatici è in continuo aumento Pagine Web, sistemi di e-commerce Dati relativi

Dettagli

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE.

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. INFORMATICA Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. APPLICAZIONI WEB L architettura di riferimento è quella ampiamente diffusa ed

Dettagli

Strumenti di modellazione. Gabriella Trucco

Strumenti di modellazione. Gabriella Trucco Strumenti di modellazione Gabriella Trucco Linguaggio di modellazione Linguaggio formale che può essere utilizzato per descrivere (modellare) un sistema Il concetto trova applicazione soprattutto nell

Dettagli

Descrizione... 3 Comprensione del Processo Produttivo... 3. Definizione del Problema... 4. Selezione delle Caratteristiche... 5. Box Plot...

Descrizione... 3 Comprensione del Processo Produttivo... 3. Definizione del Problema... 4. Selezione delle Caratteristiche... 5. Box Plot... Pagina 2 Descrizione... 3 Comprensione del Processo Produttivo... 3 Definizione del Problema... 4 Selezione delle Caratteristiche... 5 Box Plot... 6 Scatterplot... 6 Box Plot... 7 Scatterplot... 7 Alberi

Dettagli

Sistemi Informativi I Lezioni di Ingegneria del Software

Sistemi Informativi I Lezioni di Ingegneria del Software 4 Codifica, Test e Collaudo. Al termine della fase di progettazione, a volte anche in parallelo, si passa alla fase di codifica e successivamente alla fase di test e collaudo. In questa parte viene approfondita

Dettagli

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi Indice generale OOA Analisi Orientata agli Oggetti Introduzione Analisi Metodi d' analisi Analisi funzionale Analisi del flusso dei dati Analisi delle informazioni Analisi Orientata agli Oggetti (OOA)

Dettagli

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it Processi di Business e Sistemi di Gestione di Workflow: concetti di base Prof. Giancarlo Fortino g.fortino@unical.it Introduzione Le aziende devono modificare la loro organizzazione per cogliere le nuove

Dettagli

SWIM v2 Design Document

SWIM v2 Design Document PROGETTO DI INGEGNERIA DEL SOFTWARE 2 SWIM v2 DD Design Document Matteo Danelli Daniel Cantoni 22 Dicembre 2012 1 Indice Progettazione concettuale Modello ER Entità e relazioni nel dettaglio User Feedback

Dettagli

Il modello Entity-Relationship per il progetto delle basi di dati

Il modello Entity-Relationship per il progetto delle basi di dati 1 Il modello Entity-Relationship per il progetto delle basi di dati Massimo Paolucci (paolucci@dist.unige.it) DIST Università di Genova Le metodologie di progettazione delle Basi di Dati 2 Una metodologia

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

Informatica per l'impresa. Sistemi per la gestione di basi di Dati

Informatica per l'impresa. Sistemi per la gestione di basi di Dati Informatica per l'impresa Sistemi per la gestione di basi di Dati Prof. Mauro Gaspari gaspari@cs.unibo.it 1 1 Sistema Informativo Insieme degli strumenti, risorse e procedure che consentono la gestione

Dettagli

Database. Appunti di Amaranto Oronzo e Giancane Diego Lezione dell Ing. Lucia Vaira 24/04/2014

Database. Appunti di Amaranto Oronzo e Giancane Diego Lezione dell Ing. Lucia Vaira 24/04/2014 Database Appunti di Amaranto Oronzo e Giancane Diego Lezione dell Ing. Lucia Vaira 24/04/2014 Cos'è un database? È una struttura di dati composta da tabelle a loro volta composte da campi. Caratteristiche

Dettagli

Basi di Dati. Progettazione del Modello ER. K. Donno - Progettazione del Modello ER

Basi di Dati. Progettazione del Modello ER. K. Donno - Progettazione del Modello ER Basi di Dati Progettazione del Modello ER Dai requisiti allo schema ER Entità, relazioni e attributi non sono fatti assoluti dipendono dal contesto applicativo Nella pratica si fa spesso uso di una strategia

Dettagli

PIANO DI LAVORO EFFETTIVAMENTE SVOLTO IN RELAZIONE ALLA PROGRAMMAZIONE DISCIPLINARE

PIANO DI LAVORO EFFETTIVAMENTE SVOLTO IN RELAZIONE ALLA PROGRAMMAZIONE DISCIPLINARE Istituto di Istruzione Secondaria Superiore ETTORE MAJORANA 24068 SERIATE (BG) Via Partigiani 1 -Tel. 035-297612 - Fax 035-301672 e-mail: majorana@ettoremajorana.gov.it - sito internet: www.ettoremajorana.gov.it

Dettagli

DATA WAREHOUSING CON JASPERSOFT BI SUITE

DATA WAREHOUSING CON JASPERSOFT BI SUITE UNIVERSITÁ DEGLI STUDI DI MODENA E REGGIO EMILIA Dipartimento di Ingegneria di Enzo Ferrari Corso di Laurea Magistrale in Ingegneria Informatica (270/04) DATA WAREHOUSING CON JASPERSOFT BI SUITE Relatore

Dettagli

Corso di Informatica Generale 1 IN1. Linguaggio SQL

Corso di Informatica Generale 1 IN1. Linguaggio SQL Università Roma Tre Facoltà di Scienze M.F.N. di Laurea in Matematica di Informatica Generale 1 Linguaggio SQL Marco (liverani@mat.uniroma3.it) Sommario Prima parte: le basi dati relazionali Basi di dati:

Dettagli

Introduzione al Data Warehousing

Introduzione al Data Warehousing Il problema - dati IPERVENDO Via Vai 111 P.I.11223344 Vendite II Trim. (Milioni!) Introduzione al Data Warehousing tecnologia abilitante per il data mining ACQUA MIN 0.40 LATTE INTERO 1.23 SPAZZ.DENTI

Dettagli

Data Warehousing: concetti base e metodologie

Data Warehousing: concetti base e metodologie Data Warehousing: concetti base e metodologie Paolo Atzeni (con la collaborazione di Luca Cabibbo e Riccardo Torlone) Università di Roma Tre Dipartimento di Informatica e Automazione atzeni@dia.uniroma3.it

Dettagli

Microsoft SQL Server Integration Services

Microsoft SQL Server Integration Services Sistemi Informativi Dott.ssa Elisa Turricchia Alma Mater Studiorum - Università di Bologna elisa.turricchia2@unibo.it 1 Microsoft SQL Server Integration Services 1 SQL Server Integration Services SSIS

Dettagli

MODELLO E/R. Modellazione dei dati

MODELLO E/R. Modellazione dei dati MODELLO E/R Maria Mirto Modellazione dei dati Modellare i dati significa: costruire una rappresentazione semplificata della realtà osservata, individuandone gli elementi caratterizzanti e i legami intercorrenti

Dettagli

Lo strumento. di Business Intelligence alla portata di tutti

Lo strumento. di Business Intelligence alla portata di tutti B USINESS I NTELLIGENCE Lo strumento di Business Intelligence alla portata di tutti Modulo INFOREADER INFOREADER è il modulo di INFOBUSINESS che consente di abilitare la postazione di lavoro alla visualizzazione

Dettagli

Trasformazione dei Processi in Progetti DIB 1

Trasformazione dei Processi in Progetti DIB 1 Trasformazione dei Processi in Progetti DIB 1 Generalità DIB 2 Progetto PROGETTO: esecuzione di un insieme di attività in un tempo e con risorse limitati per raggiungere uno specifico scopo. A causa dell

Dettagli

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza:

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza: DOMANDE 1) Definire i concetti di schema e istanza di una base di dati, fornendo anche un esempio. Si definisce schema di una base di dati, quella parte della base di dati stessa che resta sostanzialmente

Dettagli

Al giorno d oggi, i sistemi per la gestione di database

Al giorno d oggi, i sistemi per la gestione di database Introduzione Al giorno d oggi, i sistemi per la gestione di database implementano un linguaggio standard chiamato SQL (Structured Query Language). Fra le altre cose, il linguaggio SQL consente di prelevare,

Dettagli

Architettura del software: dai Casi d Uso al Modello

Architettura del software: dai Casi d Uso al Modello Architettura del software: dai Casi d Uso al Modello Lorenzo Barbieri Sono un Senior Trainer/Consultant in ObjectWay SpA (www.objectway.it), specializzato in architetture Microsoft.NET, Windows, SQL Server,

Dettagli

DATABASE RELAZIONALI

DATABASE RELAZIONALI 1 di 54 UNIVERSITA DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI DISCIPLINE STORICHE ETTORE LEPORE DATABASE RELAZIONALI Dott. Simone Sammartino Istituto per l Ambiente l Marino Costiero I.A.M.C. C.N.R.

Dettagli

CONCETTI DI BASE PER LA QUALITA

CONCETTI DI BASE PER LA QUALITA CONCETTI DI BASE PER LA QUALITA Misura: è una funzione m: A -> B che associa ad ogni attributo A di un osservabile nel mondo reale o empirico (dominio) un oggetto formale B nel mondo matematico (range);

Dettagli

Metodologia di Progettazione database relazionali

Metodologia di Progettazione database relazionali Informatica e Telecomunicazioni S.p.A. Metodologia di Progettazione database relazionali I&T Informatica e Telecomunicazioni S.p.A Via dei Castelli Romani, 9 00040 Pomezia (Roma) Italy Tel. +39-6-911611

Dettagli

ANALISI TRAMITE ALBERO DEI GUASTI (FTA)

ANALISI TRAMITE ALBERO DEI GUASTI (FTA) ANALISI TRAMITE ALBERO DEI GUASTI (FTA) Generalità Oltre alla metodologia FMEA uno dei metodi più diffusi e conosciuti per l'analisi del rischio, E' il Fault Tree Analysis (FTA) o albero dei guasti. Diversamente

Dettagli

Alessandra Raffaetà. Basi di Dati

Alessandra Raffaetà. Basi di Dati Lezione 2 S.I.T. PER LA VALUTAZIONE E GESTIONE DEL TERRITORIO Corso di Laurea Magistrale in Scienze Ambientali Alessandra Raffaetà Dipartimento di Informatica Università Ca Foscari Venezia Basi di Dati

Dettagli

Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni

Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni LA PROGETTAZIONE DI BASI DI DATI Progettare una basi di dati vuole dire progettare la struttura dei dati e le applicazioni La progettazione dei dati è l attività più importante Per progettare i dati al

Dettagli

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati INTRODUZIONE Accesso ai dati tramite DBMS Livelli di astrazione Modello dei dati: schema / istanza / metadati Alcuni modelli dei dati Linguaggi per DBMS Architettura di base di un DBMS cesarini - BDSI

Dettagli

Esercizi di Ricerca Operativa I

Esercizi di Ricerca Operativa I Esercizi di Ricerca Operativa I Dario Bauso, Raffaele Pesenti May 10, 2006 Domande Programmazione lineare intera 1. Gli algoritmi per la programmazione lineare continua possono essere usati per la soluzione

Dettagli

La Memoria Virtuale Ottimizzazione della memoria centrale

La Memoria Virtuale Ottimizzazione della memoria centrale La Memoria Virtuale Ottimizzazione della memoria centrale 1) Introduzione- Gerarchia della memoria Da un punto di vista funzionale, ogni dispositivo di memorizzazione elettronica di informazioni presenta

Dettagli

Basi di dati. Maurizio Lenzerini. Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza. Anno Accademico 2011/2012

Basi di dati. Maurizio Lenzerini. Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza. Anno Accademico 2011/2012 Basi di dati Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza Anno Accademico 2011/2012 http://www.dis.uniroma1.it/~lenzerin/home/?q=node/44 4. La progettazione

Dettagli

MODELLO RELAZIONALE. Introduzione

MODELLO RELAZIONALE. Introduzione MODELLO RELAZIONALE Introduzione E' stato proposto agli inizi degli anni 70 da Codd finalizzato alla realizzazione dell indipendenza dei dati, unisce concetti derivati dalla teoria degli insiemi (relazioni)

Dettagli

Informatica (Basi di Dati)

Informatica (Basi di Dati) Corso di Laurea in Biotecnologie Informatica (Basi di Dati) Introduzione alle Basi di Dati Anno Accademico 2009/2010 Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati

Dettagli

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Roberto Basili, Marco Pennacchiotti Corso di Fondamenti di Informatica a.a. 2003-2004 Definizioni Generali e Regole d esame Il

Dettagli

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione SISTEMI INFORMATIVI AVANZATI -2010/2011 1 Introduzione In queste dispense, dopo aver riportato una sintesi del concetto di Dipendenza Funzionale e di Normalizzazione estratti dal libro Progetto di Basi

Dettagli

Metodi formali per la verifica dell affidabilità di sistemi software (e hardware) (Peled, Software Reliability Methods, cap. 1) Importanza della

Metodi formali per la verifica dell affidabilità di sistemi software (e hardware) (Peled, Software Reliability Methods, cap. 1) Importanza della Metodi formali per la verifica dell affidabilità di sistemi software (e hardware) (Peled, Software Reliability Methods, cap. 1) Importanza della verifica di sistemi (safety-critical, commercially critical,

Dettagli

DATABASE. Progettare una base di dati. Database fisico e database logico

DATABASE. Progettare una base di dati. Database fisico e database logico DATABASE Progettare una base di dati Database fisico e database logico Un DB è una collezione di tabelle, le cui proprietà sono specificate dai metadati Attraverso le operazioni sulle tabelle è possibile

Dettagli