Capitolo 4. Studio dei problemi di progetto. 4.1 Data Quality

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Capitolo 4. Studio dei problemi di progetto. 4.1 Data Quality"

Transcript

1 Capitolo 4 Studio dei problemi di progetto Dal primo approccio con il progetto, è risultato chiaro che una semplice analisi della teoria sulla progettazione concettuale non sarebbe stata sufficiente ad inquadrare interamente il problema. Gli strumenti da noi sviluppati, basati principalmente sull analisi dei dati, affondavano le loro radici nel Data Quality. Nella prima parte di questo capitolo affronteremo appunto questo argomento, con particolare attenzione ai suoi legami con l informatica ed agli elementi fondamentali per l analisi qualitativa di una sorgente dati. Fonte principale di questi paragrafi è stato lo scritto Data Quality: a statistical perspective di Alan F. Karr, Ashish P. Sanil, David L. Banks. Dovendo sviluppare una metodologia d aiuto alla progettazione concettuale di datawarehouse, si è ottenuto un grande appoggio dalla lettura di un importante articolo Automating Data Warehouse Conceptual Schema Design and Evaluation, nel quale gli autori Cassandra Phipps ed Karen C. Davis presentano uno dei primi piani per la creazione di uno strumento dagli scopi similari. Le soluzioni adottate in questo elaborato sono sicuramente uno dei maggiori aiuti nell elaborazione e confronto delle politiche implementate nello strumento da noi proposto. 4.1 Data Quality Il Data Quality, applicato alla progettazione concettuale di sistemi Data Warehouse, studia la capacità del dato di essere utilizzato con efficienza, economicità e rapidità per informare e prendere decisioni. Necessariamente, il Data Quality deve assicurare l accuratezza del contenuto,l accessibilità, la rilevanza, la velocità d utilizzo, la correttezza ed esaustività della documentazione, l adattamento alle conoscenze e aspettative dell utente, e l adattamento ai costi ed alle specifiche di contesto del dominio di conoscenza. Data Quality è un argomento di studio che affonda le sue radici nella misura degli errori e nel controllo dell incertezza. La situazione attuale, che vede un massiccio ricorso all informatica, per la rilevazione e mantenimento di insiemi di dati da utilizzare per adottare politiche decisionali complesse, fa sì che problemi di Data Quality possano creare significanti inefficienze dai risvolti economici importanti Informatica e Data Quality Il processo di DataWarehouse solitamente richiede l assemblaggio di dati proveniente da una varietà di risorse e l analisi a supporto decisionale. Questa necessità di integrazione fra sorgenti diverse, ognuna con i suoi standard e la sua politica, porta ad un degrado dell informazione. Per questo comportamento il processo di DataWarehouse attende dal Data Quality nuovo impegno nell identificazione degli elementi dell informazione non validi, in quanto violanti vincoli fisici, logici o di dominio. 23

2 4.1.2 Elementi di analisi di Data Quality Il Data Quality in realtà non si ferma alla sola analisi dei dati, ma si divide in tre branche: - Qualità dei processi: analisi della qualità relativa alle operazioni di generazione, assemblaggio, descrizione e mantenimento dei dati. Gli strumenti fondamentali di questo campo analizzano Affidabilità, Metadata, Sicurezza, e Riservatezza. Essi si basano solo su una valutazione qualitativa e sono altamente legati al contesto, perciò risultano essere soggettivi e non adatti ad uno strumento che si propone di essere di uso generale. - Qualità dei dati: questa fase del Data Quality è ovviamente strettamente legata ai dati (ed è appunto la parte a cui noi ci rifacciamo nello sviluppo dello strumento più avanti presentato). Nell analisi dei record, delle tabelle e degli attributi, si fa particolare ricorso alla rilevazione delle seguenti proprietà: Accuratezza, Completezza, Consistenza e Validità. Nell analisi qualitativa dei database gli strumenti preferiti analizzano Identificabilità e Joinability. Basandosi sull analisi dei dati,effettuano valutazioni di tipo quantitativo, e perciò sono facilmente verificabili ed implementabili. - Qualità del trattamento: Analisi sul metodo di trattamento dell informazione da parte dell utenza e fruibilità del dato. Strumenti utilizzati in questa fase guardano ad: Accessibilità, Integrabilità, Interpretabilità, Retificabilità, Rilevanza, Timeliness. Anche questi sono valutabili solo qualitativamente, e perciò altamente soggettivi e legati al contesto, dunque non adatti ad uno strumento di utilizzo generale, come vuole essere il progetto che abbiamo sviluppato. Benché nella nostra trattazione sia stata utilizzata solamente l analisi della Qualità dei dati (in quanto unico settore slegato dal contesto), qui di seguito proponiamo una descrizione dettagliata tutte le branche in cui si può suddividere il Data Quality, in quanto si vuole mantenere ancora nel lettore una visione larga del problema di analisi della qualità. I problemi e le politiche adottate nello sviluppo del progetto verranno affrontate nello specifico nei capitoli successivi Qualità dei processi Tale segmento di ricerca è basato sullo studio dei metodi Best practice o Stato dell arte. I loro risultati derivano da analisi qualitative e soggettive, usualmente notevolmente influenzate dal dominio in analisi. Per valutazione della Affidabilità di un processo si intende la valutazione della correttezza ed efficienza dei metodi adottati, comparati con le politiche di esecuzione considerate stato dell arte. Ci sono tre principali suddivisioni corrispondenti a generazione, editing ed analisi. Esaminare l Affidabilità a livello di generazione dati significa eseguire controlli in modo da massimizzare il Data Quality durante la raccolta e controllo dati, misurando quanto la conduzione di interviste impatta sulla qualità ed attendibilità finale del dato. Gli argomenti principali trattati in questa fase sono: - progettazione strumenti di controllo qualitativo dei processi - selezione del metodo di raccolta dati - strategie per la minimizzazione delle non risposte - strategie per la riduzione dei tempi di processo dei dati Analizzare l Affidabilità a livello di editing del dato prevede una ampia varietà di metodi per evitare la perdita di dati sugli attributi, con lo scopo di identificare e se possibile correggere inconsistenze tra dati, o tra dati e loro domini. Studiare l Affidabilità a livello di analisi dei dati comprende la rilevare l incertezza nelle valutazioni statistiche, per identificare le non risposte e la ripartizione dei dati rilevati sul dominio di competenza, allo scopo di ottimizzare l analisi. 24

3 Con il controllo dei Metadata (dove per metadata si considera l insieme di informazioni utili a definire il dominio e la struttura di un database) ci si preoccupa di assicurare che il contenuto, la collezione dei processi, la proprietà e l affidabilità dei dati siano documentati chiaramente, senza ambiguità ed in una forma che sia accessibile dall utenza. La qualità ed accuratezza della documentazione sui dati ha un impatto critico sul Data Quality, influenzato in particolar modo dalla utilizzabilità del dato stesso. Inoltre il mantenimento di metadati precisi e ben strutturati risulta essenziale nel momento in cui si deve integrare i dati provenienti da varie sorgenti. All interno di un organizzazione avere un gruppo assegnato a rivedere i metadata può rivelarsi in molti casi una strategia efficace ed non costosa. Tale gruppo può inoltre formulare linee guida e liste di controllo da seguire nel momento dell archiviazione dei dati. I principi di progettazione ed analisi dei Sistemi Informativi prevedono l uso di Dizionari dei dati come strumento di raccolta dei metadati. Un più sofisticato approccio è legato alla definizione di precisi standard per la documentazione dei dati, e quindi della creazione di software per la verifica, il parsing,il processo e la generazione di metadati. Strumenti di analisi della Sicurezza di un sistema si occupano di analizzare la sicurezza ottenuta attraverso l adozione di hardware e software specifico, per la prevenzione da accessi ed usi di servizi non autorizzati. Infine abbiamo strumenti di analisi della Riservatezza che misurano il grado di robustezza di un sistema informativo dall accesso non autorizzato a dati confidenziali. Qualità dei dati Come visto in precedenza la qualità dei dati viene analizzata in due livelli: il livello dei Record/Tabelle ed il livello dei Database. Nel livello Record troviamo delle misure che sono prettamente di tipo binario (Ad esempio il valore di un attributo può essere o corretto o scorretto ) e riassunte nel livello Tabelle da metriche Data Quality come ad esempio la frazione di record corretti. Una prima proprietà da osservare in questo settore è l Accuratezza, la quale misura appunto la correttezza di un dato. In alcuni casi proprio per il dominio dell informazione in esame il rilevamento di questo fattore è estremamente semplice (Es: la correttezza dell età di una persona è una misurazione oggettiva) mentre in altri (aperti a considerazioni soggettive) giudicare la correttezza di un dato è molto più arduo. Fondamentale in questo frangente è dunque la determinazione del livello di correttezza, soprattutto nei casi in cui la sua rilevazione sia molto difficile. Nell effettuare tali misurazioni però ci si deve scontrare oltre che con le limitazioni tecnologiche per il rilevamento, anche con la convenienza economica dello stesso. Difatti esistono molti casi in cui il rilevamento è possibile ma non economicamente vantaggioso. Altra proprietà binaria è Completezza, la quale indica se un record è stato compilato o meno. In questo caso possono nascere problemi confondendosi tra valori mancanti e legittimi, e proprio alla luce di ciò proponiamo due metriche che si occupano di questo settore che sono: - percentuale di attributi senza valori mancanti (i valori che indicano che manca una vera rilevazione non vengono considerati validi) - percentuale di attributi contenenti valori (conta anche i valori che indicano un valore mancante come validi) 25

4 Ulteriore proprietà dal dominio booleano è Consistenza, la quale rileva se le relazioni intra-record, definite in una base di dati sono rispettate. Una volta definita una regola di consistenza, la rilevazione dello stato (consistente od inconsistente) è pressoché istantanea e può facilmente essere utilizzata per rilevare metriche come la frazione di record consistenti. Altra misura, questa volta piuttosto debole, è Validità. Tale dato indica non la correttezza del dato rilevato, ma semplicemente la sua plausibilità, cioè l appartenenza al dominio dell attributo in esame. Ovviamente anche in questo caso ci sono complicazioni derivanti dal ricorso a diversi tipi di risorse, ognuna delle quali avrà delle regole diverse di rappresentazione dei dati. Analizziamo ora le metriche che si trovano a livello Database. Tali misure servono principalmente per comprendere se l insieme di tabelle che attualmente cerchiamo di combinare permettano tale operazione. Solitamente questi indici vengono utilizzati nella costruzione di Database, in quanto ne analizzano le principali peculiarità, mentre perdono di interesse nel Data Warehousing, dato che le sorgenti di tali elementi del sistema informativo sono già state testate. La prima proprietà è Identificabilità, e si basa sulla presenza in una tabella di un identificatore univoco (il quale può essere sia un unico attributo che combinazione di diversi attributi), chiamato chiave primaria. Ovviamente anche questa misura è di tipo binario (una tabella può avere o non avere la chiave primaria), ed è di immediata rilevazione. Ultima proprietà di questo insieme è Joinability, che indica la possibilità di due tabelle di fondersi insieme e creare una nuova tabella. Requisito fondamentale è che la chiave primaria di una tabella sia presente come semplice attributo nell altra (della quale sarà considerato chiave esterna). Qualità del trattamento Tutte le metriche sopra citate si occupano o delle sequenze di esecuzione di alcune operazioni o del trattamento del dato. Nessuna ha tenuto conto però dell elemento umano, sebbene la maggior parte degli strumenti elettronici siano human-centric, e quindi sia necessaria un analisi sulla utilizzabilità dello strumento stesso. Proprio per tale necessità sono stati studiati degli indicatori che misurano tali gradi di soddisfazione dell utente. Una prima proprietà è l Accessibilità, vale a dire la facilità di utilizzo del sistema. Tale indicatore deve analizzare se il traffico normale del sistema è supportato correttamente, assicurare sulla modernità dei formati dei file utilizzati, sull efficienza dei sistemi legacy che vengono eseguiti su vecchie piattaforme, e testare l efficacia delle interfacce dei moderni software. Altra caratteristica fondamentale è l Integrabilità, che mostra il livello di integrazione tra diversi Database. In questo settore le problematiche vanno dalla necessità di unire Database con diverse definizioni di dominio per Attributi simili, alla impossibilità di eseguire dei join tra tabelle a causa dell utilizzo di chiavi diverse. Attualmente gli strumenti di integrazione dei Database sono in avanzato sviluppo, ciò che impedisce veramente le corrette fusioni sono gli errori commessi nella fase della progettazione concettuale dei Database. 26

5 Altro strumento rilevante è quello che si occupa dell Interpretabilità. Esso deve guardare a due aspetti fondamentali: - la consistenza del dato. Un certo tipo di dato può essere riportato nel Database in molti modi (ad esempio per un mutamento delle politiche di immagazzinamento dati nel tempo), oppure Database diversi che cooperano tra loro possono utilizzare definizioni diverse per lo stesso attributo. Questi comportamenti influenzano notevolmente la fruibilità del dato e la correttezza dei risultati. - L abilità nell estrazione dell informazione dai dati, che viene trattata dagli statistici come inferenza. Proprietà importante e degna di rilevamento è inoltre Retificabilità, che indica quanto è facile per l utente finale (sia esso il gestore dei Sistema Informativo, oppure un semplice soggetto tracciato dal Database), richiedere una modifica nei dati immessi nel sistema. Grande peso è dato dalle aziende a questo processo, e precise linee guida vengono redatte per informare l utenza sulle modalità di modifica dati. Importante elemento di analisi è la Rilevanza, che indica se un dato presente nel Database è di interesse per l utente. Due sono i problemi che devono essere rilevati: - le omissioni di dati nei risultati, che possono essere trovate solo dall utente finale - la presenza nel database di dati irrilevanti per l uso degli utenti, che devono essere valutate dall amministratore di database confrontando le tipologie di informazione mantenute nel database con quelle utili alle varie categorie di utenti. Ultimo dato da presentare per questo settore d analisi è Timeliness, che indica la corretta datazione nel rilevamento di informazioni. La corretta datazione è un elemento fondamentale nei database: difatti un analisi eseguita con una datazione inadeguata può portare a false certezze, compotrando un accuratezza peggiore di quella derivante da un analisi slegata dal tempo. 27

6 4.2 Un caso di studio Cassandra Phipps e Karen C. Davis hanno proposto un procedimento per la creazione automatica di uno schema concettuale per Data Warehouse, a partire da uno schema concettuale di una base di dati operazionale. Tale strumento, nella prima parte precede automaticamente alla creazione di diversi schemi concettuali, rappresentati col modello ME/R (Multidimensional Entity/Relationship). Nella seconda parte il modello è rifinito grazie ad input aggiuntivi, seguendo un approccio basato sui requisiti, e ponendo domande all utente atte alla selezione dei migliori schemi candidati alla realizzazione degli obiettivi. Viene inoltre presentata una linea guida con le principali operazioni di rifinitura da svolgere per aggiungere nel modello concettuale le funzionalità richieste dall utente Presentazione del modello ME/R utilizzato nella rappresentazione dello schema concettuale L obbiettivo nella creazione di uno schema concettuale è trasferire i requisiti utente in una rappresentazione astratta e comprensibile dall utente, indipendente dall implementazione finale, ma comunque formale e completa, tale da poter essere trasformata nel successivo schema logico senza ambiguità. Cassandra Phipps e Karen Davis propongono il modello ME/R per la creazione degli schemi concettuali, scelto soprattutto per l efficacia e la chiarezza espositiva. I costrutto centrale del ME/R è il fact node, rappresentato da un rombo, che contiene le misure di business. Un level node, rappresentato da un rettangolo, contenente informazioni sulle misure. Ogni livello o fact node ha degli attributi, rappresentati come elissi, che sono descrittori per questa entità. Questi sono i tre construtti principali che compongono l ME/R model, e sono connessi da diverse relazioni. Un fact node è legato a un livello da un arco dimensionale visualizzata come una retta senza verso. La relazione has connette fatti o livelli ai relativi attributi, sempre attraverso una retta non direzionata. La classificazione degli archi indica le relazioni tra i livelli. Questa è rappresentata dal simbolo di una forchetta posta alla fine di una retta con verso. Tutti i livelli del fact node, legati da archi di classificazione, rappresentano una dimensione del modello. Gli archi diretti tra livello sono importanti in quanto indicano aggregazioni gerarchiche. Questo è particolarmente importante quando un nodo di livello può essere un nodo di classificazione per più di un livello. Con soli tre costrutti, il modello ME/R è semplice per la lettura degli utenti finali, e l aggregazione è mostrata attraverso la gerarchia di livelli rappresentante le dimensioni Problemi dell approccio automatizzato alla progettazione concettuale L iniziale determinazione di misure, fatti, o eventi è la parte più difficile ed è solitamente eseguita manualmente. Diversi approcci nel trovare misure sono stati suggeriti: 1. derivare la tabella dei fatti da uno schema a stella selezionando le relazioni molti a molti nel modello ER contenente fatti numerici ed additivi non chiave 2. trovare le misure candidate analizzando le queries di business alla ricerca dei tipi di dato che indicanti le performance di business 28

7 3. trovare i fatti basati sulle entità che sono più frequentemente aggiornate 4. osservare che le proprietà dei fatti sono usualmente dati numerici, e quindi sono di facile aggregazione Prima della proposta del processo di progettazione di Cassandra Phipps e Karen C. Davis, erano stati proposti diversi approcci semiautomatici o automatici per la creazione di schemi da sistemi OLTP, nessuno dei quali includeva un meccanismo automatico di rilevamento delle misure, pertanto lo studio da loro affrontato è stato il primo tentativo di automazione della creazione di uno schema concettuale a partire da un OLTP schema, incluse l iniziale determinazione di fatti e misure Creazione dello schema concettuale Questo approccio alla generazione di schemi ha due premesse fondamentali. La prima è che attributi numerici rappresentano misure di potenziale interesse di business e maggiore è il numero di questi attributi in un entità e maggiore è la probabilità che tale entità sia un evento od un fatto. La seconda premessa è che la cardinalità di una relazione determina quanto sia importate una entità nella creazione di uno schema. Ogni entità dotata di una relazione a molti è di grande importanza (ed ognuna delle sue entità può essere parimenti importante), dato che potenzialmente è dotata di un alto livello di astrazione. L algoritmo qui presentato per la creazione di schemi concettuali consta di cinque passi il cui schema risultante è centrato sugli eventi di business, con relazioni ad altre entità dalle quali rilevare le dimensioni descriventi tali eventi. Benché ci siano istanze dove gli eventi scelti hanno poco o nessun significato per l utente, e le analisi più comuni devono essere aggiunte dal progettista, comunque la creazione dello schema iniziale è automatizzata. Gli schemi così ottenuti devono essere rifiniti manualmente come descritto nel paragrafo successivo. L input dell algoritmo è uno schema ER rappresentante la struttura dati sorgente, mentre l output è un set di schemi ME/R rappresentante i fact nodes, i relativi sottolivelli ed attributi. I passi dell algoritmo sono riassunti come segue: 1. trovare le entità con attributi numerici e creare un fact node per ogni entità identificata. In questo frangente si ordina le entità con i campi numerici in ordine discendente. Processando le entità in questo modo i migliori candidati sono creati prima e vengono inseriti in un rombo. 2. creare attributi numerici per ogni fact node basato sugli attributi numerici delle entità, che vengono posti all interno di elissi collegate alle relative entità 3. creare livelli del tempo per ogni tipo di livello temporale (data od ora) usato per ciascun fact node. Innanzitutto si individuano tutte le informazioni riguardanti le datazioni o gli orari; esse diverranno dimensioni nel ME/R schema. A questo punto nel processo automatizzato non siamo a conoscenza della granularità di questi attributi, perciò sarà necessario l intervento umano per determinare la rappresentazione migliore di tali dimensioni, e saranno rappresentate nel grafico non come rettangoli, bensì come esagoni, appunto per questa loro necessità di essere rielaborate. 4. creare un livello (dimensione) contenente i rimanenti attributi delle entità (non numerici, non chiave). Questi attributi mantengono un informazione generalmente di tipo stringa, che porta alla creazione di livelli rappresentati come rettangoli. 5. ricorsivamente esaminare le relazioni di un entità per aggiungere livelli in un sistema di gerarchie (creazione della dimensione). In questa fase ciascun fact node è valutato. Ogni entità connessa è posta in un level node con i suoi attributi. Se questa level entity è il verso a molti della relazione, le sue relazioni sono pure valutate e processate chiamando ancora 29

8 la subprocedura. Se incontriamo una relazione che non è molti a molti od uno a molti, non l aggiungiamo nello schema. L algoritmo si ferma nel momento in cui nessun event entity ha relazioni a molti ancora da analizzare. In questo frangente nasce la necessità di introdurre un nuovo simbolo: la nuvoletta, che denoterà che un livello, seppure necessario per il data warehouse non è stato automaticamente rilevato, e perciò per la sua introduzione sarà necessario l intervento dell uomo. In generale, gli schemi concettuali così generati non sono completamente fruibili dall utente, e necessitano di un affinamento da parte del progettista Selezione di schemi candidati e rifinitura In questa sezione vengono utilizzate delle queries per valutare quali tra gli schemi candidati ottenuti nel punto precedente siano quelli che meglio si adattano alle necessità dell utente. Ci sono due aspetti di una query che sono usati per determinare se uno schema candidato può darle risposta:le tabelle menzionate nella FROM e gli attributi nominati nella SELECT. Infatti affinché l esecuzione di una query abbia buon fine deve essere possibile ritrovare il dato desiderato, e per fare questo deve essere reperibile sia la tabella che l attributo di cui il dato che stiamo cercando è istanza. Per comparare gli schemi candidati è necessario creare una tabella nella quale per ogni riga viene posto il risultato di una certa query, mentre ad ogni colonna corrisponde uno schema nel quale tale richiesta viene eseguita. Il dato immagazzinato in tale tabella indicherà se una certa query eseguita su un certo schema è stata eseguita correttamente, ha ottenuto una risposta solo parziale, o addirittura non ha ricevuto risposta. Al termine dell esecuzione delle query nei vari domini rappresentati negli schemi, è possibile processare automaticamente i risultati ottenuti attraverso un algoritmo di copertura del grafo, oppure attraverso una valutazione manuale, in modo da determinare quali schemi candidati mantenere e quali eliminare. L algoritmo utilizzato in questo frangente ha i seguenti scopi: - rispondere al maggior numero di domande possibili - rispondere a ciascuna domanda con la massima esattezza possibile - ottenere un insieme di schemi che sia il più piccolo possibile Da questa prima analisi otteniamo un insieme di schemi, alcuni dei quali utili perché sono gli unici a rispondere ad una determinata query. E necessario dunque l intervento umano per comprendere se è possibile eliminare tali schemi, modificando gli altri candidati che rispondono ad un alto numero di query, e strutturarli in modo da permettere la soluzione anche dell unica query per cui viene accettato lo schema in esame. In generale, durante il raffinamento manuale dello schema si deve tenere conto dei seguenti passi: 1. Eliminare i schemi candidati non necessari 2. Controllare la validità delle misure rilevate per un fact node 3. Determinare il giusto livello di granularità dell informazione, in particolar modo per quanto riguarda le date (la dimensione temporale) 4. Controllare che non sia stata omessa la rilevazione di particolari attributi necessari 5. Analizzare la possibilità di combinazione delle informazioni contenute negli schemi 6. Eliminare gli attributi non necessari all utente 7. Controllare che la mancanza di dati necessari all utente non derivi da una mancanza del database di partenza 30

Database. Organizzazione di archivi mediante basi di dati. ing. Alfredo Cozzi 1

Database. Organizzazione di archivi mediante basi di dati. ing. Alfredo Cozzi 1 Database Organizzazione di archivi mediante basi di dati ing. Alfredo Cozzi 1 Il database è una collezione di dati logicamente correlati e condivisi, che ha lo scopo di soddisfare i fabbisogni informativi

Dettagli

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Data warehousing Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Data warehousing Introduzione A partire dalla metà degli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa

Dettagli

PROGETTAZIONE CONCETTUALE

PROGETTAZIONE CONCETTUALE Fasi della progettazione di basi di dati PROGETTAZIONE CONCETTUALE Parte V Progettazione concettuale Input: specifiche utente Output: schema concettuale (astrazione della realtà) PROGETTAZIONE LOGICA Input:

Dettagli

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011

Data warehousing Mario Guarracino Data Mining a.a. 2010/2011 Data warehousing Introduzione A partire dagli anni novanta è risultato chiaro che i database per i DSS e le analisi di business intelligence vanno separati da quelli operazionali. In questa lezione vedremo

Dettagli

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni

Data warehouse. Architettura complessiva con OLTP e OLAP OLTP. Sistemi di supporto alle decisioni Data warehouse Data warehouse La crescita dell importanza dell analisi dei dati ha portato ad una separazione architetturale dell ambiente transazionale (OLTP on-line transaction processing) da quello

Dettagli

13. Datawarehouse (parte 2) Analisi e riconciliazione delle fonti dati progettista amministratori dei database modello a tre livelli

13. Datawarehouse (parte 2) Analisi e riconciliazione delle fonti dati progettista amministratori dei database modello a tre livelli 13. Datawarehouse (parte 2) Analisi e riconciliazione delle fonti dati Questa fase richiede di definire e documentare lo schema del livello dei dati operazionali, a partire dal quale verrà alimentato il

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

Ingegneria dei Requisiti

Ingegneria dei Requisiti Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Ingegneria dei Requisiti E. TINELLI Contenuti I requisiti del software Documento dei requisiti I processi

Dettagli

Pianificazione del data warehouse

Pianificazione del data warehouse Pianificazione del data warehouse Dalla pianificazione emergono due principali aree d interesse: area commerciale focalizzata sulle agenzie di vendita e area marketing concentrata sulle vendite dei prodotti.

Dettagli

Data warehousing con SQL Server

Data warehousing con SQL Server Data warehousing con SQL Server SQL Server è un RDBMS (Relational DataBase Management System) Analysis Services è un componente di SQL Server che offre un insieme di funzionalità di supporto al data warehousing

Dettagli

Ingegneria del Software Progettazione

Ingegneria del Software Progettazione Ingegneria del Software Progettazione Obiettivi. Approfondire la fase di progettazione dettagliata che precede la fase di realizzazione e codifica. Definire il concetto di qualità del software. Presentare

Dettagli

1.1 I componenti di un DBMS... 5

1.1 I componenti di un DBMS... 5 Indice 1 Introduzione ai DBMS.......................................................... 1 1.1 Scopi di un DBMS............................................................ 1 1.2 Modelli dei dati..............................................................

Dettagli

Data warehousing con SQL Server

Data warehousing con SQL Server Data warehousing con SQL Server! SQL Server è un RDBMS (Relational DataBase Management System)! Analysis Services è un componente di SQL Server che offre un insieme di funzionalità di supporto al data

Dettagli

Istituto Angioy Informatica BASI DI DATI. Prof. Ciaschetti

Istituto Angioy Informatica BASI DI DATI. Prof. Ciaschetti Istituto Angioy Informatica BASI DI DATI Prof. Ciaschetti Introduzione e prime definizioni Una Base di dati o Database è un archivio elettronico opportunamente organizzato per reperire in modo efficiente

Dettagli

Data warehouse Introduzione

Data warehouse Introduzione Database and data mining group, Data warehouse Introduzione INTRODUZIONE - 1 Pag. 1 Database and data mining group, Supporto alle decisioni aziendali La maggior parte delle aziende dispone di enormi basi

Dettagli

Modellazione di sistema

Modellazione di sistema Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Modellazione di sistema E. TINELLI Contenuti Approcci di analisi Linguaggi di specifica Modelli di

Dettagli

Considera tutti i requisiti funzionali (use cases) NON deve necessariamente modellare i requisiti non funzionali

Considera tutti i requisiti funzionali (use cases) NON deve necessariamente modellare i requisiti non funzionali Corso di Laurea Specialistica in Ingegneria Informatica Corso di Ingegneria del Software A. A. 2008 - Progettazione OO E. TINELLI Punto di Partenza Il modello di analisi E una rappresentazione minima del

Dettagli

Basi di Dati Complementi Esercitazione su Data Warehouse

Basi di Dati Complementi Esercitazione su Data Warehouse Sommario Basi di Dati Complementi Esercitazione su Data Warehouse 1. Riassunto concetti principali dalle slide della lezione di teoria 2.Studio di caso : progettazione di un Data Warehouse di una catena

Dettagli

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati

Basi di Dati. Introduzione ai sistemi di basi di dati. K.Donno - Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File system verso DBSM Vantaggi di un DBMS Modelli dei dati Utenti

Dettagli

Data Warehousing e Data Mining

Data Warehousing e Data Mining Università degli Studi di Firenze Dipartimento di Sistemi e Informatica A.A. 2011-2012 I primi passi Data Warehousing e Data Mining Parte 2 Docente: Alessandro Gori a.gori@unifi.it OLTP vs. OLAP OLTP vs.

Dettagli

Cosa è un data warehouse?

Cosa è un data warehouse? Argomenti della lezione Data Warehousing Parte I Introduzione al warehousing cosa è un data warehouse classificazione dei processi aziendali sistemi di supporto alle decisioni elaborazione OLTP e OLAP

Dettagli

Introduzione ai sistemi di basi di dati

Introduzione ai sistemi di basi di dati Basi di Dati Introduzione ai sistemi di basi di dati Alessandro.bardine@gmail.com alessandro.bardine@iet.unipi.it Introduzione ai sistemi di basi di dati Gestione dei Dati Una prospettiva storica File

Dettagli

Basi di dati. Le funzionalità del sistema non vanno però ignorate

Basi di dati. Le funzionalità del sistema non vanno però ignorate Basi di dati La progettazione di una base di dati richiede di focalizzare lo sforzo su analisi, progettazione e implementazione della struttura con cui sono organizzati i dati (modelli di dati) Le funzionalità

Dettagli

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Roccatello Ing. Eduard L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Agenda Presentazione docente Definizione calendario Questionario pre corso

Dettagli

Descrizione... 3 Comprensione del Processo Produttivo... 3. Definizione del Problema... 4. Selezione delle Caratteristiche... 5. Box Plot...

Descrizione... 3 Comprensione del Processo Produttivo... 3. Definizione del Problema... 4. Selezione delle Caratteristiche... 5. Box Plot... Pagina 2 Descrizione... 3 Comprensione del Processo Produttivo... 3 Definizione del Problema... 4 Selezione delle Caratteristiche... 5 Box Plot... 6 Scatterplot... 6 Box Plot... 7 Scatterplot... 7 Alberi

Dettagli

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it

Data Mining. Gabriella Trucco gabriella.trucco@unimi.it Data Mining Gabriella Trucco gabriella.trucco@unimi.it Perché fare data mining La quantità dei dati memorizzata su supporti informatici è in continuo aumento Pagine Web, sistemi di e-commerce Dati relativi

Dettagli

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi

Sistemi Informativi La Modellazione Dimensionale dei Fatti. Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi Sistemi Informativi La Modellazione Dimensionale dei Fatti Obiettivi Concetti Base Operazioni OLAP DFM Casi Modellazione Logica Esercizi Obiettivi Nelle lezioni precedenti abbiamo modellato i processi

Dettagli

Le Basi di dati: generalità. Unità di Apprendimento A1 1

Le Basi di dati: generalità. Unità di Apprendimento A1 1 Le Basi di dati: generalità Unità di Apprendimento A1 1 1 Cosa è una base di dati In ogni modello di organizzazione della vita dell uomo vengono trattate informazioni Una volta individuate e raccolte devono

Dettagli

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0

PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0 PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO 147 6/001.0 PIANIFICAZIONE E REALIZZAZIONE DI UN SISTEMA INFORMATIVO ELEMENTI FONDAMENTALI PER LO SVILUPPO DI SISTEMI INFORMATIVI ELABORAZIONE DI

Dettagli

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS)

Introduzione. La misurazione dei sistemi di Data Warehouse. Definizioni & Modelli. Sommario. Data Warehousing. Introduzione. Luca Santillo (CFPS) Introduzione La misurazione dei sistemi di Data Warehouse Luca Santillo (CFPS) AIPA, 17/5/01 In pratica I concetti generali, le definizioni e le regole di conteggio possono essere difficili da applicare

Dettagli

Data Warehouse Architettura e Progettazione

Data Warehouse Architettura e Progettazione Introduzione Data Warehouse Architettura! Nei seguenti lucidi verrà fornita una panoramica del mondo dei Data Warehouse.! Verranno riportate diverse definizioni per identificare i molteplici aspetti che

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

Sistemi Informativi Aziendali II

Sistemi Informativi Aziendali II Modulo 2 Sistemi Informativi Aziendali II 1 Corso Sistemi Informativi Aziendali II - Modulo 2 Modulo 2 La gestione delle informazioni strutturate nell impresa: La progettazione di un Data Base; Le informazioni

Dettagli

Introduzione ad OLAP (On-Line Analytical Processing)

Introduzione ad OLAP (On-Line Analytical Processing) Introduzione ad OLAP (On-Line Analytical Processing) Metodi e Modelli per il Supporto alle Decisioni 2002 Dipartimento di Informatica Sistemistica e Telematica (Dist) Il termine OLAP e l acronimo di On-Line

Dettagli

Design di un database

Design di un database Design di un database Progettare un database implica definire quanto i seguenti aspetti: Struttura Caratteristiche Contenuti Il ciclo di design di un database si suddivide in tre fasi principali: progettazione

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

Progettazione base dati relazionale

Progettazione base dati relazionale Progettazione base dati relazionale Prof. Luca Bolognini E-Mail:luca.bolognini@aliceposta.it Progettare una base di dati Lo scopo della progettazione è quello di definire lo schema della base di dati e

Dettagli

Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali

Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali Università degli Studi di Salerno Facoltà di Scienze Matematiche Fisiche e Naturali Base Di Dati II Anno accademico 2011/2012 Progettazione di un Data mart per l'analisi dei servizi bibliotecari universitari

Dettagli

Introduzione al Data Warehousing

Introduzione al Data Warehousing Il problema - dati IPERVENDO Via Vai 111 P.I.11223344 Vendite II Trim. (Milioni!) Introduzione al Data Warehousing tecnologia abilitante per il data mining ACQUA MIN 0.40 LATTE INTERO 1.23 SPAZZ.DENTI

Dettagli

1. BASI DI DATI: GENERALITÀ

1. BASI DI DATI: GENERALITÀ 1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente

Dettagli

DATA WAREHOUSING CON JASPERSOFT BI SUITE

DATA WAREHOUSING CON JASPERSOFT BI SUITE UNIVERSITÁ DEGLI STUDI DI MODENA E REGGIO EMILIA Dipartimento di Ingegneria di Enzo Ferrari Corso di Laurea Magistrale in Ingegneria Informatica (270/04) DATA WAREHOUSING CON JASPERSOFT BI SUITE Relatore

Dettagli

Introduzione al data base

Introduzione al data base Introduzione al data base L Informatica è quella disciplina che si occupa del trattamento automatico dei dati con l ausilio del computer. Trattare i dati significa: raccoglierli, elaborarli e conservarli

Dettagli

Lorenzo Braidi. Database design. Libro_datadesign.indb 1 23-11-2004 10:06:17

Lorenzo Braidi. Database design. Libro_datadesign.indb 1 23-11-2004 10:06:17 Lorenzo Braidi Database design Libro_datadesign.indb 1 23-11-2004 10:06:17 Sommario Introduzione...XI Capitolo 1 Le basi di dati relazionali... 1 Le basi di dati... 1 Un po di storia... 2 I database gerarchici...

Dettagli

PIANO DI LAVORO EFFETTIVAMENTE SVOLTO IN RELAZIONE ALLA PROGRAMMAZIONE DISCIPLINARE

PIANO DI LAVORO EFFETTIVAMENTE SVOLTO IN RELAZIONE ALLA PROGRAMMAZIONE DISCIPLINARE Istituto di Istruzione Secondaria Superiore ETTORE MAJORANA 24068 SERIATE (BG) Via Partigiani 1 -Tel. 035-297612 - Fax 035-301672 e-mail: majorana@ettoremajorana.gov.it - sito internet: www.ettoremajorana.gov.it

Dettagli

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L. DATA WAREHOUSE Un Dataware House può essere definito come una base di dati di database. In molte aziende ad esempio ci potrebbero essere molti DB, per effettuare ricerche di diverso tipo, in funzione del

Dettagli

Organizzazione degli archivi

Organizzazione degli archivi COSA E UN DATA-BASE (DB)? è l insieme di dati relativo ad un sistema informativo COSA CARATTERIZZA UN DB? la struttura dei dati le relazioni fra i dati I REQUISITI DI UN DB SONO: la ridondanza minima i

Dettagli

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi Indice generale OOA Analisi Orientata agli Oggetti Introduzione Analisi Metodi d' analisi Analisi funzionale Analisi del flusso dei dati Analisi delle informazioni Analisi Orientata agli Oggetti (OOA)

Dettagli

Lo strumento. di Business Intelligence alla portata di tutti

Lo strumento. di Business Intelligence alla portata di tutti B USINESS I NTELLIGENCE Lo strumento di Business Intelligence alla portata di tutti Modulo INFOREADER INFOREADER è il modulo di INFOBUSINESS che consente di abilitare la postazione di lavoro alla visualizzazione

Dettagli

Gestione Requisiti. Ingegneria dei Requisiti. Requisito. Tipi di Requisiti e Relativi Documenti. La gestione requisiti consiste in

Gestione Requisiti. Ingegneria dei Requisiti. Requisito. Tipi di Requisiti e Relativi Documenti. La gestione requisiti consiste in Ingegneria dei Requisiti Il processo che stabilisce i servizi che il cliente richiede I requisiti sono la descrizione dei servizi del sistema Funzionalità astratte che il sistema deve fornire Le proprietà

Dettagli

Metodologia di Progettazione database relazionali

Metodologia di Progettazione database relazionali Informatica e Telecomunicazioni S.p.A. Metodologia di Progettazione database relazionali I&T Informatica e Telecomunicazioni S.p.A Via dei Castelli Romani, 9 00040 Pomezia (Roma) Italy Tel. +39-6-911611

Dettagli

Tecniche di DM: Link analysis e Association discovery

Tecniche di DM: Link analysis e Association discovery Tecniche di DM: Link analysis e Association discovery Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Architettura di un generico algoritmo di DM. 2 2 Regole di associazione:

Dettagli

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo

Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Sistemi per le decisioni Dai sistemi gestionali ai sistemi di governo Obiettivi. Presentare l evoluzione dei sistemi informativi: da supporto alla operatività a supporto al momento decisionale Definire

Dettagli

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it

Processi di Business e Sistemi di Gestione di Workflow: concetti di base. Prof. Giancarlo Fortino g.fortino@unical.it Processi di Business e Sistemi di Gestione di Workflow: concetti di base Prof. Giancarlo Fortino g.fortino@unical.it Introduzione Le aziende devono modificare la loro organizzazione per cogliere le nuove

Dettagli

Basi di dati. Maurizio Lenzerini. Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza. Anno Accademico 2011/2012

Basi di dati. Maurizio Lenzerini. Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza. Anno Accademico 2011/2012 Basi di dati Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza Anno Accademico 2011/2012 http://www.dis.uniroma1.it/~lenzerin/home/?q=node/44 4. La progettazione

Dettagli

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse

Introduzione data warehose. Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa. Data Warehouse Introduzione data warehose Gian Luigi Ferrari Dipartimento di Informatica Università di Pisa Data Warehouse Che cosa e un data warehouse? Quali sono i modelli dei dati per data warehouse Come si progetta

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

Data warehousing e OLAP

Data warehousing e OLAP Data warehousing e OLAP Introduzione Il contesto, processi aziendali Decision Support Systems Sistemi di Data Warehousing Data mart Architettura Modellazione Concettuale Star Schema, Dimensioni, Livelli

Dettagli

La guida CRM per eliminare le incertezze: prendete il controllo del vostro business

La guida CRM per eliminare le incertezze: prendete il controllo del vostro business 2 La guida CRM per eliminare le incertezze: prendete il controllo del vostro business (2 - migliorate la vostra credibilità: i 5 passi per dimostrare l efficacia del Marketing) Pagina 1 di 9 SOMMARIO PREMESSA...

Dettagli

Introduzione al data warehousing

Introduzione al data warehousing Introduzione al data warehousing, Riccardo Torlone aprile 2012 1 Motivazioni I sistemi informatici permettono di aumentare la produttività delle organizzazioni automatizzandone la gestione quotidiana dei

Dettagli

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE.

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. INFORMATICA Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. APPLICAZIONI WEB L architettura di riferimento è quella ampiamente diffusa ed

Dettagli

Microsoft SQL Server Integration Services

Microsoft SQL Server Integration Services Sistemi Informativi Dott.ssa Elisa Turricchia Alma Mater Studiorum - Università di Bologna elisa.turricchia2@unibo.it 1 Microsoft SQL Server Integration Services 1 SQL Server Integration Services SSIS

Dettagli

La Progettazione Concettuale

La Progettazione Concettuale La Progettazione Concettuale Università degli Studi del Sannio Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica CorsodiBasidiDati Anno Accademico 2006/2007 docente: ing. Corrado Aaron Visaggio

Dettagli

Verifica e Validazione del Simulatore

Verifica e Validazione del Simulatore Verifica e del Simulatore I 4 passi principali del processo simulativo Formulare ed analizzare il problema Sviluppare il Modello del Sistema Raccolta e/o Stima dati per caratterizzare l uso del Modello

Dettagli

PBI Passepartout Business Intelligence

PBI Passepartout Business Intelligence PBI Passepartout Business Intelligence TARGET DEL MODULO Il prodotto, disponibile come modulo aggiuntivo per il software gestionale Passepartout Mexal, è rivolto alle Medie imprese che vogliono ottenere,

Dettagli

Sistemi Informativi I Lezioni di Ingegneria del Software

Sistemi Informativi I Lezioni di Ingegneria del Software 4 Codifica, Test e Collaudo. Al termine della fase di progettazione, a volte anche in parallelo, si passa alla fase di codifica e successivamente alla fase di test e collaudo. In questa parte viene approfondita

Dettagli

Data Mining Algorithms

Data Mining Algorithms Proposte di Tesi Elena Baralis, Silvia Chiusano, Paolo Garza, Tania Cerquitelli, Giulia Bruno, Daniele Apiletti, Alessandro Fiori, Luca Cagliero, Alberto Grand, Luigi Grimaudo Torino, Giugno 2011 Data

Dettagli

Esercizi di Ricerca Operativa I

Esercizi di Ricerca Operativa I Esercizi di Ricerca Operativa I Dario Bauso, Raffaele Pesenti May 10, 2006 Domande Programmazione lineare intera 1. Gli algoritmi per la programmazione lineare continua possono essere usati per la soluzione

Dettagli

Corso di Informatica Generale 1 IN1. Linguaggio SQL

Corso di Informatica Generale 1 IN1. Linguaggio SQL Università Roma Tre Facoltà di Scienze M.F.N. di Laurea in Matematica di Informatica Generale 1 Linguaggio SQL Marco (liverani@mat.uniroma3.it) Sommario Prima parte: le basi dati relazionali Basi di dati:

Dettagli

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati INTRODUZIONE Accesso ai dati tramite DBMS Livelli di astrazione Modello dei dati: schema / istanza / metadati Alcuni modelli dei dati Linguaggi per DBMS Architettura di base di un DBMS cesarini - BDSI

Dettagli

Facoltà di Pianificazione del Territorio A.A. 2011/2012. Informatica

Facoltà di Pianificazione del Territorio A.A. 2011/2012. Informatica Facoltà di Pianificazione del Territorio A.A. 2011/2012 Informatica Le basi di dati 2 Dati e Informazioni Un dato in sé non costituisce un informazione in quanto consiste semplicemente di un insieme di

Dettagli

Introduzione alla Business Intelligence

Introduzione alla Business Intelligence SOMMARIO 1. DEFINIZIONE DI BUSINESS INTELLIGENCE...3 2. FINALITA DELLA BUSINESS INTELLIGENCE...4 3. DESTINATARI DELLA BUSINESS INTELLIGENCE...5 4. GLOSSARIO...7 BIM 3.1 Introduzione alla Pag. 2/ 9 1.DEFINIZIONE

Dettagli

Università degli Studi di Napoli Federico II Facoltà di Medicina e Chirurgia Corso di Laurea in Infermieristica

Università degli Studi di Napoli Federico II Facoltà di Medicina e Chirurgia Corso di Laurea in Infermieristica Università degli Studi di Napoli Federico II Facoltà di Medicina e Chirurgia Corso di Laurea in Infermieristica Corso di Sistemi di Elaborazione delle Informazioni A.A. 2011/2012 Prof. Ing. Ivan Giammona

Dettagli

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza:

70555 Informatica 3 70777 Sicurezza 2. 70555 Mario Rossi 70777 Anna Bianchi. Esempio istanza: DOMANDE 1) Definire i concetti di schema e istanza di una base di dati, fornendo anche un esempio. Si definisce schema di una base di dati, quella parte della base di dati stessa che resta sostanzialmente

Dettagli

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it

Introduzione alla Business Intelligence. E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence E-mail: infobusiness@zucchetti.it Introduzione alla Business Intelligence Introduzione Definizione di Business Intelligence: insieme di processi per raccogliere

Dettagli

Appunti lezione Database del 07/10/2015

Appunti lezione Database del 07/10/2015 Appunti lezione Database del 07/10/2015 Nelle lezioni precedenti si è visto come qualunque applicazione informativa è almeno formata da tre livelli o layers che ogni progettista conosce e sa gestire: Livello

Dettagli

Introduzione ai Database e a Microsoft Access

Introduzione ai Database e a Microsoft Access Introduzione ai Database e a Microsoft Access 1 Il Sistema Informativo aziendale Un Sistema Informativo aziendale è costituito: dall'insieme delle informazioni utilizzate, prodotte e trasformate da un'azienda

Dettagli

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Dettagli

Informatica per l'impresa. Sistemi per la gestione di basi di Dati

Informatica per l'impresa. Sistemi per la gestione di basi di Dati Informatica per l'impresa Sistemi per la gestione di basi di Dati Prof. Mauro Gaspari gaspari@cs.unibo.it 1 1 Sistema Informativo Insieme degli strumenti, risorse e procedure che consentono la gestione

Dettagli

Integrazione ed elaborazione di dati real-time

Integrazione ed elaborazione di dati real-time 76 Integrazione ed elaborazione di dati real-time Le nuove tecnologie dell automazione hanno permesso di acquisire e rendere disponibili enormi quantità di segnali. Spesso risulta complesso utilizzare

Dettagli

I N G E G N E R E G I A N L U C A D I T O M A S S I

I N G E G N E R E G I A N L U C A D I T O M A S S I PACCHETTI FORMATIVI Corso Documento Programmatico sulla Sicurezza (DPS): linee guida e misure attuative Il codice sulla privacy Adempimenti ed opportunità La cultura della sicurezza come vantaggio competitivo

Dettagli

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione

SISTEMI INFORMATIVI AVANZATI -2010/2011 1. Introduzione SISTEMI INFORMATIVI AVANZATI -2010/2011 1 Introduzione In queste dispense, dopo aver riportato una sintesi del concetto di Dipendenza Funzionale e di Normalizzazione estratti dal libro Progetto di Basi

Dettagli

Sistemi Informativi e Basi di Dati

Sistemi Informativi e Basi di Dati Sistemi Informativi e Basi di Dati Laurea Specialistica in Tecnologie di Analisi degli Impatti Ecotossicologici Docente: Francesco Geri Dipartimento di Scienze Ambientali G. Sarfatti Via P.A. Mattioli

Dettagli

ESEMPIO: RITARDI & BIGLIETTI

ESEMPIO: RITARDI & BIGLIETTI ESEMPIO: RITARDI & BIGLIETTI Fatto Ritardi: l analisi a livello volo giornaliero, considerando l aeroporto di partenza, la città e lo stato di arrivo e la compagnia Fatto Biglietti: l analisi deve considerare

Dettagli

white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo

white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo white paper La Process Intelligence migliora le prestazioni operative del settore assicurativo White paper La Process Intelligence migliora le prestazioni operative del settore assicurativo Pagina 2 Sintesi

Dettagli

Data Warehousing (DW)

Data Warehousing (DW) Data Warehousing (DW) Il Data Warehousing è un processo per estrarre e integrare dati storici da sistemi transazionali (OLTP) diversi e disomogenei, e da usare come supporto al sistema di decisione aziendale

Dettagli

Ingegneria del Software UML - Unified Modeling Language

Ingegneria del Software UML - Unified Modeling Language Ingegneria del Software UML - Unified Modeling Language Obiettivi. Presentare un approccio visuale alla progettazione. Illustrare i vantaggi dell utilizzo di diagrammi nella fase di progettazione. Rispondere

Dettagli

Lezione 5: Progettazione di Software e Database. Ingegneria del Software. Il Software 19/11/2011. Dr. Luca Abeti

Lezione 5: Progettazione di Software e Database. Ingegneria del Software. Il Software 19/11/2011. Dr. Luca Abeti Lezione 5: Progettazione di Software e Database Dr. Luca Abeti Ingegneria del Software L ingegneria del software è la disciplina che studia i metodi e gli strumenti per lo sviluppo del software e la misura

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

Il software: natura e qualità

Il software: natura e qualità Sommario Il software: natura e qualità Leggere Cap. 2 Ghezzi et al. Natura e peculiarità del software Classificazione delle qualità del software Qualità del prodotto e del processo Qualità interne ed esterne

Dettagli

Informatica (Basi di Dati)

Informatica (Basi di Dati) Corso di Laurea in Biotecnologie Informatica (Basi di Dati) Introduzione alle Basi di Dati Anno Accademico 2009/2010 Da: Atzeni, Ceri, Paraboschi, Torlone - Basi di Dati Lucidi del Corso di Basi di Dati

Dettagli

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici

Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Progetto Finale: Modelli semantici dei dati in domini applicativi specifici Roberto Basili, Marco Pennacchiotti Corso di Fondamenti di Informatica a.a. 2003-2004 Definizioni Generali e Regole d esame Il

Dettagli

Introduzione. Elenco telefonico Conti correnti Catalogo libri di una biblioteca Orario dei treni aerei

Introduzione. Elenco telefonico Conti correnti Catalogo libri di una biblioteca Orario dei treni aerei Introduzione Elenco telefonico Conti correnti Catalogo libri di una biblioteca Orario dei treni aerei. ESEMPI DI INSIEMI DI DATI DA ORGANIZZARE ED USARE IN MANIERA EFFICIENTE Introduzione Più utenti con

Dettagli

Programma ELISA - Proposta progettuale

Programma ELISA - Proposta progettuale Macro descrizione del progetto Il progetto intende fornire alle amministrazioni locali gli strumenti per un ottimale governo dell erogazione dei servizi sui diversi canali e per la definizione di concrete

Dettagli

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione

Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Tecniche di DM: Alberi di decisione ed algoritmi di classificazione Vincenzo Antonio Manganaro vincenzomang@virgilio.it, www.statistica.too.it Indice 1 Concetti preliminari: struttura del dataset negli

Dettagli

ARCHIVI E LORO ORGANIZZAZIONI

ARCHIVI E LORO ORGANIZZAZIONI ARCHIVI E LORO ORGANIZZAZIONI Archivio: - insieme di registrazioni (record), ciascuna costituita da un insieme prefissato di informazioni elementari dette attributi (campi) - insieme di informazioni relative

Dettagli

Indicizzazione terza parte e modello booleano

Indicizzazione terza parte e modello booleano Reperimento dell informazione (IR) - aa 2014-2015 Indicizzazione terza parte e modello booleano Gruppo di ricerca su Sistemi di Gestione delle Informazioni (IMS) Dipartimento di Ingegneria dell Informazione

Dettagli

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse Politecnico di Milano View integration 1 Integrazione di dati di sorgenti diverse Al giorno d oggi d la mole di informazioni che viene gestita in molti contesti applicativi è enorme. In alcuni casi le

Dettagli

Impresa di raccolta e riciclaggio di materiali metallici e di rifiuti.

Impresa di raccolta e riciclaggio di materiali metallici e di rifiuti. Impresa di raccolta e riciclaggio di materiali metallici e di rifiuti. Indice Cognome Nome Matr.xxxxxx email Cognome Nome Mat. Yyyyyy email Argomento Pagina 1. Analisi dei requisiti 1 a. Requisiti espressi

Dettagli