Caratteristiche principali. Contesti di utilizzo



Documenti analoghi
Basi di dati. Corso di Laurea in Ingegneria Informatica Canale di Ingegneria delle Reti e dei Sistemi Informatici - Polo di Rieti

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Database. Francesco Tapparo Informatica e Bioinformatica /16

Base di dati e sistemi informativi

Lezione 9. Applicazioni tradizionali

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

BASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015

Database. Appunti di Amaranto Oronzo e Giancane Diego Lezione dell Ing. Lucia Vaira 24/04/2014

UN PROGRAMMA APPLICATIVO: ACCESS Access è un programma del pacchetto Office che permette di realizzare database

SQL Server. Applicazioni principali

1.1 Introduzione alle basi di dati

Corso di Informatica

19. LA PROGRAMMAZIONE LATO SERVER

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

Sistemi centralizzati e distribuiti

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Lezione 1. Introduzione e Modellazione Concettuale

1. BASI DI DATI: GENERALITÀ

Sistema operativo: Gestione della memoria

Organizzazione degli archivi

Capitolo 4 Pianificazione e Sviluppo di Web Part

Le Basi di Dati. Le Basi di Dati

Progetto di Applicazioni Software

Progettazione di Basi di Dati

Database. Si ringrazia Marco Bertini per le slides

Introduzione al data base

Informatica I per la. Fisica

Lezione V. Aula Multimediale - sabato 29/03/2008

Architetture Informatiche. Dal Mainframe al Personal Computer

Architetture Informatiche. Dal Mainframe al Personal Computer

Il Dipartimento individua conoscenze, abilità e competenze in uscita nel biennio e nel triennio ripartite come segue:

Al giorno d oggi, i sistemi per la gestione di database

Corso di Informatica RDBMS RDBMS. Corso di Laurea in Conservazione e Restauro dei Beni Culturali

Sistemi informativi secondo prospettive combinate

SQL Server Introduzione all uso di SQL Server e utilizzo delle opzioni Olap. Dutto Riccardo - SQL Server 2005.

Progettaz. e sviluppo Data Base

Corso di Informatica (Basi di Dati)

Progettazione Web Applicazioni client-server

Alessandra Raffaetà. Basi di Dati

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

EXPLOit Content Management Data Base per documenti SGML/XML

Basi di Dati e Microsoft Access

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database

La Metodologia adottata nel Corso

Informatica (Basi di Dati)

Archivi e database. Lezione n. 7

Capitolo 13. Interrogare una base di dati

Progettaz. e sviluppo Data Base

Basi di dati. Basi di dati = database. Basi di dati

INTRODUZIONE. Data Base Management Systems evoluzione tecniche gestione dati

Sistemi avanzati di gestione dei Sistemi Informativi

Regole licenze per utente IBM i

Basi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007

I database relazionali (Access)

DATABASE.

Introduzione alle tecnologie informatiche. Strumenti mentali per il futuro

La gestione di un calcolatore. Sistemi Operativi primo modulo Introduzione. Sistema operativo (2) Sistema operativo (1)

Grid Data Management Services. Griglie e Sistemi di Elaborazione Ubiqui

Ministero della Pubblica Istruzione Ufficio Scolastico Regionale per la Sicilia Direzione Generale

Tecnologia di un Database Server (centralizzato) Introduzione generale

C Cloud computing Cloud storage. Prof. Maurizio Naldi

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

BASE DI DATI: sicurezza. Informatica febbraio ASA

ITI M. FARADAY Programmazione modulare a.s

Corso di Basi di Dati e Conoscenza

Corso di Informatica

Organizzazione delle informazioni: Database

Introduzione alla teoria dei database relazionali. Come progettare un database

ISTITUTO TECNICO ECONOMICO MOSSOTTI

IL FITOFOR: UNO STRUMENTO PER LA GESTIONE DELLE INFORMAZIONI FITOSANITARIE. Marino Vignoli, Elisa Moneti, M. Miozzo DREAM - Italia

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

PROGRAMMAZIONE MODULARE. Periodo mensile. Ore previste

Progetto di Applicazioni Software

Reti di Telecomunicazione Lezione 6

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

PIANO DI LAVORO EFFETTIVAMENTE SVOLTO IN RELAZIONE ALLA PROGRAMMAZIONE DISCIPLINARE

Basi di Dati Distribuite

SISTEMI OPERATIVI DISTRIBUITI

Università degli Studi di Bologna Bologna, 12/12/2002 Corso di Laurea In Informatica. Alessandro Valenti. Sessione II

Basi di dati 9 febbraio 2010 Compito A

ControlloCosti. Cubi OLAP. Controllo Costi Manuale Cubi

Progetto di Applicazioni Software

Creare una Rete Locale Lezione n. 1

Elena Baralis 2013 Politecnico di Torino 1

Scenari di Deployment i. Scenari di Deployment

Data Base. Prof. Filippo TROTTA

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

LABORATORIO. 2 Lezioni su Basi di Dati Contatti:

4 Data Transformation Services

Facoltà di Farmacia - Corso di Informatica

Application Server per sviluppare applicazioni Java Enterprise

Simple & Efficient.

Il database management system Access

Definizione Parte del software che gestisce I programmi applicativi L interfaccia tra il calcolatore e i programmi applicativi Le funzionalità di base

Transcript:

Dalle basi di dati distribuite alle BASI DI DATI FEDERATE Antonella Poggi Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza Anno Accademico 2006/2007 http://www.dis.uniroma1.it/ lenzerini/didattica/gestionedatisistemiinformativi Basi di dati federate 1. Caratteristiche delle basi di dati federate Introduzione Architettura Discussione (vantaggi, limiti, problemi) 2. Presentazione di un prodotto commerciale (IBM DB2 Information Integrator) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 2

Basi di dati federate 1. Caratteristiche delle basi di dati federate Introduzione Architettura Discussione (vantaggi, limiti, problemi) 2. Prodotto commerciale (IBM DB2 Information Integrator) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 3 Cos e una base di dati federata? DATABASE FEDERATO Sito 1 DBMS Oracle Sito 2 Rete di comunicazione Fogli Excel Sito 5 File XML Sito 4 Sito 3 DBMS MySql Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 4

Caratteristiche principali Dati distribuiti tra diversi siti per mezzo di una rete di comunicazione Unica base di dati logica accessibile da un unico sito virtuale Federata regole di comunicazione stabilite tra un server (database federato) ed un client (sorgente di dati) per la condivisione dei dati specifica di una relazione intensionale tra basi di dati federata e sorgente ogni sorgente gestisce in maniera indipendente e autonoma i propri dati ospita collezione di dati di tipo qualsiasi (files, DBMS,...) estensione dei dati della sorgente puo variare Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 5 Contesti di utilizzo Sistemi gerarchici di strutture indipendenti e autonome Almeno due possibili contesti Federazione inter-organization Associazione Bancaria Italiana ABI Banca d Italia (relazione di fine anno sull andamento sistema bancario) Ministero della sanita e strutture sanitarie locali Portali Web Federazione intra-organization Enterprise Information Systems (EIS)... Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 6

Basi di dati federate 1. Caratteristiche delle basi di dati federate Introduzione Architettura Discussione (vantaggi, problemi) 2. Prodotto commerciale (IBM DB2 Information Integrator) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 7 Architettura di una base di dati federata DBMS DBMS WRAPPERS ESTERNO FILE SYSTEM FILE XML FILE EXCEL Il database federato e costituito da: FILE XML FILE EXCEL un DBMS che gestisce i dati e ne permette l interrogazione un insieme di wrappers: moduli software che permettono l accesso da parte del DBMS di sorgenti dati eterogenee Trasparenza: l utente vede un unico database che astrae dalle diverse collezioni di dati! Il database federato ha un unico punto di accesso! Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 8

Basi di dati federate 1. Caratteristiche delle basi di dati federate Introduzione Architettura Discussione (vantaggi, limiti, problemi) 2. Prodotto commerciale (IBM DB2 Information Integrator) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 9 Vantaggi Integrazione on-the-fly (anche detta on demand ) nessuna materializzazione prevista a priori Trasparenza rispetto alla distribuzione dei dati, ovvero alla locazione fisica dei dati rispetto all eterogeneita dei dati, ovvero al modello e alla struttura dei dati nella sorgente Autonomia delle sorgenti rispetto al modello di dati e alle strutture di dati della base di dati federata Autonomia della base di federata rispetto al modello di dati Progetto BOTTOM-UP sorgenti esistono a priori Estensione immediata Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 10

Limiti Dipendenza logica lo schema logico della base di dati federata dipende dallo schema/struttura delle sorgenti non puo essere stabilito a priori, in maniera indipendente specifica dello schema procedurale (vs. dichiarativa) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 11 Problemi di integrita dei dati (1) Gestione della risoluzione di entita ( entity resolution problem) Ogni sorgente e indipendente dalle altre e dalla base di dati federata come si stabilisce che dati provenienti da sorgenti diverse si riferiscono alla stessa entita della basi di dati federata? e.g. M. Lenzerini e Maurizio Lenzerini rappresentano entrambi il nome dello stesso individuo come si decide che dati provenienti da sorgenti diverse (e.g. sintatticamente uguali) si riferiscono a entita diverse della base di dati federata? e.g. Mario Rossi (studente), e Mario Rossi (professore) rappresentano il nome di due individui distinti Replicazione di dati non controllata Non e previsto alcun uso controllato della replicazione al fine di ottimizzare le prestazioni del sistema Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 12

Problemi di integrita dei dati (2) Gestione delle transazioni Cosa succede se una transazione fallisce in una sorgente esterna? Gestione della concorrenza Cosa succede se due transazioni vengono eseguite contemporaneamente sulla stessa sorgente da parte del database federato e di un altro sistema qualsiasi? Ogni sorgente adotta propri algoritmi per la gestione della concorrenza... Problemi che devono essere risolti dalle applicazioni (tool by tool) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 13 Osservazioni Esistono ad oggi pochi recenti tool commerciali per il data federation IBM, Oracle nessun tool free/open source Come discusso, ci sono ancora molti problemi da risolvere! Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 14

Basi di dati federate 1. Caratteristiche delle basi di dati federate Introduzione Architettura Discussione (vantaggi, limiti, problemi) 2. Prodotto commerciale (IBM DB2 Information Integrator) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 15 DB2 Information Integrator (DB2II) Prodotto commerciale IBM per la federazione di dati proveniente da sorgenti eterogenee, autonome, indipendenti Prima: tool da integrare al DBMS IBM DB2 Universal DataBase UDB Oggi: con il server IBM per applicazioni Web WEBSPHERE Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 16

Architettura di DB2II Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 17 Sistema federato in DB2II Tabelle locali Tabelle federate NICKNAME NICKNAME NICKNAME WRAPPER ORACLE SERVER SERVER Mapping tra unità logiche DBMS ORACLE SITO 2 DBMS ORACLE CATALOGO GLOBALE NICKNAME NICKNAME NICKNAME WRAPPER EXCEL WRAPPER XML SERVER SERVER SERVER FOGLIO EXCEL FOGLIO EXCEL FOGLIO XML SITO 3 SITO 4 Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 18

Componenti del sistema federato di DB2II (1) wrapper: libreria che permette l'accesso a particolari tipi di sorgenti di dati come Oracle, Sybase, Web Services, etc. Contiene informazioni sulle caratteristiche di ogni tipo di sorgente server: rappresenta una specifica sorgente di dati in un certo sito il cui accesso avviene attraverso il wrapper appropriato nickname: alias locale per un unità logica contenente dati (es. tabella di un database) di un client remoto un nickname per ogni unità logica remota che si vuole rendere accessibile Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 19 Componenti del sistema federato di DB2II (2) user mapping: mapping tra un identicativo e una password di un utente locale che accede al server federato DB2, e un identificativo e una password di un utente remoto (se necessario per la connessione alla sorgente remota) data type mapping: mapping tra i tipi di dati delle sorgenti e quelli previsti da DB2 Ci sono dei data type mapping di default definiti nella libreria wrapper Per sorgenti relazionali puo essere necessario definirne degli altri function mapping: mapping tra le funzioni remote e funzioni costruite in DB2 Ci sono dei function mapping di default definiti nella libreria wrapper Per sorgenti relazionali, si possono definire dei function mapping quando si vuole usare una funzione della sorgente che non e riconosciuta dal sistema federato Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 20

Tipi di sorgenti supportati DBMS relazionali: Oracle, MySql Nickname <-> Tabella Supportano updates File Excel Nickname <-> File (eventualmente sotto-tabella) Non supportano gli updates Flat file Nickname <-> File Non supportano gli updates File XML Nickname <-> File + XPath queries Non supportano gli updates Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 21 Esempio: sorgenti relazionali Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 22

Caratteristiche principali Query processing ottimizzato in base a: informazioni nel catalogo globale sull intero sistema federato informazioni contenute nei wrapper in base all analisi della sorgente, il sistema federato puo decidere di fare eseguire l esecuzione di un comando SQL alla sorgente (pushdown) o di eseguirne parte localmente (compensazione) Query elaborate come se le sorgenti fossero delle normali tabelle relazionali si ottiene in questo modo che il sistema federato rende accessibili sia dati relazionali, sia dati non relazionali (locali o remoti) Mapping tra unita logiche remote e unita logiche federate si perde l indipendenza logica! Nessuna gestione della concorrenza Solo alcune sorgenti permettono la gestione delle transazioni (cioe se una transazione fallisce, avvertono DB2II in maniera tale che possa procedere con l eventuale recovery) Antonella Poggi Gestione dei dati nei Sistemi Informativi Basi di dati federate - 23