Estrattore Semantico di Ontologie da DB Relazionali. Luca Macagnino



Documenti analoghi
Progettaz. e sviluppo Data Base

Informatica Applicata 3.3 OWL. Antonella Poggi. Anno Accademico DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO FILOLOGICHE E GEOGRAFICHE

Capitolo 13. Interrogare una base di dati

Esercitazione di Basi di Dati

Esercitazione di Basi di Dati

Introduzione al Semantic Web

Introduzione alla teoria dei database relazionali. Come progettare un database

Volumi di riferimento

Rappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0

Basi di dati. Il Modello Relazionale dei Dati. K. Donno - Il Modello Relazionale dei Dati

I database relazionali (Access)

I.T.C. Mario Pagano Napoli

GESTIONE CONTRATTI. Contratti clienti e contratti fornitori

Introduzione ai Sistemi di Gestione di Basi di Dati XML

UN PROGRAMMA APPLICATIVO: ACCESS Access è un programma del pacchetto Office che permette di realizzare database

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

Pubblicazione di Linked Data in e-commerce: Progettazione e Sperimentazione (Riassunto)

Generazione Automatica di Asserzioni da Modelli di Specifica

LA MIGRAZIONE DEI DATI DA ASFI A SIASFI: PROBLEMI E SOLUZIONI. La migrazione dei dati da ASFi a SIASFi: problemi e soluzioni.

COLLI. Gestione dei Colli di Spedizione. Release 5.20 Manuale Operativo

SISTEMI INFORMATIVI AVANZATI -2010/ Introduzione

Piano di gestione della qualità

Lo schema concettuale risultante dalla progettazione concettuale è l input alla fase di progettazione logica.

Basi di Dati e Microsoft Access

Data Base. Master "Bio Info" Reti e Basi di Dati Lezione 6

Lezione V. Aula Multimediale - sabato 29/03/2008

(Esercizi Tratti da Temi d esame degli ordinamenti precedenti)

Organizzazione delle informazioni: Database

DATABASE. A cura di Massimiliano Buschi

Introduzione ai database relazionali

DDL, VINCOLI D INTEGRITÁ, AGGIORNAMENTI E VISTE. SQL è più di un semplice linguaggio di interrogazione

LA RICLASSIFICAZIONE DI BILANCIO CON MICROSOFT ACCESS

LA RICLASSIFICAZIONE DEI SALDI CONTABILI CON MICROSOFT ACCESS 2007

Esercizio data base "Biblioteca"

Enrico Fagnoni BOTK IN A NUTSHELL

Ciclo di vita dimensionale

RINTRACCIABILITA' MATERIALI

Progetto di un sistema a norma di legge per la conservazione a lungo termine di documenti elettronici

Logistica magazzino: Inventari

PrometeoQualità. Manuale Documenti

Un portale semantico per i Beni Culturali

Organizzazione degli archivi

7. Layer e proprietà degli oggetti


CONNETTORE MAILUP PER MICROSOFT DYNAMICS CRM

SIRED Sistema informativo di raccolta ed elaborazione dati sul movimento turistico

Analisi dei requisiti e casi d uso

LA FORMAZIONE E LA CONSERVAZIONE DELLA MEMORIA DIGITALE

Introduzione all Information Retrieval

Definizione di domini

UNI EN ISO 9001:2008 Sistemi di Gestione per la Qualità: requisiti e guida per l uso

Implementazione della lean production. Cenni introduttivi. Metodo del free-pass: il caso Benelli Armi s.p.a.

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da

Università degli Studi di Ferrara - A.A. 2014/15 Dott. Valerio Muzzioli ORDINAMENTO DEI DATI

BASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015

con ANTLR tesi di laurea Anno Accademico Relatore Ch.mo prof. Porfirio Tramontana Candidato Fabio Canova Matr

Basi di Dati Multimediali. Fabio Strocco

MANUALE DI CONSERVAZIONE

Università degli studi Roma Tre Dipartimento di informatica ed automazione. Tesi di laurea

Progetto: ARPA Fonte Dati. ARPA Fonte Dati. Regione Toscana. Manuale Amministratore

Sviluppata da: Lo Russo - Porcelli Pag. 1 di 6 6FRSR utilizzare il DBMS Postgresql per imparare il linguaggio SQL.

Normalizzazione. Normalizzazione. Normalizzazione e modello ER. Esempio. Normalizzazione

03. Il Modello Gestionale per Processi

Database. Appunti di Amaranto Oronzo e Giancane Diego Lezione dell Ing. Lucia Vaira 24/04/2014

DBMS. Esempi di database. DataBase. Alcuni esempi di DBMS DBMS. (DataBase Management System)

RICERCA DELL INFORMAZIONE

Stimare il WCET Metodo classico e applicazione di un algoritmo genetico

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Basi di dati. Il Linguaggio SQL. K. Donno - Il Linguaggio SQL

Corso di Sistemi di Elaborazione delle informazioni

"Rapid Prototyping: studio delle possibili sorgenti di errore"

Access. P a r t e p r i m a

I DATABASE Database relazionale

Manuale di utilizzo del sito ASUWEB

ƒ Gli standard e la gestione documentale

Riepilogo delle modifiche di PA-DSS dalla versione 2.0 alla 3.0

per immagini guida avanzata Uso delle tabelle e dei grafici Pivot Geometra Luigi Amato Guida Avanzata per immagini excel

Il Sistema Nazionale di Autovalutazione

Progetto Patent DB - DGLC-UIBM Antonio Maria Tambato

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO

PROXYMA Contrà San Silvestro, Vicenza Tel Fax

Gestione dei rifiuti

Raggruppamenti Conti Movimenti

INTEGRATA OTTIMIZZAZIONE DEI PROCESSI AZIENDALI

Esercitazione sulla progettazione di Wrapper in applicazioni reali

Specifiche Tecniche e Funzionali Applicativo DIAGNOS PLUS (09/2015)

Norme per l organizzazione - ISO serie 9000

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

SISTEMA DESCRIZIONE SOMMARIA COMPONENTI SISTEMA. Sistema applicativo di gestione e monitoraggio. SIMIP Entrata in esercizio: Ottobre 2008

KON 3. Knowledge ON ONcology through ONtology

CERTIFICAZIONE ISO 14001

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

Integrazione al Manuale Utente 1

INTEGRATA OTTIMIZZAZIONE DEI PROCESSI AZIENDALI

Progettazione di un Database

LA SOLUZIONE PROPOSTA E L ATTIVAZIONE DEL SERVIZIO Luisa Semolic Insiel S.p.A.

Università degli Studi di Bologna Bologna, 12/12/2002 Corso di Laurea In Informatica. Alessandro Valenti. Sessione II

Fast Query Manuale Utente. Fast Query Manuale Utente

DBMS (Data Base Management System)

Transcript:

Estrattore Semantico di Ontologie da DB Relazionali Luca Macagnino 1

Obiettivi Estrarre un ontologia da una sorgente di dati relazionale, al fine di rendere disponibili e dotate di semantica le informazioni contenute nel database. L ontologia prodotta deve descrivere il contenuto della sorgente e tenere traccia di come i dati sono contenuti nel database (metadati) consentendo il query processing dei dati. L applicazione si colloca all interno di un sistema più ampio del quale deve rispettare vincoli e caratteristiche: sorgenti dinamiche e relative a contesti differenti; informazioni disponibili (metadati, domain ontology); q.ta di informazioni memorizzabili limitata. 2

Architettura del Sistema 3

Relational.OWL < > <rdf:description rdf:about="#persona"> <rdf:type rdf:resource="http://www.dbs.cs.uniduesseldorf.de/rdf/relational.owl#table"/> <j.0:isidentifiedby rdf:resource="#pk1"/> <j.0:hascolumn rdf:resource="#persona.id"/> <j.0:hascolumn rdf:resource="#persona.nome"/> <j.0:hascolumn rdf:resource="#persona.citta"/> </rdf:description> < > <rdf:description rdf:about="#persona.id"> <rdf:type rdf:resource="http://www.dbs.cs.uniduesseldorf.de/rdf/relational.owl#column"/> <rdfs:domain rdf:resource="#persona"/> <rdfs:range rdf:resource="http://www.w3.org/2001/xmlsc hema#integer"/> <j.0:length>32</j.0:length> <j.0:scale>0</j.0:scale> </rdf:description> < > 4

Modulo di Estrazione Semantica (ES) Il modulo ES è composto da due fasi in serie : 1. Reverse Engineering automatico consiste nella generazione di classi e associazioni (indicati genericamente elementi) attraverso l applicazione di regole di traduzione; 2. Ricerca di un matching tra gli elementi individuati e la domain ontology. 5

Regole di Traduzione (1/2) Euristiche fondate sulla metodologia di progettazione di schemi relazionali da schemi ER Utilizzando i metadati della sorgente relazionale classificano le tabelle e le colonne e da queste generano concetti, ruoli, ruoli reificati e attributi. 6

Regole di Traduzione (2/2) Le prime 3 regole classificano le tabelle: R1 R2 R3 Individua le tabelle che rappresentano concetti Individua le tabelle che rappresentano ruoli reificati Individua le tabelle che rappresentano ruoli Altre 2 classificano le colonne: R4 R5 Individua le colonne che rappresentano ruoli Individua gli attributi della relazione *Rappresentazione formale 7

Matching 1/2 Attraverso il tool X-SOM ogni elemento generato dalle regole viene confrontato con gli elementi della Domain Ontology (DO) dello stesso tipo, ricercando quelli lessicalmente vicini X-SOM fornisce per ogni elemento in ingresso un insieme di oggetti del tipo (DO_elem, simil_value) 8

Matching: analisi strutturale 2/2 Per ogni DO_elem con simil_value accettabile viene effettuata un analisi strutturale L elemento viene analizzato a seconda della sua tipologia: corrispondenza di dominio e range per i ruoli, verifica che il ruolo sia funzionale (ruoli reificati), Caso particolare: attributi 9

Ontologia Semantica Se nessun matching accettabile viene rilevato (o se non si usa una DO) un nuovo elemento verrà creato solo sulla base delle regole di traduzione (default). Altrimenti verrà creato nella nuova ontologia un elemento corrispondente a quello individuato nella DO, inoltre: Nel caso di un concetto si ricostruirà anche il cammino fino alla radice (per incrementare la semantica) 10

Mapping & Querying: requisiti Un meccanismo di mapping è necessario per mantenere i riferimenti tra ontologia semantica e ontologia relazionale. L ontologia relazionale conserva lo schema della sorgente quindi recuperare un elemento di questa ontologia equivale a recuperare un elemento dello schema. Ogni elemento dello schema ha un corrispondente nell ontologia creata. Per consentire il querying dei dati si prevede un mapping 1:1 11

Mapping & Querying Si utilizza una terza ontologia: mapping ontology. Gli elementi saranno ruoli tra le risorse dell ontologia relazionale e le risorse dell ontologia semantica. E necessario l utilizzo di OWL-full. Caratteristiche: Non si usa un linguaggio di mapping proprietario Mapping interamente basato sul Semantic Web. In valutazione: mapping attraverso query SPARQL. 12

Caratteristiche L ontologia prodotta contiene l intero schema della sorgente relazionale e parte della DO (in questa fase ). Non mapping tra schema e DO, ma estrazione della semantica dallo schema e creazione di una nuova ontologia. Integrazione di due tecniche Regole + Ricerca di Matching. Intero processo basato sul Semantic Web: nessuna struttura o linguaggio proprietario. Funzionamento anche senza DO. Tentativo di ridurre al minimo l interazione con l utente. 13

Stato dell Arte Relational.OWL [1] OntoLIFT [2] Questo sistema estrae sia lo schema della base di dati sia i dati stessi e li rappresenta mediante ontologie. L ontologia creata rappresenta lo schema relazionale senza aggiungere semantica. Sviluppi recenti: mapping manuale con un ontologia target attraverso query SPARQL. Mapping basato su regole tra lo schema relazionale e un ontologia target. Gli elementi dello schema che non hanno un riscontro lessicale nell ontologia target non vengono mappati. Necessita di un ontologia target. An et al. [3], D2R MAP-A [4], Petrini e Risch [5] 14

References [1] Cristian Perez de Laborda and Stefan Conrad Relational.OWL A Data and Schema Representation Format Based on OWL. In Second Asia-Pacific Conference on Conceptual Modelling(APCCM2005), volume 43 of CRPIT, pages 89-96, Newcastle, Australia, 2005. ACS. [2] R.Volz, S. Handschuch, S. Staab, R. Studer. OntoLiFT Demonstrator.2004 [3] Yuan An, Alexander Borgida, and John Mylopoulos. Inferring Complex Semantic Mappings Between RelationalTables and Ontologies from Simple Correspondences. In CoopIS, DOA, and ODBASE, OTM Confederated International Conferences, Cyprus, PartII, volume 3761 of LNCS, pages 1152 1169. Springer, 2005. [4] Christian Bizer. D2R MAP-A Database to RDF Mapping Language. In WWW 2003, The Twelfth Internationa lworld Wide Web Conference, Budapest, Hungary, 2003. posterpresentation. [5] Johan Petrini and Tore Risch. Processing Queries over RDF views of Wrapped Relational Databases. In 1st International Workshop on Wrapper Techniques for Legacy Systems, WRAP 2004, Delft, Holland, 2004. 15

Questioni Aperte Gestione degli attributi Mapping attraverso query SPARQL Creazione dei ruoli: 2 inversi VS ruolo unico 16

Query SPARQL 21