Agenda Digitale Lombarda Linked Open Data

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Agenda Digitale Lombarda Linked Open Data"

Transcript

1 Agenda Digitale Lombarda Linked Open Data Versione 1.0 Luglio 2014

2 A cura di: Regione Lombardia Direzione Centrale PIeF Struttura Attuazione delle agende regionali di semplificazione e di digitalizzazione. Responsabile: Oscar Sovani Lombardia Informatica S.p.A. Presidenza Progetto di Ricerca e Innovazione Responsabile: Vicepresidente Alberto Daprà Coordinamento lavori: Paolo Tacchino Direzione Sistemi Regione Coordinamento lavori: Daniele Crespi Redazione: Roberto Boselli Ettore Colombo Matteo Fontana Nicolò Vegetti Laboratorio di Ricerca IT Lab 2.0

3 Sommario 1 Introduzione Linked Open Data Introduzione ai Linked Open Data Cenni storici Motivazioni Le tecnologie LOD cloud LOD in Italia LOD casi di successo Strumenti adottati Introduzione Protégé LOD Refine Openlink Virtuoso Universal Server Il progetto ITLab e la costruzione dei LOD sui servizi in regione Lombardia Introduzione Costruzione ontologia dei servizi Prima versione dell ontologia Creazione dell'ontologia dei servizi pubblici con Protégé Versione implementata Procedura di conversione dal CSV a RDF e LOD Gli open data di regione Lombardia LODRefine: manipolazione del dataset, da CSV a RDF Importazione del dataset Pulizia dei campi Riconciliazione Definizione RDF schema Integrazione ontologia con ogni RDF Pubblicazione sull'endpoint Esempi di interrogazioni dell endpoint SPARQL Alcune considerazioni Conclusioni Bibliografia e sitografia Agenda Digitale Linked Open Data 1

4 Indice delle figure Figura 1 Esempio di grafo RDF... 6 Figura 2 LOD cloud diagram... 9 Figura 3 Distribuzione di triple per dominio Figura 4 Livello di qualità Open Data in Italia Figura 5 Enti che pubblicano LOD in Italia Figura 6 Dataset LOD collegati a BBC Music Figura 7 Screenshot da BBC Music Figura 8 Screenshot dal Portale Storico Camera dei Deputati Figura 9 Modello UML del CPSV Figura 10 Modello di servizio ITLab Figura 11 Diagramma del LGBM Figura 12 Grafo della prima versione dell'ontologia dei servizi Figura 13 Screenshot da Protege con l'iri dell'ontologia Figura 14 Screenshot da Protégé con schermata principale Figura 15 Screenshot da Protege con ontologia importata Figura 16 Tab Classes Figura 17 Annotation della classe PublicService Figura 18 Informazioni ontologiche della classe PublicService Figura 19 Tab Object Properties Figura 20 Tab Individuals Figura 21 Grafo della versione implementata dell'ontologia dei servizi Figura 22 Screenshot del portale 31 Figura 23 Screenshot della tabella del dataset delle RSA accreditate Figura 24 il dataset delle RSA accreditate caricato in LODRefine Figura 25 Particolare del menu dei comandi in LODRefine per la gestione delle colonne dei dataset Figura 26 Particolare del menu dei comandi in LODRefine per la gestione delle celle Figura 27 Analisi della NATURA_GIURIDICA delle RSA accreditate in LODRefine Figura 28 Riconciliazione tramite LODRefine-GUI Figura 29 Colonna COMUNE_UBICAZIONE dopo la riconciliazione. Selezione del comune di Albino Figura 30 Dettaglio della finestra di costruzione dello schema RDF Figura 31 Grafo dell ontologia ottenuta integrando schema RDF e ontologia dei servizi per le RSA Figura 32 Dataset RSA nel portale regionale, è evidenziato un record di esempio Figura 33 Dataset RSA, elenco delle classi in Protégé Figura 34 Gerarchie delle classi nelle ontologie dei dataset considerati Figura 35 Schermata web per l'interrogazione dell'endpoint con query SPARQL Figura 36 Schermata web della pagina di DBPedia Italia per il comune di Gromo Agenda Digitale Linked Open Data

5 1 Introduzione Tra le attività che vanno ad attuare l Agenda Digitale Lombarda, Regione Lombardia ha posto in essere fin dal 2012 vari interventi per favorire la valorizzazione del patrimonio informativo pubblico; tra questi, ha chiesto anche uno studio per verificare quali possano essere le modalità ideali di pubblicazione di dati rispettando le indicazioni della comunità internazione sui Linked Open Data (LOD). Lombardia Informatica si è avvalsa del CRISP 1 (con cui collabora da alcuni anni all interno del progetto ITLab 2 ) per effettuare uno studio che, partendo dagli Open Data pubblicati sul portale regionale andasse a proporre un modello per fare diventare alcuni di quei dataset dei LOD. Questo documento contiene la relazione delle attività svolte da CRISP e Lombardia Informatica nell'ambito del progetto ITLab da ottobre 2013 ad aprile 2014 e presenta i risultati finali ottenuti e i prototipi sviluppati. Per fare diventare alcuni dataset selezionati "Linked Open Data" sono state svolte queste attività: sviluppo dell ontologia dei servizi; conversione in formato RDF di cinque dataset individuati in uno stesso ambito, con la creazione dei corrispettivi schemi RDF; integrazione dell'ontologia in ciascuno dei cinque schemi e pubblicazione dei dati sull'endpoint SPARQL; test dell'endpoint SPARQL con alcune query di prova con i relativi risultati. In conclusione del documento si presentano alcune osservazioni sui benefici, sui punti critici evidenziati durante il progetto, e sui possibili sviluppi futuri. 1 centro di ricerca interuniversitario per i servizi di pubblica utilità 2 Il laboratorio IT Lab 2.0 nasce da una convenzione tra Lombardia Informatica e CRISP e ha l'obiettivo di sviluppare ricerche per lo sviluppo di prototipi tecnologici da applicare al settore dei servizi, focalizzando l'attenzione sulle seguenti tematiche: Il ruolo dell'it come fattore abilitante di innovazione nei servizi; L'IT come strumento a supporto della collaborazione nei servizi (Web 2.0 e cooperazione); L'impatto dell'it sulle politiche e sulla governance dei servizi; I sistemi di Business Intelligence (BI) e Decision Support Systems (DSS) applicati ai servizi; I modelli, le strategie e le architetture per l interoperabilità. Open Data, Linked Open Data; ontologie per la definizione dei servizi Strumenti e algoritmi per la Data governance e data quality. Agenda Digitale Linked Open Data 3

6 2 Linked Open Data 2.1 Introduzione ai Linked Open Data L'obiettivo del progetto ITLab sul tema Linked Open Data è stato lo studio e la definizione delle modalità di creazione e pubblicazione di dataset in formato Open Data a 5 stelle, da applicare ai dataset presenti sul portale Open Data della Regione Lombardia 3. Le 5 stelle rappresentano il livello più alto di qualità (secondo la scala di Berners-Lee 4 ) previsto per gli Open Data (diventando così Linked Open Data - LOD), perché permettono il maggior numero di attività possibili sui dati e il massimo grado di interoperabilità tra dataset diversi. Per maggior completezza si ripresenta la descrizione dei cinque livelli di qualità e di riusabilità dei dati: 1. Una Stella: il livello base, costituito da file non strutturati: ad esempio un immagine in formato grezzo (.gif,.jpg,.png), un documento in formato Word, un file in formato pdf; 2. Due Stelle: indica dati strutturati ma codificati con un formato proprietario, ad esempio un documento in formato Excel; 3. Tre Stelle: indica dati strutturati e codificati in un formato non proprietario, ad esempio il formato.csv (Comma Separated Values); 4. Quattro Stelle: indica dati strutturati e codificati in un formato non proprietario che sono dotati di un URI, quindi indirizzabili e utilizzabili direttamente online, attraverso l inclusione del modello RDF (Resource Description Framework); 5. Cinque Stelle: indica quelli che vengono definiti Linked Open Data (LOD), cioè dataset di dati in RDF collegati tra loro. Il formato Linked Open Data è uno standard, definito dal W3C 5, basato su modelli, tecnologie e linguaggi del Semantic Web, che consente la pubblicazione, l'interrogazione e il consumo su Web di dati strutturati in formato RDF, distribuiti tra diversi server. Tale standard richiede il rispetto di 4 regole fondamentali: usare indirizzi Web (Uniform Resource Identificator - URI) come nomi per le cose ; usare URI utili al protocollo HTTP in modo che sia possibile cercare e risolvere quei nomi; quando qualcuno cerca una URI, fornire un informazione utile; includere link ad altre URI, così da permettere a chi cerca di scoprire nuovi collegamenti. Grazie al rispetto di tali regole i dati hanno un reale indirizzo nel Web, sono quindi rintracciabili e possono essere riutilizzati online Cenni storici Nel 2001 Tim Berners-Lee, James Hendler e Ora Lassila pubblicavano un articolo che sarebbe diventato una pietra miliare per la comunità scientifica, con il quale essi lanciavano il Web semantico definendolo come una "[...] estensione del Web attuale, in cui all'informazione è dato un ben determinato significato, facilitando la cooperazione tra i computer e le persone" 6. L'enfasi è quindi posta ai dati e all'interpretazione 3 4 Berners-Lee, T., Linked Data, Berners-Lee, T., Hendler, J. and Lassila, O., "The semantic web." Scientific american (2001), pp Agenda Digitale Linked Open Data

7 del loro significato da parte degli elaboratori. Nel 2006 lo stesso Berners-Lee pubblicava "The Semantic Web Revisited" 7 con il quale affermava che il raggiungimento del Web semantico era ancora lontano, si richiedeva ancora un ampio sforzo nello sviluppare standard, ontologie e applicazioni, ma che l'apporto di dati proveniente dal Social Web avrebbe portato nuova linfa al progetto, e grazie alla progressiva e crescente pubblicazione di dati in RDF esso sarebbe divenuto realtà. Nello stesso anno Berners-Lee definiva le regole dei Linked Data sopra descritte 8. Oggi si parla di Web of Data come strato fondamentale per realizzare il Web semantico su scala globale, e diventa possibile solo se i dati vengono linkati tra loro seguendo le direttive di Berners-Lee e del W3C Motivazioni Date queste premesse fondamentali è necessario chiarire perché una Pubblica Amministrazione dovrebbe pubblicare dataset in formato LOD. Innanzi tutto, i LOD possono definire in modo condiviso e semanticamente espressivo il patrimonio informativo gestito dalle PA. Inoltre con i LOD si possono enfatizzare collegamenti con altri dataset di dati pubblici e rendere universale l'accesso a tali dati, e ciò li abilita a diventare la base di un nuovo paradigma applicativo. Le PA italiane sono sollecitate a pubblicare sul Web i propri dati in formato aperto (Open Data) 9, cioè accessibili online, privi di forme di controllo e restrizioni come copyright e brevetti, che ne limitano l integrazione, la riproduzione e il riutilizzo. Una volta pubblicati, tali dati aumentano sensibilmente il loro valore conoscitivo quando dataset differenti, prodotti e pubblicati in modo indipendente da diversi soggetti, possono essere incrociati liberamente da terze parti. Ciò permette in prima battuta l'interoperabilità dei dati, e poi possono diventare la base per la creazione di nuove applicazioni e servizi, e quindi diventare anche propulsori economici per la nascita di nuove start up, e posti di lavoro. Per far ciò è necessario però che si attivi una collaborazione tra diverse PA, aziende e cittadini, e soprattutto che sia esplicitato un linguaggio comune, una semantica per dati strutturati con chiavi di lettura univoche. Questo è possibile grazie all'utilizzo dei linguaggi, strumenti e standard del Web semantico. La visione della comunità dei Linked Data è molto semplice: trasformare il Web in un ambiente aperto e interoperabile dove i dati non siano chiusi in silos indipendenti, ma collegati tra loro. Inoltre per i dati delle PA si vuole che essi diventino dati di interesse pubblico, in modo che persone e applicazioni possano accedere e interpretare i dati utilizzando le comuni tecnologie Web. Il termine Linked Data non descrive infatti ulteriori nuove tecnologie e linguaggi, rispetto a quelle del Web semantico, ma le regole da seguire per rendere più facilmente disponibili e raggiungibili i dati sul Web sia da esseri umani sia da applicazioni software. Di seguito si spiegheranno brevemente le principali tecnologie Web utilizzate per i Linked Data, per chiarire come è possibile sfruttare il collegamento semantico tra dataset eterogenei, che aumenti le possibilità di interrogazione e analisi dei dati da parte sia dei cittadini sia dei decisori, e permetta alle macchine di dedurre nuova conoscenza. 7 Shadbolt, N., Hall, W. and Berners-Lee, T., "The semantic web revisited." Intelligent Systems, IEEE 21.3 (2006), pp Berners-Lee, T., "Linked Data", op. cit. 9 Legge 17 dicembre 2012 n.221 Agenda Digitale Linked Open Data 5

8 2.1.3 Le tecnologie Come stabilito dalle quattro regole dei LOD il primo passo è identificare univocamente con un indirizzo Web le risorse pubblicate. Tale indirizzo è un URI (Uniform Resource Identifier), di cui un URL (Uniform Resource Locator) è una specializzazione, ed è una stringa di testo la cui generica struttura standardizzata è le seguente: ed un esempio di URI è il seguente: <scheme name>:<hierarchical part>[? <query> ][ # <fragment> ] Gli URI quindi devono rispettare uno schema condiviso ed essere rintracciabili sul Web attraverso il protocollo standard HTTP. Le risorse pubblicate (come dati sul Web), devono essere codificate con il modello RDF (Resource Description Framework), linguaggio standard per il trattamento della semantica nel Web. Quindi i dataset open devono essere trasformati in dataset di triple RDF, e connessi mediante link RDF ad altri dati presenti in altri dataset RDF, realizzando quindi una rete di Linked Data. Il modello RDF descrive le relazioni che intercorrono tra gli oggetti (le risorse) e prende in considerazione solo relazioni binarie, le più semplici, nelle quali un soggetto e un oggetto sono messi in una certa relazione tra loro. La relazione è anche detta predicato, poiché da un punto di vista linguistico essa coinvolge un verbo. La sequenza quindi di soggetto, predicato e oggetto viene denominata tripla. La relazione tra due oggetti può essere rappresentata in un grafo in cui una linea (il predicato) collega due elementi (soggetto e oggetto) (vedi figura 1). La tripla è l'elemento base dei grafi RDF. Figura 1 Esempio di grafo RDF Tale rappresentazione grafica non è però adatta all'elaborazione automatica, è necessario che sia formalizzata in modo testuale secondo determinate sintassi o formati. Tale formalizzazione è chiamata serializzazione RDF, e può essere scritta secondo i formati RDF/XML, N3, Turtle, ecc. In tali serializzazioni ogni tripla è una "frase", o statement, e più frasi enunciate di seguito rappresentano la serializzazione di un grafo. 6 Agenda Digitale Linked Open Data

9 In RDF un soggetto è identificato da un URI, il predicato è un elemento della classe Property, e l'oggetto può essere un URI o una stringa di testo. Nel grafo di figura 1 si rappresenta una risorsa, identificata con l'uri che è una pagina Web che fornisce informazioni sul racconto "La Metamorfosi", collegata attraverso tre predicati a tre altre risorse, due oggetti testuali (l'abstract del racconto e l'etichetta del titolo) e un URI che identifica la pagina con informazioni sull'autore del racconto, Franz Kafka. Le triple RDF dell'esempio dicono però soltanto che "La Metamorfosi" ha un abstract, un'etichetta e un autore che si chiama Franz Kafka, non dicono né che è un racconto, né il significato del concetto racconto o autore. Per far ciò, per far comprendere ad applicazioni software il significato di tali, e altri, concetti, è necessario utilizzare linguaggi quali RDF-S (RDF Schema) e OWL (Web Ontology Language) per definire dei vocabolari (noti come ontologie) comprensibili alle applicazioni, con i quali si esprimono relazioni tra termini di un dominio e il significato sia delle relazioni sia dei termini. Con RDF-S è perciò possibile definire una relazione di sotto-classe, quando una classe è figlia di una classe padre, oppure definire il dominio e il co-dominio di una relazione, cioè su quali classi di concetti opera una certa relazione. OWL, come il suo successore OWL2, è stato sviluppato dal W3C per fornire ancora più espressività a RDF e RDF-S, grazie al fatto che sfrutta la potenza espressiva delle logiche descrittive. Con questi linguaggi, sviluppati dalla comunità del Web semantico, è possibile quindi descrivere le risorse pubblicate sul Web in termini di concetti e relazioni e far comprendere il loro significato alle macchine, quindi le risorse diventano sia machine-readable sia machine-processable. In questo modo i dati pubblicati in formato RDF e descritti da un vocabolario in OWL, l'ontologia del dominio dei dati, raggiungono le 4 stelle della scala Berners-Lee. Per arrivare a completare la scale delle 5 stelle è necessario che i dati siano accessibili e interrogabili attraverso un altro linguaggio standard del Web semantico, SPARQL (acronimo di SPARQL Protocol and RDF Query Language) e che siano linkati ad altri dataset. A questo scopo è necessario creare un endpoint SPARQL, cioè un servizio Web da cui poter accedere ai dati attraverso delle interrogazioni (query) scritte in SPARQL, che è un linguaggio e protocollo di interrogazione di dati in RDF. In termini più astratti, si può dire che SPARQL consente di fare graph pattern matching all'interno di dati RDF. La sintassi di SPARQL è simile a quella del linguaggio SQL e analogamente è un linguaggio difficile da utilizzare per utenti non esperti, perché basa la rappresentazione della query sul concetto di tripla RDF, e per interrogare correttamente un dataset RDF bisogna conoscerne la struttura, le proprietà utilizzate ed i valori dei concetti. Così come SQL riflette, nella rappresentazione della query, il modello relazionale sottostante, allo stesso modo SPARQL rappresenta la query sul concetto di tripla e di grafo (modello di RDF). SPARQL è un linguaggio abbastanza ampio ed articolato, è possibile impostare delle ricerche utilizzando il pattern a triple: <classe> <relazione> <classe> (dominio, relazione, co-dominio), e la risposta alla query sono tutte le triple che istanziano il pattern. Ai fini della rappresentazione di una query SPARQL, un pattern è composto dalla sequenza di tre elementi, ogni elemento può essere un termine RDF o una variabile. Le variabili sono precedute dal carattere "?" o dal carattere"$" e possono trovarsi in qualunque posizione all'interno del pattern. Agenda Digitale Linked Open Data 7

10 La struttura di una query in SPARQL è la seguente: SELECT elenco di ciò che si vuole ottenere FROM quale file OWL/RDF si utilizza per la ricerca WHERE condizioni che permettono di rintracciare ciò che si sta cercando. Un qualsiasi SPARQL client può quindi interrogare un endpoint SPARQL con query riguardanti un grafo RDF. Le query esprimono le caratteristiche che un sottografo (un insieme di connessioni tra risorse di un certo tipo e con certe caratteristiche) del dataset RDF deve avere. Le risposte alle query sono tutti quei sottografi del grafo RDF che soddisfano le caratteristiche volute. Un secondo punto critico del processo di creazione di LOD è rappresentato dai link RDF che servono a collegare un dataset ad altri dataset pubblicati da altri soggetti. Per identificare correttamente quali link utilizzare è necessario un ampio sforzo di analisi dei dati e ricerca sul Web, e soprattutto di supervisione umana nell'inserimento manuale di tali link. Esistono degli strumenti che supportano l'identificazione di tali link, ma non consentono ancora l'inserimento automatico e corretto degli stessi. Per far fronte a ciò la comunità dei LOD ha individuato alcune proprietà (predicati di triple) che possono essere utilizzate come link per collegare diversi dataset. Il loro utilizzo condiviso e la loro generalità ne hanno fatto uno standard de facto, alcune di esse sono: owl:sameas che stabilisce che due individui (URI) si riferiscono allo stesso concetto; rdfs:seealso, foaf:knows, foaf:based_near, foaf:topic_interest ecc. Nel seguito del documento si spiegherà meglio questo punto critico. Per riassumere, per creare LOD a 5 stelle devono essere seguite queste linee guida: Non semplici dati ma concetti; I concetti sono rappresentati in triple RDF e definiti da ontologie; I dati strutturati sono memorizzati in appositi triplestore RDF interrogabili via SPARQL endpoint; I diversi dataset devono essere collegati con link RDF; Riusare il più possibile termini di vocabolari noti; Creare nuovi termini solo se strettamente necessario LOD cloud La creazione e la pubblicazione di dataset in formato LOD sul Web ha generato una grande mole di dati e sempre più enti, pubblici e privati, continuano a pubblicarne secondo le direttive del W3C. Nell ottobre 2007, i dataset sul Web consistevano di oltre due miliardi di triple RDF, unite da oltre due milioni di collegamenti RDF. Nel settembre 2010, questi dati erano cresciuti a 25 miliardi di triple RDF, linkate da circa 395 milioni di link RDF. Nel settembre 2011 sono arrivati a più di 31 miliardi di triple RDF e più di 500 milioni di link RDF 10. I collegamenti tra diversi dataset vengono graficamente rappresentati da una grande nuvola chiamata LOD cloud diagram, in cui vi è la visualizzazione interattiva dei gruppi di dataset interoperabili (figura 2) Agenda Digitale Linked Open Data

11 Figura 2 LOD cloud diagram Il diagramma LOD cloud mostra le categorie di dataset, che convergono nello CKAN 11, un catalogo di dataset Open Data e Linked Open Data gestito dalla Open Knowledge Foundation. L immagine della LOD cloud è solo uno dei possibili scenari in cui i LOD possono favorire l interoperabilità tra dataset. Le possibilità sono infinite, se si pensa alla immensa quantità di LOD già presenti nel Web come, ad esempio, DBpedia.org, Wikipedia, Geonames 12, MusicBrainz 13, WordNet 14, la bibliografia DBLP 15 ecc Agenda Digitale Linked Open Data 9

12 Da un punto di vista dei domini coperti dalle triple presenti nella LOD cloud, si può notare dal grafico di figura 3 che la maggior parte delle triple sono relative a dati di pubbliche amministrazioni (Government), seguite da quelli geografici e cross-domain. Figura 3 Distribuzione di triple per dominio La LOD cloud ha come suo centro il progetto DBpedia, nato nel 2007 presso l'università di Berlino, con l'obiettivo di estrarre dati strutturati da Wikipedia e pubblicarli sul Web in formato LOD. A questo progetto si sono collegati tutti gli altri progetti che hanno l'obiettivo di pubblicare LOD o di sfruttare i LOD per la creazione di applicazioni e servizi. Esiste dal 2010 anche la versione italiana di DBpedia 16, che prende i dati dalla versione italiana di Wikipedia, ed ha lo stesso obiettivo della versione ufficiale, di essere il fulcro e il cuore del Web of data dei LOD italiani. Alcuni degli enti che pubblicano LOD rendono disponibili anche le ontologie che descrivono la loro semantica, tra questi DBpedia, Geonames, UMBEL 17 e YAGO 18, che possono essere riutilizzate per altri dataset (come si spiegherà più avanti). Da alcune osservazioni empiriche e da molti articoli presenti in letteratura 19 si evince che la maggior parte dei dati presenti in LOD cloud fa riferimento a poche ontologie, o parti di ontologie, e quindi sono pochi gli enti che oltre a pubblicare dati sviluppa anche ontologie contestuali. Questo è uno dei temi aperti della ricerca sui LOD e sulle ontologie, in particolare sul problema dell'integrazione a livello di schema ontologico e del loro riutilizzo nei LOD LOD in Italia Dall'analisi dello stato dell'arte dei dataset in formato open, prodotti e pubblicati dagli enti locali italiani, si rileva che attualmente sono stati pubblicati più di dataset 21. Regione Lombardia pubblica più di 720 dataset. Dal punto di vista della qualità secondo lo schema di Berners-Lee, la maggior parte dei dataset pubblicati in Italia (7286 pari a quasi 70%) raggiunge le 3 stelle (figura 4), e molti sono pubblicati con licenza libera (come per esempio la CC0, CC-BY, IODL 2.0), quindi possiedono già un alto livello di riusabilità. A livello nazionale però soltanto il 5% dei dataset raggiunge attualmente le 5 stelle cfr.: Jain, P., Hitzler, P., Yeh, P. Z., Verma, K., & Sheth, A. P. (2010) Linked Data Is Merely More Data. In AAAI Spring Symposium: linked data meets artificial intelligence. 20 cfr.: Jain, P., Hitzler, P., Sheth, A. P., Verma, K., & Yeh, P. Z. (2010) Ontology alignment for linked open data. In The Semantic Web ISWC 2010 (pp ). Springer Berlin Heidelberg. 21 Dati aggiornati aprile 2014, cfr. 10 Agenda Digitale Linked Open Data

13 Figura 4 Livello di qualità Open Data in Italia Gli enti che pubblicano LOD a 5 stelle in Italia sono principalmente enti Statali: CNR, Camera, Senato, Archivio generale dello Stato, qualche Comune e tra le università la sola è l'università di Messina. Quindi attualmente nessuna regione italiana pubblica LOD (figura 5). Figura 5 Enti che pubblicano LOD in Italia L'aumento della quantità e della qualità dei dataset in LOD porterebbe un valore aggiunto a tutto lo stato degli open data italiani. Inoltre il raggiungimento di tale obiettivo porterebbe le Pubbliche amministrazioni italiane ad allinearsi al modello europeo di interoperabilità semantica dei servizi erogati (EIF), secondo le direttive dell'agenda Digitale Europea Agenda Digitale Europea, Agenda Digitale Linked Open Data 11

14 2.1.6 LOD casi di successo Come detto sopra la LOD cloud rappresenta uno scenario di dati disponibili e linkati, riutilizzabili per la creazione di nuove applicazioni, servizi, siti. Tra le iniziative create con l'utilizzo dei LOD una delle migliori e più citate è il sito BBC Music 23 che sfrutta i dati musicali della radio inglese BBC linkati ad altre risorse disponibili nella LOD cloud, quali per esempio DBpedia, Musicbrainz, DiscoGS (figura 6). Facendo una ricerca nel motore del sito, per esempio scrivendo il nome di un artista, si ottengono informazioni derivanti da quelle fonti, il tutto sfruttando l'html e un'interfaccia semplice ed intuitiva (figura 7). Figura 6 Dataset LOD collegati a BBC Music Figura 7 Screenshot da BBC Music Agenda Digitale Linked Open Data

15 Un'iniziativa italiana da citare è il Portale storico della Camera dei Deputati 24 (figura 8), che sfrutta i dati LOD del sito dati.camera.it e fornisce un agile e utile strumento di navigazione della storia del Parlamento italiano attraverso i nomi dei deputati, le legislature, gli atti e i documenti prodotti. Esso offre quindi molteplici chiavi di lettura dei dataset, che possono essere selezionati e consultati attraverso un'intuitiva navigazione basata su filtri a "faccette". Figura 8 Screenshot dal Portale Storico Camera dei Deputati Entrambi questi esempi sono siti che gestiscono e visualizzano informazioni derivanti da risorse Web in formato LOD senza costringere l'utente a scrivere query in SPARQL, che restano nascoste all'utente, e che vengono eseguite sulla base dei filtri e dei menu scelti dall'utente. 24 Agenda Digitale Linked Open Data 13

16 2.2 Strumenti adottati Introduzione In questa sezione si elencano gli strumenti software utilizzati durante il progetto ITLab per la parte Linked Open Data. Si tratta di software open source sviluppati e manutenuti da comunità attive e collaborative sul Web. Alcuni di questi sono diventati col tempo quasi strumenti di riferimento per la comunità, si pensi all'enorme utilizzo di Protégé come ontology editor o Open Link Virtuoso come server di endpoint SPARQL. Si fornirà di ciascun strumento le indicazioni della versione utilizzata nel progetto e i benefici e i punti critici incontrati Protégé Protégé 25 è una soluzione open source scritta in Java sviluppata dall Università di Stanford (e in seguito con l'aiuto dell'università di Manchester) per la definizione e manutenzione di ontologie (schemi, vocabolari) in RDF/OWL e OWL2. È un editor di ontologie la cui architettura è basata su plug-in estendibili. Esso ha un'interfaccia grafica intuitiva ed è supportato da una nutrita comunità. L attenzione è posta su OWL, quindi i Linked Data in RDF puro hanno spesso qualche problema a essere gestiti in maniera adeguata. Il limite principale di Protégé è la mancanza di un plug-in per utilizzare SPARQL, dovuta appunto all'approccio OWLcentric. Protégé implementa un buon debugger logico per le ontologie e un motore di reasoning per eseguire inferenze. Inoltre permette di importare ontologie esterne per la creazione di nuove ontologie. La versione adottata nel progetto ITLab è la 4.3. Per la spiegazione dell'utilizzo di Protégé si rimanda alla sezione dedicata alla costruzione dell'ontologia LOD Refine OpenRefine 26 è un potente strumento software open source nato con lo scopo di facilitare le procedure di pulizia dei dati. In precedenza il progetto che ha portato allo sviluppo di questa applicazione era denominato Google Refine. OpenRefine mette a disposizione dell utente un insieme molto vasto di funzionalità che consentono il caricamento dei dati (da csv, xml, ecc.), la manipolazione della tabella generata dopo l import (aggiunta/rimozione di colonne/righe, manipolazione dei nomi di righe e colonne, modifica dei valori dei campi, ecc.), l analisi dei dati componenti il dataset importato (profiling, clustering). Caratteristica fondamentale di OpenRefine è che, grazie alla natura open source del progetto (che ne consente il riuso del codice in altri contesti) e grazie alla sua estendibilità a nuove funzionalità (attraverso lo sviluppo di Extensions ) lo strumento diviene, oltre che agile e immediato da utilizzare, anche versatile e adattabile. Nelle attività del laboratorio è stato utilizzato LODRefine 27, una distribuzione di OpenRefine che include già installate una lunga serie di Extensions. Nel nostro caso specifico, le estensioni di interesse sono quelle relative alla DERI RDF Extension 28. Questa estensione consente di effettuare due operazioni fondamentali per la manipolazione dei dataset e la loro trasformazione in LOD: la costruzione di RDF Schema partendo Agenda Digitale Linked Open Data

Enrico Fagnoni BOTK IN A NUTSHELL

Enrico Fagnoni <e.fagnoni@e-artspace.com> BOTK IN A NUTSHELL Enrico Fagnoni BOTK IN A NUTSHELL 20/01/2011 1 Business Ontology ToolKit Business Ontology Toolkit (BOTK) è un insieme estensibile di strumenti per realizzare applicazioni basate

Dettagli

Web Semantico e Linked (Open) Data: dal Web dei documenti al Web dei dati. Tommaso Di Noia

Web Semantico e Linked (Open) Data: dal Web dei documenti al Web dei dati. Tommaso Di Noia Web Semantico e Linked (Open) Data: dal Web dei documenti al Web dei dati Tommaso Di Noia Politecnico di Bari http://sisinflab.poliba.it/dinoia/ t.dinoia@poliba.it Il Web dei documenti Il Web dei documenti:

Dettagli

Linked Open Data: pubblicazione, arricchimento semantico e linking di dataset pubblici attraverso il sistema MOMIS

Linked Open Data: pubblicazione, arricchimento semantico e linking di dataset pubblici attraverso il sistema MOMIS Università degli Studi di Modena e Reggio Emilia Ingegneria Enzo Ferrari Corso di Laurea Magistrale (D. M. 270/04) in Ingegneria Informatica Linked Open Data: pubblicazione, arricchimento semantico e linking

Dettagli

Forum PA. Open Data INPS

Forum PA. Open Data INPS Forum PA Roma, 9-12 maggio 2011 Open Data INPS Modelli di sviluppo per l Open Government nella PA 10 maggio 2011 pag. 1 Portale INPS Una piattaforma per i dati del settore pubblico: 10 maggio 2011 pag.

Dettagli

Linee guida per la valorizzazione del patrimonio informativo pubblico Giorgia Lodi

Linee guida per la valorizzazione del patrimonio informativo pubblico Giorgia Lodi Linee guida per la valorizzazione del patrimonio informativo pubblico Giorgia Lodi Smart City Exhibition 2013 Dall informazione pubblica alla crescita economica: gli open data come veicolo di sviluppo

Dettagli

Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07

Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07 Relazione Pinakes3 Analisi modello di business (BOZZA) di Valeriano Sandrucci 08/09/07 1. Introduzione...3 1.2. Application vs Tool... 3 2. Componenti logiche di un modello... 6 3. Ontologie e Semantic

Dettagli

1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una

1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una 1. Rappresentazione della conoscenza 2. Ontologie 3. Usi delle ontologie 4. Progettazione di un ontologia 5. Esempio di progettazione di una ontologia 1 Rappresentazione della conoscenza Il problema di

Dettagli

Forum PA. Open Data INPS

Forum PA. Open Data INPS Forum PA Roma, 16-19 maggio 2012 Open Data INPS Modelli di sviluppo per l Open Government nella PA 10 maggio 2011 pag. 1 Portale INPS Una piattaforma per i dati del settore pubblico: 15 marzo 2012 l Inps

Dettagli

3.1 Introduzione al Web Semantico

3.1 Introduzione al Web Semantico Informatica Applicata 3.1 Introduzione al Web Semantico Antonella Poggi Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO FILOLOGICHE E GEOGRAFICHE 3.1 Introduzione al Web Semantico*

Dettagli

Creare ontologie ONTOLOGIE, DESCRIPTION LOGIC, PROTÉGÉ STEFANO DE LUCA

Creare ontologie ONTOLOGIE, DESCRIPTION LOGIC, PROTÉGÉ STEFANO DE LUCA Creare ontologie ONTOLOGIE, DESCRIPTION LOGIC, PROTÉGÉ STEFANO DE LUCA Punto di partenza: materia per ragionare Gli agenti intelligenti possono usare tecniche deduttive per raggiungere il goal Per fare

Dettagli

SPCData: la nuvola dei dati della Pubblica Amministrazione Italiana

SPCData: la nuvola dei dati della Pubblica Amministrazione Italiana SPCData: la nuvola dei dati della Pubblica Amministrazione Italiana Intervento della sessione Dall'informazione pubblica alla crescita economica: gli open data come veicolo di sviluppo - 16 Ottobre 2013

Dettagli

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB

SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica SVILUPPO ONTOLOGIE PER LA GESTIONE DOCUMENTALE E LORO INTEGRAZIONE ALL INTERNO DI UNA PIATTAFORMA WEB Relatore Chiarissimo

Dettagli

Semantica: un sistema per l indicizzazione, il retrieval semantico di learning objects e la generazione automatica di corsi didattici

Semantica: un sistema per l indicizzazione, il retrieval semantico di learning objects e la generazione automatica di corsi didattici Tesi di laurea Semantica: un sistema per l indicizzazione, il retrieval semantico di learning objects e la generazione automatica di corsi didattici Anno Accademico 2007/2008 Relatori Ch.mo prof. Angelo

Dettagli

Stars Factory: LOD in RDF Data Cube Vocabulary

Stars Factory: LOD in RDF Data Cube Vocabulary Stars Factory: LOD in RDF Data Cube Vocabulary Open Data Ground plug-in Claudia Corcione, Paola De Caro, Stefano De Luca LOD 2014, 20-21/02/2014 2 Evodevo Evodevo è una società che offre servizi, sviluppa

Dettagli

Dati per il Web semantico

Dati per il Web semantico Politecnico di Bari t.dinoia@poliba.it Dati per il Web semantico Dublin Core Metadata Element Set Dublin Core: insieme di metadati sviluppati in seno alla Dublin Core Metadata Initiative Pensato per la

Dettagli

Introduzione al Semantic Web

Introduzione al Semantic Web Corso di Laurea Specialistica in Ingegneria Gestionale Corso di Sistemi Informativi Modulo II A. A. 2013-2014 Giuseppe Loseto Dal Web al Semantic Web 2 Dal Web al Semantic Web: Motivazioni Il Web dovrebbe

Dettagli

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web

Il World Wide Web. Il Web. La nascita del Web. Le idee di base del Web Il World Wide Web Il Web Claudio Fornaro ver. 1.3 1 Il World Wide Web (ragnatela di estensione mondiale) o WWW o Web è un sistema di documenti ipertestuali collegati tra loro attraverso Internet Attraverso

Dettagli

Strumenti di modellazione. Gabriella Trucco

Strumenti di modellazione. Gabriella Trucco Strumenti di modellazione Gabriella Trucco Linguaggio di modellazione Linguaggio formale che può essere utilizzato per descrivere (modellare) un sistema Il concetto trova applicazione soprattutto nell

Dettagli

Introduzione ai lavori del Gruppo di studio sui metadati descrittivi. Cristina Magliano

Introduzione ai lavori del Gruppo di studio sui metadati descrittivi. Cristina Magliano Introduzione ai lavori del Gruppo di studio sui metadati descrittivi Cristina Magliano Il Gruppo di lavoro sui metadati descrittivi ha iniziato l attività partendo dall'analisi del primo standard di metadati

Dettagli

SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data

SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data SHARE CATALOGUE: le biblioteche universitarie in Linked Open Data Roberto delle Donne (Università degli Studi di Napoli Federico II) Tiziana Possemato (@Cult) SHARE Scholarly Heritage and Access to Research

Dettagli

Convegno delle Stelline 20ᵃ edizione

Convegno delle Stelline 20ᵃ edizione Convegno delle Stelline 20ᵃ edizione RDA e Linked data: un binomio naturale. Linee guida e tecnologie per gli ILS di nuova generazione Tiziana Possemato @Cult I dati delle biblioteche nel web semantico

Dettagli

Open data, servizi digitali e trasferimento di conoscenza

Open data, servizi digitali e trasferimento di conoscenza Open data, servizi digitali e trasferimento di conoscenza Tiziana Catarci Maurizio Lenzerini Dipartimento Dipartimento di di Ingegneria Ingegneria Informatica Informatica Automatica e Gestionale "Antonio

Dettagli

Linked Open Data Introduzione e nuovi punti di vista Silvia Mazzini Antonella Pagliarulo smazzini@regesta.com apagliarulo@regesta.

Linked Open Data Introduzione e nuovi punti di vista Silvia Mazzini Antonella Pagliarulo smazzini@regesta.com apagliarulo@regesta. Linked Open Data Introduzione e nuovi punti di vista Silvia Mazzini Antonella Pagliarulo smazzini@regesta.com apagliarulo@regesta.com Library Library Data Linked Data Library Linked Data W3C Incubator

Dettagli

Un portale semantico per i Beni Culturali

Un portale semantico per i Beni Culturali Un portale semantico per i Beni Culturali A. Ciapetti, D. Berardi, A. Donnini, M. Lorenzini, M.E. Masci, D. Merlitti, S. Norcia, F. Piro (Etcware) M. De Vizia Guerriero, O. Signore (CNR W3C Italia) EVA

Dettagli

Semantic Web: linguaggi e tecnologie

Semantic Web: linguaggi e tecnologie Corso di Laurea Specialistica in Ingegneria Gestionale Corso di Sistemi Informativi A. A. 2012-2013 Semantic Web: linguaggi e tecnologie Eufemia TINELLI Dal Web al Semantic Web: Motivazioni Il Web dovrebbe

Dettagli

Rappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0

Rappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0 Rappresentazione della Conoscenza Lezione 10 Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0 Sistemi ed applicazioni Sistemi di rappresentazione della conoscenza basati su logiche descrittive.

Dettagli

Descrizione Formale Esplicita Dominio

Descrizione Formale Esplicita Dominio Ontologia Abbiamo visto che tassonomie e tesauri fissano una semantica. Per arricchire la semantica si deve passare a modelli concettuali e teorie logiche. Un modello concettuale è il modello di una particolare

Dettagli

TRADUZIONE. Tiziana Possemato. Il progetto ITACH@

TRADUZIONE. Tiziana Possemato. Il progetto ITACH@ OpLiDaF Open Linked Data Framework: una piattaforma per la creazione e la pubblicazione di linked data Tiziana Possemato Il progetto ITACH@ Il progetto ITACH@, Innovative Technologies And Cultural Heritage

Dettagli

Informatica Applicata 3.3 OWL. Antonella Poggi. Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO FILOLOGICHE E GEOGRAFICHE

Informatica Applicata 3.3 OWL. Antonella Poggi. Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO FILOLOGICHE E GEOGRAFICHE Informatica Applicata 3.3 OWL Antonella Poggi Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO FILOLOGICHE E GEOGRAFICHE The Semantic Web Tower Antonella Poggi Pagina 2 Le ontologie

Dettagli

Indice INTRODUZIONE -------------------------------------------------------------------------------------------------------------- 3

Indice INTRODUZIONE -------------------------------------------------------------------------------------------------------------- 3 ORGANIZZAZIONE DI CONTENUTI MULTIMEDIALI E WEB SEMANTICO PROF. ANTONIO TUFANO Indice 1 INTRODUZIONE --------------------------------------------------------------------------------------------------------------

Dettagli

ETICA 2013-2015. Migliorare la performance e accrescere la trasparenza attraverso le nuove tecnologie. Formati aperti

ETICA 2013-2015. Migliorare la performance e accrescere la trasparenza attraverso le nuove tecnologie. Formati aperti ETICA 2013-2015 Migliorare la performance e accrescere la trasparenza attraverso le nuove tecnologie Formati aperti Autore: Sergio Agostinelli, Piero Zilio Creatore: Formez PA, Progetto ETICA 2013-2015

Dettagli

Indice Introduzione --------------------------------------------------------------------------------------------------------------------- 3

Indice Introduzione --------------------------------------------------------------------------------------------------------------------- 3 INSEGNAMENTO DI INFORMATICA II LEZIONE II LE LIBRERIE DIGITALI PROF. GIUSEPPE DE SIMONE Indice 1 Introduzione ---------------------------------------------------------------------------------------------------------------------

Dettagli

Smart City: Città Ideale 2.0

Smart City: Città Ideale 2.0 Smart City: Città Ideale 2.0 Smart City è uno spazio urbano ben diretto, che affronta le sfide della globalizzazione e della crisi economica con lo sviluppo sostenibile, con attenzione alla coesione sociale,

Dettagli

Architettura Open Data

Architettura Open Data Smart Cities and Communities and Social Innovation Bando MIUR D.D. 391/Ric. del 5 luglio 2012 Open City Platform Architettura Open Data OCP e Open Data architecture OCP e Open Service OCP intende favorire

Dettagli

Formazione sistema editoriale CMS

Formazione sistema editoriale CMS Ufficio Società dell'informazione Nome del Progetto Acronimo del Progetto Formazione sistema editoriale CMS Documento Data di stesura Maggio 2010 Versione 1.2 Sommario 1 Scopo... 3 2 Campo di applicazione...

Dettagli

La tecnologia GIS Roberto Cavallin

La tecnologia GIS Roberto Cavallin La tecnologia GIS Roberto Cavallin Dati territoriali L art. 59 del Codice dell Amministrazione Digitale (CAD) definisce i dati territoriali come: qualunque informazione geograficamente localizzata Secondo

Dettagli

Programmabilità di rete con l'infrastruttura Cisco basata sulle applicazioni

Programmabilità di rete con l'infrastruttura Cisco basata sulle applicazioni White paper Programmabilità di rete con l'infrastruttura Cisco basata sulle applicazioni Panoramica Questo documento analizza il supporto alla programmabilità nell'infrastruttura ACI (Application Centric

Dettagli

Corso di Laurea Specialistica in Ingegneria Informatica. Corso di Linguaggi e Tecnologie Web A. A. 2011-2012. Real world Semantics.

Corso di Laurea Specialistica in Ingegneria Informatica. Corso di Linguaggi e Tecnologie Web A. A. 2011-2012. Real world Semantics. Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 Real world Semantics Eufemia TINELLI Pubblicare metadati su Web Pubblicare file RDF sul web MIME-type

Dettagli

Ontologie e dati per il Web semantico

Ontologie e dati per il Web semantico Ontologie e dati per il Web semantico Dublin Core Metadata Element Set Dublin Core: insieme di metadati sviluppati in seno alla Dublin Core Metadata Initiative Pensato per la descrizione di risorse (inizialmente

Dettagli

I punti preliminari da trattare

I punti preliminari da trattare Alma Mater Studiorum Università di Bologna Facoltà di Economia - Bologna CLEA, CLED, CLEF,CLEM Prof. Jacopo Di Cocco Idoneità informatica e Sistemi informatici Parte prima Il word wide web e l informazione

Dettagli

Scarica la versione di prova gratuita di Datapolis Workbox dal sito www.datapolis.com/it-it/workbox

Scarica la versione di prova gratuita di Datapolis Workbox dal sito www.datapolis.com/it-it/workbox Datapolis Workbox 2010 per Microsoft Sharepoint Datapolis Workbox è uno strumento grafico user-friendly per modellare e gestire i processi gestionali, il flusso di informazioni e di documenti nell'ambiente

Dettagli

Sistemi Informativi e WWW

Sistemi Informativi e WWW Premesse Sistemi Informativi e WWW WWW: introduce un nuovo paradigma di diffusione (per i fornitori) e acquisizione (per gli utilizzatori) delle informazioni, con facilità d uso, flessibilità ed economicità

Dettagli

Motori di ricerca di ultima generazione: il web semantico

Motori di ricerca di ultima generazione: il web semantico Motori di ricerca di ultima generazione: il web semantico Quando parliamo di vie di comunicazione di un sistema EWS, è opportuno pensare a quale strada può essere la più rapida per il recupero dei dati

Dettagli

Protégé. Cos è un ontologia

Protégé. Cos è un ontologia Protégé Cos è un ontologia Un ontologia è una descrizione formale di concetti in un dominio (classi) le proprietà di ciascun concetto (slot) le restrizioni sugli slot (facets) ONTOLOGIA + UN INSIEME DI

Dettagli

Cultura Tecnologica di Progetto

Cultura Tecnologica di Progetto Cultura Tecnologica di Progetto Politecnico di Milano Facoltà di Disegno Industriale - DATABASE - A.A. 2003-2004 2004 DataBase DB e DataBase Management System DBMS - I database sono archivi che costituiscono

Dettagli

Breve descrizione del prodotto

Breve descrizione del prodotto Breve descrizione del prodotto 1. Il software AquaBrowser Library...2 1.1 Le funzioni di Search Discover Refine...3 1.2 Search: la funzione di ricerca e di presentazione dei risultati...3 1.2.1 La configurazione

Dettagli

Le nuove tecnologie dell informazione: verso il Social Semantic Web. Roberto Boselli Alessandria 04-05-2007

Le nuove tecnologie dell informazione: verso il Social Semantic Web. Roberto Boselli Alessandria 04-05-2007 Le nuove tecnologie dell informazione: verso il Social Semantic Web Roberto Boselli Alessandria 04-05-2007 Outline Web 2.0 e Semantic Web Social Software Semantica e Ontologie SEDIMENTO 2 Obiettivi Aggiungere

Dettagli

Facoltà di Scienze MM. FF. NN.

Facoltà di Scienze MM. FF. NN. UNIVERSITÀ DEGLI STUDI DI PALERMO Facoltà di Scienze MM. FF. NN. Corso di Laurea in Informatica Linked Open Data: un caso di studio sui dati del CISI Tesi di laurea di Giovanni Panascì Matricola 0524459

Dettagli

RDF Triplestore Systems

RDF Triplestore Systems Facoltà di Ingegneria Corso di Studi in Ingegneria Informatica Elaborato finale in basi di dati RDF Triplestore Systems Anno Accademico 2013-2014 Candidato Francesco Palumbo Matr. N46000140 _ Dedica _

Dettagli

Categorie e oggetti. Il Web semantico. Ontologie di dominio. Le motivazioni del web semantico. Web semantico e logiche descrittive

Categorie e oggetti. Il Web semantico. Ontologie di dominio. Le motivazioni del web semantico. Web semantico e logiche descrittive Categorie e oggetti Web semantico e logiche descrittive M. Simi, 2014-2015 Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia Molti dei ragionamenti che si fanno sono sulle categorie piuttosto

Dettagli

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane Vantaggi e limiti delle folksonomie (difficoltà: *) Nel paragrafo 7.4 è stato introdotto il concetto di social

Dettagli

#SCE2014 ACADEMY. Linked Open Data: come fare, cosa serve. Diego Valerio Camarda. 24 ottobre 2014

#SCE2014 ACADEMY. Linked Open Data: come fare, cosa serve. Diego Valerio Camarda. 24 ottobre 2014 #SCE2014 ACADEMY Linked Open Data: come fare, cosa serve Diego Valerio Camarda 24 ottobre 2014 Premessa about me github.com/dvcama slideshare.com/diegovaleriocamarda twitter.com/dvcama linkedin.com/in/dvcama

Dettagli

Primi passi con Jamio Composer. Dall idea applicativa alla soluzione in pochi minuti

Primi passi con Jamio Composer. Dall idea applicativa alla soluzione in pochi minuti Primi passi con Jamio Composer Dall idea applicativa alla soluzione in pochi minuti Comporre una nuova soluzione applicativa Jamio Composer è l ambiente di modellazione della piattaforma Jamio. Le soluzioni

Dettagli

Verso l'interoperabilità semantica di IATE. Presentazione del caso di studio sul lessico dei Fondi strutturali e d'investimento Europei (SIE)

Verso l'interoperabilità semantica di IATE. Presentazione del caso di studio sul lessico dei Fondi strutturali e d'investimento Europei (SIE) OBJECTIFS, METHODOLOGIES ET PRATIQUES Daniela Vellutino Rodolfo Maslias Francesco Rossi Maria Pia Montoro Carmina Mangiacapre Verso l'interoperabilità semantica di IATE. Presentazione del caso di studio

Dettagli

Le prospettive dell Open Data

Le prospettive dell Open Data Le prospettive dell Open Data 28 febbraio 2012 Francesco Tortorelli La disponibilità dei dati Tra l 80% ed il 90% dei dati digitali sono stati creati negli ultimi 2 anni Mentre camminiamo, siamo in auto,

Dettagli

Automatic Ontology-Based Knowledge Extraction from Web Documents

Automatic Ontology-Based Knowledge Extraction from Web Documents Automatic Ontology-Based Knowledge Extraction from Web Documents 5 gennaio 2009 1 Introduzione Al ne di ottenere un eettivo WEB semantico bisogna essere in grado di costruire servizi che consentano l'estrazione

Dettagli

Seminario di Sistemi Distribuiti: RPC su SOAP

Seminario di Sistemi Distribuiti: RPC su SOAP Corso di Sistemi Distribuiti Prof. S. Balsamo Seminario di Sistemi Distribuiti: RPC su SOAP [ 777775] 1 INTRODUZIONE 3 2 RPC 3 3 SOAP (SIMPLE OBJECT ACCESS PROTOCOL) 3 4 UTILIZZO DI SOAP COME PROTOCOLLO

Dettagli

Pubblicazione di Linked Data in e-commerce: Progettazione e Sperimentazione (Riassunto)

Pubblicazione di Linked Data in e-commerce: Progettazione e Sperimentazione (Riassunto) Universitá degli Studi di Milano Bicocca Dipartimento di Informatica, Sistemistica e Comunicazione Corso di Laurea in Informatica Pubblicazione di Linked Data in e-commerce: Progettazione e Sperimentazione

Dettagli

INFIN OLTRE LA SEMPLICE ARCHIVIAZIONE

INFIN OLTRE LA SEMPLICE ARCHIVIAZIONE OLTRE LA SEMPLICE ARCHIVIAZIONE INFIN Ricezione, Acquisizione, Protocollazione, Classificazione, Condivisione, Distribuzione e Gestione dei processi documentali. I TUOI DOCUMENTI DIVENTANO INFORMAZIONI

Dettagli

KNOWLEDGE MANAGEMENT. Knowledge Management. Knowledge: : cos è. Dispense del corso di Gestione della Conoscenza d Impresa

KNOWLEDGE MANAGEMENT. Knowledge Management. Knowledge: : cos è. Dispense del corso di Gestione della Conoscenza d Impresa KNOWLEDGE MANAGEMENT Pasquale Lops Giovanni Semeraro Dispense del corso di Gestione della Conoscenza d Impresa 1/23 Knowledge Management La complessità crescente della società, l esubero di informazioni

Dettagli

PROGETTO NUOVO SITO WEB AREA UNIVERSITÀ

PROGETTO NUOVO SITO WEB AREA UNIVERSITÀ PROGETTO NUOVO SITO WEB AREA UNIVERSITÀ DOTT.SSA DOTT. ANNARITA MARZULLO ALESSANDRO MELCHIONNA Open Data COSA SONO GLI OPEN DATA SONO DATI CHE POSSONO ESSERE LIBERAMENTE UTILIZZATI, RIUTILIZZATI E RIDISTRIBUITI

Dettagli

Tesi disponibili nell ambito del progetto FP7 ARISTOTELE. Tesi disponibili nell ambito del progetto INDUSTRIA 2015 KITE.it

Tesi disponibili nell ambito del progetto FP7 ARISTOTELE. Tesi disponibili nell ambito del progetto INDUSTRIA 2015 KITE.it Tesi disponibili nell ambito del progetto FP7 ARISTOTELE Ambiente collaborativo per il design e l innovazione Il lavoro si concentrerà sullo sviluppo di specifici componenti di un ambiente collaborativo

Dettagli

Progetti di cooperazione internazionale e nazionale per la catalogazione e la riproduzione digitale

Progetti di cooperazione internazionale e nazionale per la catalogazione e la riproduzione digitale Progetti di cooperazione internazionale e nazionale per la catalogazione e la riproduzione digitale Rossella Caffo Direttore Istituto centrale per il catalogo unico delle biblioteche italiane Milano, 14

Dettagli

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE.

INFORMATICA. Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. INFORMATICA Applicazioni WEB a tre livelli con approfondimento della loro manutenzione e memorizzazione dati e del DATABASE. APPLICAZIONI WEB L architettura di riferimento è quella ampiamente diffusa ed

Dettagli

Dispensa di database Access

Dispensa di database Access Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di

Dettagli

XML metadati Semantic Web. Dall interoperabilità sintattica a quella semantica Fabio Ciotti

XML metadati Semantic Web. Dall interoperabilità sintattica a quella semantica Fabio Ciotti Dall interoperabilità sintattica a quella semantica Fabio Ciotti Una delle conseguenze più rilevanti della diffusione del Web è il passaggio definitivo dai sistemi informativi monade ai sistemi aperti

Dettagli

MODALITÀ DI FUNZIONAMENTO DEL CATALOGO SCHEMI ED ONTOLOGIE

MODALITÀ DI FUNZIONAMENTO DEL CATALOGO SCHEMI ED ONTOLOGIE MODALITÀ DI FUNZIONAMENTO DEL CATALOGO SCHEMI ED ONTOLOGIE Versione 1.0 funzionamento del Versione: 1. 0 INDICE 1. PREFAZIONE... 4 1.1. Autori... 4 1.2. Modifiche Documento... 4 1.3. Riferimenti... 5 1.4.

Dettagli

Internet e le Mappe Cognitive

Internet e le Mappe Cognitive Dott. Gianluca De Grandis www.deghi.com/coevo newcoevo@deghi.com 1.1 L organizzazione attuale dei siti Web Il World Wide Web fu inventato nel 1989 da Tim Berners-Lee 1 presso il CERN di Ginevra. Il progetto

Dettagli

Web Intelligence. Argomenti 10/5/2010. abaroni@yahoo.com

Web Intelligence. Argomenti 10/5/2010. abaroni@yahoo.com Web Intelligence Argomenti Cap.1 Introduzione Cap.2 Creazione/Modifica di QUERY (semplici,custom,unioni) Cap.3 Uso dei Filtri e delle Condizioni Slide 2 - Copyright 2007 Business Objects SA - All Rights

Dettagli

RICERCA DELL INFORMAZIONE

RICERCA DELL INFORMAZIONE RICERCA DELL INFORMAZIONE DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale DOCUMENTO risorsa continuativa

Dettagli

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE

L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Roccatello Ing. Eduard L ARCHIVIAZIONE E LA GESTIONE DATI ATTRAVERSO L INTERAZIONE TRA MICROSOFT ACCESS ED EXCEL 1 INTRODUZIONE Agenda Presentazione docente Definizione calendario Questionario pre corso

Dettagli

Applicazione: Share - Sistema per la gestione strutturata di documenti

Applicazione: Share - Sistema per la gestione strutturata di documenti Riusabilità del software - Catalogo delle applicazioni: Gestione Documentale Applicazione: Share - Sistema per la gestione strutturata di documenti Amministrazione: Regione Piemonte - Direzione Innovazione,

Dettagli

Release MOVIO SCMS. Versione Tutorial. Commenti Dichiarazione di copyright. Abstract Questo documento descrive in generale il backend di Movio

Release MOVIO SCMS. Versione Tutorial. Commenti Dichiarazione di copyright. Abstract Questo documento descrive in generale il backend di Movio Titolo Tutorial MOVIO: Backend introduzione Release MOVIO SCMS 1.00 Versione Tutorial 1.00 Data 09/02/2014 Autori e affiliation Rubino Saccoccio (Gruppometa) Commenti Dichiarazione di copyright Abstract

Dettagli

SOLUTION BRIEF CA ERwin Modeling. Come gestire la complessità dei dati e aumentare l'agilità del business

SOLUTION BRIEF CA ERwin Modeling. Come gestire la complessità dei dati e aumentare l'agilità del business SOLUTION BRIEF CA ERwin Modeling Come gestire la complessità dei dati e aumentare l'agilità del business CA ERwin Modeling fornisce una visione centralizzata delle definizioni dei dati chiave per consentire

Dettagli

Metadati e open data: Nuovi paradigmi per vecchie professioni

Metadati e open data: Nuovi paradigmi per vecchie professioni Metadati e open data: Nuovi paradigmi per vecchie professioni Giovanni Bergamin Biblioteca Nazionale Centrale di Firenze L uso del termine metadati si è affermato con il Web tra la fine e l inizio di questo

Dettagli

ALLEGATO 1. Linee Guida per la realizzazione del progetto MB OPEN DATA

ALLEGATO 1. Linee Guida per la realizzazione del progetto MB OPEN DATA ALLEGATO 1 Linee Guida per la realizzazione del progetto MB OPEN DATA INDICE FUNZIONE DELLE LINEE GUIDA 1 GOVERNO APERTO E DATI APERTI COME STRUMENTI DI TRASPARENZA 2 OPEN DATA 2 ORGANIZZAZIONE INTERNA

Dettagli

Informatica Documentale

Informatica Documentale Informatica Documentale Ivan Scagnetto (scagnett@dimi.uniud.it) Stanza 3, Nodo Sud Dipartimento di Matematica e Informatica Via delle Scienze, n. 206 33100 Udine Tel. 0432 558451 Ricevimento: giovedì,

Dettagli

PROGETTO - Ingegneria del Software. Università degli Studi di Milano Polo di Crema. Corso di laurea in Scienze Matematiche, Fisiche e Naturali

PROGETTO - Ingegneria del Software. Università degli Studi di Milano Polo di Crema. Corso di laurea in Scienze Matematiche, Fisiche e Naturali Università degli Studi di Milano Polo di Crema Corso di laurea in Scienze Matematiche, Fisiche e Naturali INFORMATICA Corso di Ingegneria del Software progetto IL SISTEMA CALENDAR Presentato al dott. Paolo

Dettagli

Portale Multicanale delle PA del territorio della Regione Emilia-Romagna: un inizio di rete semantica di informazioni

Portale Multicanale delle PA del territorio della Regione Emilia-Romagna: un inizio di rete semantica di informazioni Portale Multicanale delle PA del territorio della Regione Emilia-Romagna: un inizio di rete semantica di informazioni Grazia Cesari Regione Emilia-Romagna ForumPA Roma 10 Maggio 2006 Con il supporto di

Dettagli

DATA WAREHOUSING CON JASPERSOFT BI SUITE

DATA WAREHOUSING CON JASPERSOFT BI SUITE UNIVERSITÁ DEGLI STUDI DI MODENA E REGGIO EMILIA Dipartimento di Ingegneria di Enzo Ferrari Corso di Laurea Magistrale in Ingegneria Informatica (270/04) DATA WAREHOUSING CON JASPERSOFT BI SUITE Relatore

Dettagli

Open KIS- Servizi ad alta intensità di conoscenza

Open KIS- Servizi ad alta intensità di conoscenza Nell ambito del progetto Open Innovation, LIASES - Laboratorio di Informatica Applicata alle Scienze Economiche e Sociali Giorgio Rota, centro di servizi informatici dell'università di Torino che svolge

Dettagli

Dalla filosofia all informatica: Ontologia una concettualizzazione di un dominio condiviso

Dalla filosofia all informatica: Ontologia una concettualizzazione di un dominio condiviso Professionisti della conoscenza, www.cstadvising.com Per info: dott. Massimiliano Miglio +39 328.91.66.816 E-mail: advising@cstadvising.com m.miglio@cstadvising.com Dalla filosofia all informatica: Ontologia

Dettagli

CONVENZIONI DI NOMENCLATURA E SEMANTICA

CONVENZIONI DI NOMENCLATURA E SEMANTICA Sistema pubblico di cooperazione: CONVENZIONI DI NOMENCLATURA E SEMANTICA Versione 1.1 INDICE 1. MODIFICHE DOCUMENTO...3 2. OBIETTIVI E CONTESTO DI RIFERIMENTO... 4 2.1. Scopi del documento... 5 2.2. Note

Dettagli

Open Data in Trentino

Open Data in Trentino Open Data in Trentino Lorenzino Vaccari Provincia Autonoma di Trento Direzione Generale - I.D. in materia di Innovazione lorenzino.vaccari@provincia.tn.it Sommario Dati aperti, formati aperti e metadati:

Dettagli

Reingegnerizzazione ed evoluzione degli applicativi del settore civile della Giustizia finalizzata al Processo Telematico

Reingegnerizzazione ed evoluzione degli applicativi del settore civile della Giustizia finalizzata al Processo Telematico Ministero della Giustizia DIPARTIMENTO DELL ORGANIZZAZIONE GIUDIZIARIA, DEL PERSONALE E DEI SERVIZI DIREZIONE GENERALE PER I SISTEMI INFORMATIVI AUTOMATIZZATI Reingegnerizzazione ed evoluzione degli applicativi

Dettagli

Prima Parte. Università degli Studi di Napoli -- Classi, proprietà, individui e restrizioni. Gennaro Gambardella

Prima Parte. Università degli Studi di Napoli -- Classi, proprietà, individui e restrizioni. Gennaro Gambardella Università degli Studi di Napoli -- CDL in Informatica Basi di dati Multimediali Prima Parte Classi, proprietà, individui e restrizioni Gennaro Gambardella Tratto da Ontologie OWL: Teoria e Pratica di

Dettagli

Metodologia Classica di Progettazione delle Basi di Dati

Metodologia Classica di Progettazione delle Basi di Dati Metodologia Classica di Progettazione delle Basi di Dati Metodologia DB 1 Due Situazioni Estreme Realtà Descritta da un documento testuale che rappresenta un insieme di requisiti del software La maggiore

Dettagli

LABORATORIO di INFORMATICA

LABORATORIO di INFORMATICA Università degli Studi di Cagliari Corso di Laurea Magistrale in Ingegneria per l Ambiente ed il Territorio LABORATORIO di INFORMATICA A.A. 2010/2011 Prof. Giorgio Giacinto INTRODUZIONE AI SISTEMI DI BASI

Dettagli

maildocpro Manuale Installazione

maildocpro Manuale Installazione maildocpro Manuale Installazione versione 3.4 maildocpro Manuale Installazione - Versione 3.4 1 Indice Indice... 2 Creazione database... 3 Database: MAILDOCPRO... 3 Database: SILOGONWEB... 5 Configurazione

Dettagli

Web2.0/AJAX: il PC on line... ma non solo

Web2.0/AJAX: il PC on line... ma non solo Web2.0/AJAX: il PC on line... ma non solo L'evoluzione di Internet, dove il confine tra applicazioni Desktop e Rete si confondono. Rivoluziona la sicurezza e l'utilità della tecnologia Associarsi per avere

Dettagli

CeBAS. Centrale Bandi e Avvisi Pubblici Regionali (DGR n. 1556 del 11.09.2009)

CeBAS. Centrale Bandi e Avvisi Pubblici Regionali (DGR n. 1556 del 11.09.2009) CeBAS Centrale Bandi e Avvisi Pubblici Regionali (DGR n. 1556 del 11.09.2009) Introduzione Il progetto CEBAS: la finalità è di migliorare l efficienza operativa interna dell Ente rispondere alle aspettative

Dettagli

Data Base. Prof. Filippo TROTTA

Data Base. Prof. Filippo TROTTA Data Base Definizione di DataBase Un Database può essere definito come un insieme di informazioni strettamente correlate, memorizzate su un supporto di memoria di massa, costituenti un tutt uno, che possono

Dettagli

Appunti lezione Database del 07/10/2015

Appunti lezione Database del 07/10/2015 Appunti lezione Database del 07/10/2015 Nelle lezioni precedenti si è visto come qualunque applicazione informativa è almeno formata da tre livelli o layers che ogni progettista conosce e sa gestire: Livello

Dettagli

Esperienze di linked data e web semantico in BNCF

Esperienze di linked data e web semantico in BNCF Esperienze di linked data e web semantico in BNCF Anna Lucarelli anna.lucarelli@beniculturali.it 6' Incontro ISKO Italia Firenze 20 maggio 2013 Biblioteca nazionale centrale Firenze Da Tim Berners Lee

Dettagli

Gruppo di lavoro LOD SBN

Gruppo di lavoro LOD SBN Gruppo di lavoro LOD SBN Premessa Il Comitato tecnico scientifico per SBN, nel 2014 ha incaricato l ICCU di costituire un gruppo di lavoro con il compito di verificare la fattibilità per l accesso e la

Dettagli

2.1 Introduzione ai linguaggi di marcatura

2.1 Introduzione ai linguaggi di marcatura Fondamenti di Informatica Sistemi di Elaborazione delle Informazioni Informatica Applicata 2.1 Introduzione ai linguaggi di marcatura Antonella Poggi Anno Accademico 2012-2013 DIPARTIMENTO DI SCIENZE DOCUMENTARIE

Dettagli

CORSO WEB SERVER, DBMS E SERVER FTP

CORSO WEB SERVER, DBMS E SERVER FTP CORSO WEB SERVER, DBMS E SERVER FTP DISPENSA LEZIONE 1 Autore D. Mondello Transazione di dati in una richiesta di sito web Quando viene effettuata la richiesta di un sito Internet su un browser, tramite

Dettagli

SCHEDE DI INFORMATICA GLI ARCHIVI E LE BASI DI DATI

SCHEDE DI INFORMATICA GLI ARCHIVI E LE BASI DI DATI SCHEDE DI INFORMATICA GLI ARCHIVI E LE BASI DI DATI Il Database è una collezione di archivi di dati ben organizzati e ben strutturati, in modo che possano costituire una base di lavoro per utenti diversi

Dettagli

15. L'ontologia BIA-Net: una base per la ricerca di informazioni secondo rapporti di rilevanza nella Bibliotheca Iuris Antiqui

15. L'ontologia BIA-Net: una base per la ricerca di informazioni secondo rapporti di rilevanza nella Bibliotheca Iuris Antiqui 15. L'ontologia BIA-Net: una base per la ricerca di informazioni secondo rapporti di rilevanza nella Bibliotheca Iuris Antiqui Marco Giunti 1, Giuseppe Sergioli 2, Giuliano Vivanet 3 Abstract. BIA-Net

Dettagli

Introduzione ai database I concetti fondamentali Database e DBMS Per comprendere appieno cos'è un Database e quali sono i vantaggi legati al suo impiego, soprattutto nel settore gestionale, è necessario

Dettagli