BLUEOCEAN: UN FRAMEWORK PER LA REALIZZAZIONE DI CMS SEMANTICI. 1. La condivisione dell informazione nel Web 2.0: possibilità e limitazioni



Documenti analoghi
BANCHE DATI. Informatica e tutela giuridica

Progettaz. e sviluppo Data Base

lem logic enterprise manager

Audiovisivo 2.0: scenari e strumenti della rete

INNOVAZIONE XNOTTA PER PORTALI TURISTICI

CulturaItalia

InfiXor. il programma facile e versatile per preventivi veloci e completi. il software di preventivazione per produttori e rivenditori di infissi

Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it

Elevator Pitch. [ storia, comuni, codice fiscale ]

Software per Helpdesk

martedì 17 aprile 12 1

Manuale Amministratore Legalmail Enterprise. Manuale ad uso degli Amministratori del Servizio Legalmail Enterprise

Generazione Automatica di Asserzioni da Modelli di Specifica

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA

Introduzione al data base

03. Il Modello Gestionale per Processi

Corso di Amministrazione di Reti A.A. 2002/2003

[SOLUZIONI INNOVATIVE] Casi di studio sulle pratiche di innovazione

Programma 1 WP7: Il portale di Allenza

ARCHIVI E DATABASE (prof. Ivaldi Giuliano)

I DATABASE Database relazionale

Introduzione alla teoria dei database relazionali. Come progettare un database

ING SW. Progetto di Ingegneria del Software. e-travel. Requisiti Utente. Specifiche Funzionali del Sistema

Plurima Katalog. Soluzione di Catalogo Elettronico

DATAMORFOSI. E la sintesi della strategia di prodotto di Webgate400.

ELENCO CLIENTI FORNITORI Patch1

Segesta srl Via Giacomo Peroni Roma Tel. 06/ Fax 06/

Le licenze d uso. Le principali tipologie di licenze

COME SVILUPPARE UN EFFICACE PIANO DI INTERNET MARKETING

Progettaz. e sviluppo Data Base

Il database management system Access

MetaMAG METAMAG 1 IL PRODOTTO

Volume GESTFLORA. Gestione aziende agricole e floricole. Guidaall uso del software

IoBirro. Birra fatta in casa con SIMATIC. Siemens AG All Rights Reserved. Industry Sector

Sommario. Introduzione L ambiente di lavoro Configurazioni generali e la struttura di Joomla La struttura di Joomla...

I blog. Andrea Marin. a.a. 2013/2014. Università Ca Foscari Venezia SVILUPPO INTERCULTURALE DEI SISTEMI TURISTICI SISTEMI INFORMATIVI PER IL TURISMO

Sistemi per la produzione, gestione e conservazione di contenuti digitali CMS. L12 - Comunicazione e archiviazione digitale A.A

Lezione 1. Introduzione e Modellazione Concettuale

OFI ITC. Come nasce questo sito 05/06/2015. Severini Piertommaso Valenti Andrea Zallocco Riccardo

POLITICA DI COESIONE

YOU ARE WHAT YOU CURATE COS E LA CONTENT CURATION E COME APPLICARLA

Social Network. Marco Battini

Introduzione al Semantic Web

MService La soluzione per ottimizzare le prestazioni dell impianto

Le fattispecie di riuso

Archivio WebQuest I Grafi e le Reti

LA FORMAZIONE E LA CONSERVAZIONE DELLA MEMORIA DIGITALE

E-book: un testo in cerca di identità. Convegno Parole in Rete 20 aprile 2012 c/o S.M.S. Don Milani Elena Mosa

NOVITÀ SITI COMMERCIALISTA

GRUPPO MY- social media solutions / Via G.Dottori 94, Perugia / PI

Addition X DataNet S.r.l.

La piattaforma di lettura targhe intelligente ed innovativa in grado di offrire servizi completi e personalizzati

WorkFLow (Gestione del flusso pratiche)

SOLUZIONE Web.Orders online

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

5.2.1 RELAZIONI TRA TABELLE Creare una relazione uno-a-uno, uno-a-molti tra tabelle 9

Cosa è un foglio elettronico

Il CMS Moka. Giovanni Ciardi Regione Emilia Romagna

CONTENT MANAGEMENT SYSTEM

ESPORTIAMO L ECCELLENZA

Oltre il diritto d autore: Creative Commons. Formazione Volontari SCN 2010 Mediateca Centro Linguistico di Ateneo - febbraio 2010

PROGETTO PON/FESR

Trasparenza e Tracciabilità

LA SOLUZIONE. EVOLUTION, con la E LA TECNOLOGIA TRASPARENTE IL SOFTWARE INVISIBILE INVISIBILE ANCHE NEL PREZZO R.O.I. IMMEDIATO OFFERTA IN PROVA

Agenda telematica delle manifestazioni pubbliche

database Web - GIS Un esempio prototipo: Procida - Vivara

Perché siete fan della pagina «Pietro Taricone Onlus» su Facebook?

MODULO 5 Appunti ACCESS - Basi di dati

SPCOOP E I PROGETTI DI COOPERAZIONE INTERREGIONALE

Comuninrete sistema integrato per la gestione di siti web ed interscambio di informazioni e servizi.

Manuale Utente Albo Pretorio GA

Insegnare con il blog. Materiale tratto da:

Siti web e-commerce "mobile"

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

MANUALE ESSE3 Gestione Registro delle lezioni

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

Docebo: la tua piattaforma E-Learning Google Ready.

Organizzazione degli archivi

INTEGRATA OTTIMIZZAZIONE DEI PROCESSI AZIENDALI

Database. Si ringrazia Marco Bertini per le slides

Lezione V. Aula Multimediale - sabato 29/03/2008

Ecco come ho posizionato in 1 pagina di Google la keyword Strategie di marketing, da 1500 ricerche al mese

Manuale Utente Amministrazione Trasparente GA

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

L ARMONIZZAZIONE DEI PROCESSI CON IL CLIENTE AL CENTRO

Progettazione : Design Pattern Creazionali

In questo manuale sono indicate le procedure per utilizzare correttamente la gestione delle offerte dei fornitori.

Cross Software ltd - Prosyt srl. Maximum extent of technology Il gestionale più avanzato sul mercato. Pag. 1

1. BASI DI DATI: GENERALITÀ

Come importare le foto senza utilizzare una fotocamera 2

Strutturazione logica dei dati: i file

Guida alla registrazione on-line di un DataLogger

COLLI. Gestione dei Colli di Spedizione. Release 5.20 Manuale Operativo

2.0 Gli archivi. 2.1 Inserire gli archivi. 2.2 Archivio Clienti, Fornitori, Materiali, Noleggi ed Altri Costi. Impresa Edile Guida all uso

L Open Source un mondo che forse dovresti conoscere? Viaggio alla scoperta dell open source e le sue caratteristiche.

Approfondimento: Migrazione dei database e backup della posta

Regione Piemonte Portale Rilevazioni Crediti EELL Manuale Utente

DIMINUIRE I COSTI CON IL SISTEMA QUALITA

Transcript:

Archeologia e Calcolatori Supplemento 2, 2009, 245-249 BLUEOCEAN: UN FRAMEWORK PER LA REALIZZAZIONE DI CMS SEMANTICI 1. La condivisione dell informazione nel Web 2.0: possibilità e limitazioni L ultimo decennio è stato teatro di una rivoluzione nell ambito della gestione dei media, avvenuta grazie alle tecnologie digitali. È possibile creare a basso costo librerie di media (documenti testuali, foto, lmati, etc.) e, grazie alla pervasività di Internet, rendere questi contenuti accessibili ad un vasto pubblico. Le tecnologie genericamente note con il termine Web 2.0 hanno permesso la realizzazione di siti web dinamici in grado di presentare agli utenti vari tipi di contenuti, rendendo accessibili in modo facilitato due attività fondamentali: 1. La ricerca. Questa funzione rende possibile navigare all interno di database anche di grandi dimensioni, cercando i documenti ed i media desiderati secondo vari criteri. Tipicamente questa funzionalità è supportata da un database relazionale (Wikipedia1) sul quale viene eseguita una query costruita automaticamente da alcuni parametri inseriti dall utente. 2. La redazione collaborativa. La possibilità di ogni sistema web di operare in modalità multi-utente rende possibile l inserimento di documenti da un numero elevato di utenti; mentre l esempio più comune, quello dei wiki (Wikipedia2), è facilmente criticabile per quanto riguarda il controllo della qualità dei contenuti e la loro af dabilità, la possibilità di implementare meccanismi di gestione del work ow (Network World), cioè una sorta di controllo editoriale, permette di garantire l autorevolezza dei contenuti di un sito Web 2.0. Questa è una caratteristica molto importante qualora l ente che gestisce il sito debba garantire la qualità dell informazione, caratteristica irrinunciabile per qualsiasi sito gestito da un entità con una seria reputazione scienti ca. Se si analizza la situazione attuale del Web 2.0 si può notare come questo modello abbia portato alla nascita di un gran numero di isole non connesse o scarsamente connesse tra loro: siti in grado di offrire grandi quantità di informazione, si pensi per esempio al Getty, ma non in grado di interoperare tra di loro. Un utente che debba eseguire una ricerca su più fonti non può fare altro che ottenere l accesso ad ognuna, eseguire una ricerca indipendente su ogni sito (spesso con modalità differenti) ed eseguire manualmente l aggregazione dei risultati. Una situazione paradossale, che non sfrutta minimamente le potenzialità che il web aveva promesso (ipertestualità, collegamenti senza soluzione di continuità, etc.). 245

A. Palombini, F. Giudici Volendo risolvere questo problema rimanendo nel mondo Web 2.0, esistono due soluzioni: 1. L imposizione di un unico sito. Dal punto di vista tecnologico, si potrebbe ipotizzare di fondere tutti i siti Web 2.0 esistenti, almeno per un dato dominio di conoscenza, fornendo quindi una modalità di accesso uni cata. Si tratta tuttavia di un ipotesi puramente teorica, spesso irrealizzabile dal punto di vista politico per problemi di ownership: infatti, ogni singolo sito web è anche un biglietto da visita dell istituzione che lo gestisce, che ha quindi tutto l interesse a mantenerne l identità (non solo di sostanza, ma anche di forma). Inoltre, approfondendo l aspetto tecnologico, è frequente veri care che le modalità di archiviazione dei dati, pur in presenza di un minimo denominatore comune in uno certo dominio di conoscenza, presentano variazioni tipiche di ogni entità (ad es. campi in più, vocabolari diversi, etc.). 2. La realizzazione di un aggregatore. Rinunciando alla presenza di un unica interfaccia di riferimento, e lasciando quindi ad ogni sito la propria autonomia gestionale, è possibile realizzare un sito terzo in grado di estrarre le informazioni da ogni fonte e presentarle in forma aggregata, con un interfaccia di ricerca uni cata. Un esempio notevole di aggregatore in campo scienti co è Google Scholar (Google), un motore di ricerca che opera in un database di letteratura accademica. Soluzioni di questo tipo, tuttavia, presentano vari inconvenienti, di cui il principale è la necessità di collaborazione da parte dei siti originari, che devono esporre un interfaccia tecnologica verso l aggregatore, come ad esempio avviene con i ussi RSS dei blog (Wikipedia3). Questo però implica la de nizione tecnica di un formalismo comune per descrivere i dati pubblicati. Viceversa, l aggregatore sarà limitato a ricerche generiche sui testi, così come avviene per il motore di ricerca di Google, limitando però pesantemente la qualità della ricerca a causa delle inerenti limitazioni dei linguaggi naturali e a causa di eventuali barriere linguistiche. Gli stessi inconvenienti valgono per la tecnica nota come tagging, che consiste nell applicare una serie di semplici etichette ad ogni documento; essa è oltretutto povera dal punto di vista espressivo, non potendo rappresentare concetti complessi (il successo del tagging nel contesto di social network come Flickr o Facebook non tragga in inganno: per la stessa natura di quei contesti non si rendono necessari i requisiti di completezza e precisione di un attività di ricerca scienti ca). Inoltre, se un sito richiede l autenticazione degli utenti per la consultazione, si pone un ulteriore problema di accesso, legato alla granularità: tipicamente un documento web tradizionale è completamente accessibile o non accessibile, e non è possibile controllare la modalità di fruizione solo per una parte dei suoi contenuti. La necessità di impostare esplicitamente tutte queste forme di cooperazione limita e spesso vani ca alcune delle migliori proprietà del web, che sono la cooperazione spontanea e la possibilità di aggregazione indipendente da parte di terzi. 246

blueocean: un framework per la realizzazione di CMS semantici Alcuni consorzi hanno de nito validi formalismi standard di rappresentazione di dati in alcuni domini speci ci: per esempio IPTC (International Press Telecommunication Council) e più recentemente Dublin Core (DC) operano nel campo dei media, de nendo vocabolari per descrivere soggetti, autori, titolari di copyright, eccetera. Tuttavia, nessuno di questi standard affronta il problema dell organizzazione della conoscenza che circonda il documento digitale. In altre parole, grazie ad IPTC o DC è possibile creare metadati intelleggibili relativamente al soggetto, alla data di creazione, al possessore dei diritti d autore e così via, ma non offrono di per sè la possibilità di descrivere completamente ed in modo formalizzato la conoscenza relativa al soggetto (per esempio, la storia di un opera d arte riprodotta in una foto). Da queste premesse si può concludere che il modello del Web 2.0 presenta delle limitazioni insormontabili quando si parla di ampia condivisione di modelli conoscitivi ricchi. 2. blueocean Tecnologie semantiche (verso il Web 3.0) blueocean è un framework per la realizzazione di sistemi di gestione di contenuti (CMS) basati su un database semantico. Oltre a contenere componenti pronti per l uso in grado di creare documenti ipertestuali e redarre un intero sito web con capacità collaborative e gestire i metadati tradizionali (EXIF, IPTC, dati geogra ci, etc.), funzioni tipiche di un CMS, il database semantico permette di de nire a piacere un repository di conoscenze associato ai media catalogati. Le tecnologie semantiche sono state introdotte come parte del cosiddetto Web Semantico, proposto da Tim Berners-Lee (l inventore del World Wide Web) come la naturale evoluzione del web (Wikipedia4). Evitando di entrare in tecnicismi troppo spinti, l idea che sta dietro al Web Semantico è innanzitutto la de nizione di una notazione formale per la rappresentazione della conoscenza: le cosiddette triple RDF (Wikipedia5). Esse sono tutte composte da asserzioni nella forma soggetto predicato oggetto ; i componenti di ogni tripla sono a loro volta descritti da vocabolari formali (ontologie), che associano ad ogni elemento un valore semantico preciso (Wikipedia6). I siti che vogliono collaborare ad un web semantico possono tranquillamente mantenere la propria indipendenza ed identità, anche estetica, semplicemente af ancando alla pubblicazione delle pagine originali un numero opportuno di documenti RDF. Sarà così possibile realizzare un aggregatore in grado di comprendere il valore semantico dell informazione manipolata questo può essere sia un sito esterno (una specie di motore di ricerca semantico PuntoInformatico), sia una possibilità offerta da ogni singolo sito (ad es. offrendo all utente la possibilità di aggregare risultati provenienti da Internet direttamente dalle proprie pagine di ricerca). Per questo RDF è in grado di trasformare le isole 247

A. Palombini, F. Giudici del Web 2.0 in vere e proprie federazioni di fonti dati, pur lasciando ad esse la propria identità e responsabilità di ownership. L uso del formalismo RDF comporta un ulteriore vantaggio, relativo alla essibilità della memorizzazione delle informazioni. Il database relazionale, tipicamente utilizzato nel Web 2.0, prevede una rigida de nizione della propria struttura (o schema) sotto forma di un numero de nito di tabelle con un numero de nito di colonne. Ogni modi ca allo schema è tipicamente un operazione amministrativa che ha delle conseguenze sul resto del sistema (e spesso implica un aggiornamento del software). Viceversa, l unica struttura di RDF è data dalle triple, che sono libere: aggiungere nuove strutture di informazione vuol dire semplicemente aggiungere nuove triple. In ne, non è neanche necessario che due partner di una federazione concordino a priori su un numero prede nito di ontologie standard (per quanto auspicabile: standard come il già citato Dublin Core sono basati su triple): RDF mette a disposizione la possibilità di de nire l eguaglianza semantica di concetti appartenenti a differenti ontologie. Questo vuol dire che se due siti de niscono diversamente il concetto di reperto, è comunque possibile effettuare aggregazioni di dati de nendo opportunamente l equivalenza dei concetti di reperto per il primo ed il secondo sito. Un aspetto interessante è dato dalla possibilità di de nire soggettivamente l equivalenza semantica: l utente può impostarla al momento di eseguire ogni nuova ricerca, aprendo varie possibilità di consultazione dei dati. 3. Altre caratteristiche di blueocean blueocean è realizzato esclusivamente con software open source (FLOSS). L aspetto open del software presenta diversi vantaggi, dalla assenza di licenze per l installazione alla facilità di customizzazione ed integrazione con altri sistemi informativi. Siccome blueocean è basato su tecnologie standard, le federazioni che è in grado di creare possono interoperare con altri partner basati su RDF, ma non realizzati con blueocean. blueocean sarà disponibile entro l estate 2009. SITI WEB Wikipedia1. http://it.wikipedia.org/wiki/modello_relazionale. Wikipedia2. http://it.wikipedia.org/wiki/wiki. Augusto Palombini CNR ITABC Roma Fabrizio Giudici Tidalwave S.a.s. 248

blueocean: un framework per la realizzazione di CMS semantici Wikipedia3. http://it.wikipedia.org/wiki/really_simple_syndication. Wikipedia4. http://it.wikipedia.org/wiki/web_semantico. Wikipedia5. http://it.wikipedia.org/wiki/resource_description_framework. Wikipedia6. http://it.wikipedia.org/wiki/ontologia_(informatica). NetworkWorld. http://www.nwi.it/nwi_arretrati/ap090001.htm. Getty. http://www.getty.edu/research/conducting_research/. Google. http://scholar.google.it/. PuntoInformatico. http://punto-informatico.it/2235663/pi/interviste/che-cos-un-motorericerca-semantico.aspx. ABSTRACT The so-called Web 2.0 offers good methods for sharing knowledge, but it does not provide adequate tools for performing automated, complex searches on the Internet with the quality needed for scienti c research. blueocean is a software product for managing knowledge with the technologies of semantic web and offers an effective solution to the problem. 249