Protocollo di metadata harvesting OAI-PMH Lavoro pratico 2



Documenti analoghi
7. LINEE GUIDA PER IL SERVICE PROVIDER

Seminario di Sistemi Distribuiti RPC su SOAP

Lezione 1 Introduzione

Harvesting delle tesi di dottorato delle Biblioteche Nazionali tramite DSpace

Database. Si ringrazia Marco Bertini per le slides

Digital library e repositori istituzionali

L architettura del sistema può essere schematizzata in modo semplificato dalla figura che segue.

HBase Data Model. in più : le colonne sono raccolte in gruppi di colonne detti Column Family; Cosa cambia dunque?

MetaMAG METAMAG 1 IL PRODOTTO

REGOLE PER L ACQUISIZIONE DEGLI OGGETTI DIGITALI IN MAGTECA E PER IL PROTOCOLLO OAI-PMH VERSO INTERNET CULTURALE

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

Organizzazione degli archivi

ExtGASoai OAI-PMH gateway per ExtGAS: organizzazione logica del software

Il Protocollo HTTP e la programmazione di estensioni Web

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

ITI M. FARADAY Programmazione modulare a.s

Groups vs Organizational Units. A cura di Roberto Morleo

Do-Dots Protocollo di comunicazione

Software per lo storage di contenuti multimediali Manuale d'uso

Strumenti di modellazione. Gabriella Trucco

Basi di dati. (Sistemi Informativi) teoria e pratica con Microsoft Access. Basi di dati. Basi di dati. Basi di dati e DBMS DBMS DBMS

INTEGRATA OTTIMIZZAZIONE DEI PROCESSI AZIENDALI

Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it

Reti di Telecomunicazione Lezione 6

Come archiviare i dati per le scienze sociali

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

Gli attributi di STUDENTE saranno: Matricola (chiave primaria), Cognome, Nome.

Tesi Di Laurea. Anno Accademico 2010/2011. relatore Ch.mo prof. Cinque Marcello. correlatore Ch.mo Ing. Catello Cacace

Corso di Amministrazione di Reti A.A. 2002/2003

Guida all uso del web service SDMX

Dispensa di database Access

Comunicazione tra Computer. Protocolli. Astrazione di Sottosistema di Comunicazione. Modello di un Sottosistema di Comunicazione

Brochure Internet. Versione The Keyrules Company s.r.l. Pagina 2 di 8

Casi di studio sulla migrazione di applicazioni web verso servizi REST Anno Accademico 2008/2009

Architettura client-server

Portale Multicanale delle PA del territorio della Regione Emilia-Romagna: un inizio di rete semantica di informazioni

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA

Progettazione di Basi di Dati

Le Reti Informatiche

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4)

Sicurezza nei Web Services: Migrazione dell autenticazone di Web Services da ticket di sessione a WS-Security con token SAML

2.5. L'indirizzo IP identifica il computer di origine, il numero di porta invece identifica il processo di origine.

Protocolli applicativi: FTP

Implementing a new ADT based on the HL7 version 3 RIM. Esempio

Reti di Telecomunicazione Lezione 8

La Fatturazione Elettronica

Ingegneria del Software T

MODULO 5 Appunti ACCESS - Basi di dati

Gestione del workflow

Introduzione alla teoria dei database relazionali. Come progettare un database

Protocollo Informatico (D.p.r. 445/2000)

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

ARP (Address Resolution Protocol)

e-government La Posta Elettronica Certificata

Le Basi di Dati. Le Basi di Dati

Realizzazione di Web Service per l estrazione di informazioni da siti web enciclopedici

Documentazione API web v 1.0

Progetto: ARPA Fonte Dati. ARPA Fonte Dati. Regione Toscana. Manuale Amministratore

PSNET UC RUPAR PIEMONTE MANUALE OPERATIVO

Dal protocollo IP ai livelli superiori

Sistema Ambiente 2010": Il Network Nazionale della Biodiversità. Checklist, chiavi di identificazione, archivi di immagini ed altre risorse

Modello OAIS. Modello di riferimento. Il Modello. Prof.ssa E. Gentile a.a Un modello di riferimento dovrebbe descrivere:

Database. Appunti di Amaranto Oronzo e Giancane Diego Lezione dell Ing. Lucia Vaira 24/04/2014

Università Politecnica delle Marche. Progetto Didattico

Sistemi Informativi e Basi di Dati

INTEGRATA OTTIMIZZAZIONE DEI PROCESSI AZIENDALI

ESERCITAZIONE Semplice creazione di un sito Internet

2.1 Introduzione ai linguaggi di marcatura

Nelle reti di calcolatori, le porte (traduzione impropria del termine. port inglese, che in realtà significa porto) sono lo strumento

Seminario di Sistemi Distribuiti: RPC su SOAP

CulturaItalia

Ipertesto. Reti e Web. Ipertesto. Ipertesto. Ipertestualità e multimedialità

Siti web centrati sui dati Architettura MVC-2: i JavaBeans

Dettaglio attività e pianificazione. snamretegas.it. San Donato Milanese Aprile 2014

Standard di comunicazione

DOCFINDERWEB SERVICE E CLIENT

Introduzione alle applicazioni di rete

Manuale Utente. Gestione Richieste supporto BDAP. Versione 1.0

Gestione Iter Manuale Sistemista. Gestione Iter Manuale Sistemista

SWIM v2 Design Document

DATABASE RELAZIONALI

URI. Introduzione. Pag. 1

Manuale Utente. Gestione Richieste supporto Data Warehouse. Della Ragioneria Generale dello Stato. Versione 1.0. Roma, Ottobre 2015

Università degli Studi di Bologna Bologna, 12/12/2002 Corso di Laurea In Informatica. Alessandro Valenti. Sessione II

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database

Maxpho Commerce 11. Application Program Interface - API Instant Notifcation Service - INS. Data : 20 / 09 / 2011 Versione : 1.2 Autore: Maxpho Srl

Comuninrete sistema integrato per la gestione di siti web ed interscambio di informazioni e servizi.

Lo scenario: la definizione di Internet

Sistemi informativi secondo prospettive combinate

ECDL - Database. European Computer Driving Licence - Modulo 5 - Database LEZIONE 2

Reti di Calcolatori

Architettura MVC-2: i JavaBeans

Access. P a r t e p r i m a

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Protocollo Informatico (D.p.r. 445/2000)

PIATTAFORMA DOCUMENTALE CRG

Il sistema di conservazione degli archivi digitali di Regione Toscana. Ilaria Pescini

5.2.1 RELAZIONI TRA TABELLE Creare una relazione uno-a-uno, uno-a-molti tra tabelle 9

Siti web centrati sui dati (Data-centric web applications)

Finalità delle Reti di calcolatori. Le Reti Informatiche. Una definizione di Rete di calcolatori. Hardware e Software nelle Reti

Transcript:

Docente: prof.silvio Salza Candidato: Protocollo di metadata harvesting OAI-PMH

Open Archive Initiative OAI (Open Archive Initiative) rendere facilmente fruibili gli archivi che contengono documenti prodotti in ambito accademico; promuovere la produzione in ambito scientifico/universitario. Obiettivo: Sviluppare e promuovere standard di interoperabilità per facilitare la disseminazione efficiente dei contenuti

Open Archives Initiative Protocol for Metadata Harvesting Protocollo OAI-PMH: protocollo leggero utilizzato per condividere metadati; fornisce un framework per l interoperabilità, totalmente indipendente dal contesto applicativo, basato sul metadata harvesting.

Modello funzionale Data Provider: amministrano quei sistemi che supportano l OAI-PMH come strumento per poter esporre i metadati; Service Provider: usano i metadati dei repository dei Data Provider, raccolti tramite il protocollo, per costruire dei servizi a valore aggiunto (es. ricerca unificata su più archivi, analisi citazionale, reference linking).

Modello funzionale Tra i Service Provider e i Data Provider esiste un rapporto client/server basato sui concetti di harvester e repository: un harvester è un applicativo di tipo client tramite il quale il Service Provider può effettuare sei tipi richieste al repository del Data Provider per fare l'harvesting dei metadati; un repository è un server, gestito dal Data Provider, accessibile in rete e in grado di processare le richieste OAI e restituire dei risultati formattati secondo determinate regole.

Modelo strutturale del protocollo OAI-PMH

Modello dei dati Risorsa oggetto a cui sono associati i metadati; Vista come elemento esterno dal protocollo OAI-PMH; Item contenitore di tipo logico a partire dal quale vengono diffusi i metadati. ha un identificatore unico all'interno dello scope del repository di cui fa parte; l'identificatore segue la sintassi URI: oai:identificatore_archivio:identificatore_record Schema (fisso) Dominio registrato Univoco nel repository

Modello dei dati Record sono i metadati espressi in un singolo formato; identificato univocamente dalla combinazione: identificatore item + metadataprefix + datestamp I record OAI presentano tre parti: header: identificatore unico, datestamp, setspec, deleted (opzionale); metadata: veri e propri metadati espressi in un singolo formato (es. DC); about (opzionale): specificare informazioni sui diritti e le condizioni d'uso dei metadati o sulla loro provenienza;

Modello dei dati

Organizzare gli item I repository possono organizzare gli item in set (collezioni) L'organizzazione dei set può essere piatta, cioè una semplice lista, o gerarchica Esempio di organizzazione gerarchica: Istituzioni Oceanside University of Nebraska Valley View University of Florida Un item può appartenere a un set, diversi set o a nessun set

Selective Harvesting L'harvesting selettivo permette di limitare la ricerca dei metadati da raccogliere mediante l'uso dei seguenti criteri: datestamps: è possibile selezionare i record creati, cancellati o modificati in un certo range temporale; appartenenza a un insieme (Set): vengono restituiti solo i record che appartengono al set specificato.

Principali caratteristiche del protocollo basato sul protocollo HTTP; sei tipi di richieste; le richieste usano il metodo GET o il metodo POST; risposte sono codificate in sintassi XML; risposte devono usare la codifica con rappresentazione UTF8 di unicode; supporta la disseminazione di record in diversi formati di metadati (almeno Dublin Core); unica URL base per tutte le richieste: internet host, porta datestamp; messaggi di errore; controllo di flusso; compressione delle risposte;

Richieste OAI-PMH 1) Identify: per ottenere informazioni generali sul repository (es. l'url base); 2) ListMetadataFormats: recupera la lista dei formati dei metadati resi disponibili da un repository; 3) ListSets: per recuperare la struttura dei set (partizioni); 4) ListIdentifiers: recupera solo gli headers dei record; 5) ListRecords: per ottenere la lista di record di un repository; 6) GetRecord : per recuperare un singolo record da un repository;

Controllo di flusso I verbi ListRecords, ListIdentifiers e ListSets restituiscono delle liste di entità, rispettivamente record, headers e set Queste liste possono essere di notevoli dimensioni e può essere utile partizionarle in una serie di richieste e risposte Il partizionamento della risposta utilizza i concetti di lista incompleta e resumptiontoken

Controllo di flusso

Coodici di stato, errori e eccezioni Il protocollo OAI-PMH distingue i propri errori dai codici di stato del protocollo HTTP I repository devono indicare gli errori relativi ad eventi particolari che possono avvenire a seguito delle richieste inviategli, includendo uno o più elementi di tipo error nella risposta (badargument,badresumptiontoken, badverb CannotDisseminateFormat, iddoesnotexist, norecordsmatch, nometadataformats, nosethierarchy)

Data Provider: prerequisiti metadati per la descrizione delle risorse; web server, accessibile via the Internet( es. Apache, IIS); datestamp per i record di metadati (creazione o ultima modifica): base URL come identificatore unico d archivio; identificatore unico per ogni item del repository; formati di metadati (almeno Dubline Core); programming interface / API; controllore di flusso che implementi il resumptiontoken (opzionale, ma fortemente consigliato); organizzazione degli item in set (opzionale); possibilità di inviare risposte compresse all'harvester

Data Provider: architettura

Service Provider: prerequisiti Server connesso ad Internet: l harvester del Service Provider, che costituisce un portale di servizi a valore aggiunto per l utente finale; database relazionale o XML opportunamente progettato per contenere i metadati raccolti dai vari repository; ambiente di programmazione: capace di effettuare richieste HTTP ai server web, richieste a database server e includa un parser XML.

Service Provider: architettura

Aggregatori, cache e proxy E' previsto nell'immediato futuro l'uso di aggregatori, cache e proxy Questi servizi permetteranno di effettuare un harvesting più sofisticato Introdurranno un livello di complessità non riscontrabile nella semplice relazione tra Service Provider e Data Provider Problematiche: gestione dei namespace degli identificatori e provenienza dei record