Strumenti aperti per gli archivi documentali



Documenti analoghi
Le iniziative CILEA e CASPUR per l Open l Paola Gargiulo* e Susanna Mornati**

Harvesting delle tesi di dottorato delle Biblioteche Nazionali tramite DSpace

L iniziativa PLEIADI: una piattaforma digitale per la comunità italiana Open Access

!!" #!!$ )&.,%!!$)!0)!",+1)$

Unipi EPrints, l'archivio istituzionale dell'università di Pisa

CONTENT MANAGEMENT SYSTEM

SOFTWARE A SUPPORTO DELLA GESTIONE AMMINISTRATIVA DELLO SPORTELLO UNICO SPECIFICA DEI REQUISITI UTENTE

Open Access e anagrafe della ricerca L esperienza al Politecnico di Torino. Maddalena Morando Sistema Bibliotecario - Politecnico di Torino

Knowledge Management

Ogni documento digitalizzato, carta attivo o passivo, viene di infatti accompagnato identità da una sorta di elettron

Linee guida per il Comitato Tecnico Operativo 1

lem logic enterprise manager

Caratteristiche generali

Open Journal Systems 2

Il nuovo portale della Sapienza Integrare comunicazione e servizi. Tiziana Catarci

DATANET Innovation & Integration

P.O.R. SARDEGNA MISURA 3.13 ALLEGATO A. SCHEDA PROGETTO per la creazione di BIBLIOTECA SCIENTIFICA REGIONALE

BOA: archivio della produzione scientifica dell Ateneo. di Bonaria Biancu

Un piano nazionale per l accesso aperto dopo la dichiarazione di Messina

Politecnico di Torino. Porto Institutional Repository

MetaMAG METAMAG 1 IL PRODOTTO

REGOLE PER L ACQUISIZIONE DEGLI OGGETTI DIGITALI IN MAGTECA E PER IL PROTOCOLLO OAI-PMH VERSO INTERNET CULTURALE

Plone all'università di Ferrara: Integrazione e Interoperabilità

Progetto Atipico. Partners

L architettura del sistema può essere schematizzata in modo semplificato dalla figura che segue.

Protocollo di metadata harvesting OAI-PMH Lavoro pratico 2

Gestione documentale. Arxivar datasheet del Pag. 1

La gestione del materiale didattico e di ricerca: problemi e soluzioni

Development & Assessment Tools

Applicazione: Share - Sistema per la gestione strutturata di documenti

PROXYMA Contrà San Silvestro, Vicenza Tel Fax

Applicazione: InfoDir: Information Directory, il Catalogo dei dati e dei servizi

LA SOLUZIONE. EVOLUTION, con la E LA TECNOLOGIA TRASPARENTE IL SOFTWARE INVISIBILE INVISIBILE ANCHE NEL PREZZO R.O.I. IMMEDIATO OFFERTA IN PROVA

PARTNER DI PROGETTO. Università degli Studi di Palermo Dipartimento di Ingegneria Industriale

MANUALE DI UTILIZZO: INTRANET PROVINCIA DI POTENZA

L'archivio aperto dell Università di Tor Vergata

L o. Walter Ambu japs: una soluzione agile (

Dai sistemi documentari al knowledge management: un'opportunità per la pubblica amministrazione

soluzioni di e-business knowledge management

MANUALE MOODLE STUDENTI. Accesso al Materiale Didattico

Sistematizzare la documentazione di progetto Una metodologia per un Quality-controlled Subject Gateway del design

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database

DBMS. Esempi di database. DataBase. Alcuni esempi di DBMS DBMS. (DataBase Management System)

MANUALE DELLA QUALITA Revisione: Sezione 4 SISTEMA DI GESTIONE PER LA QUALITA

SIRED Sistema informativo di raccolta ed elaborazione dati sul movimento turistico

Retail L organizzazione innovativa del tuo punto vendita

LA CONSERVAZIONE DELLA MEMORIA DIGITALE FIGURE PROFESSIONALI E RESPONSABILITÀ

Addition X DataNet S.r.l.

Università degli Studi di Messina

CREA IL CATALOGO DEI TUOI PRODOTTI SU IPAD E IPHONE CON UN APP. ANZI, CON UPP!

Gli strumenti attivati: il portale web ReteVIA

Semplificare e centralizzare la gestione delle informazioni e dei documenti

CP Customer Portal. Sistema di gestione ticket unificato

CHI SIAMO. Viale Assunta Cernusco s/n Milano

Implementing a new ADT based on the HL7 version 3 RIM. Esempio

Titolo Perché scegliere Alfresco. Titolo1 ECM Alfresco

martedì 17 aprile 12 1

NOVITÀ SITI COMMERCIALISTA

Documentazione e biblioteche per la PA in rete

POLYEDRO. La migliore piattaforma tecnologica di sempre per EMBYON, l evoluzione dell ERP Metodo

Il Sistema Bibliotecario di Ateneo (SBA)

EasyPROtection. La soluzione software per Commercialisti e Consulenti Fiscali. DATI E DOCUMENTI PROTETTI Sempre. Ovunque.

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

TUTOR81 e-learning PROFESSIONAL

Archiviazione digitale per SAP con DocuWare

eprogress la soluzione completa per la gestione della relazione e del contatto

Configuration Management

Sistemi informativi secondo prospettive combinate

Sistema di Gestione Documentale V.2.5.x. ARCHIVIAZIONE OTTICA, FASCICOLAZIONE E PROTOCOLLO V.2.5.x

IL CASO DELL AZIENDA. Perché SAP.

Protocollo Informatico (D.p.r. 445/2000)

Modifiche principali al programma Adobe Open Options NOVITÀ! DISPONIBILITÀ ESCLUSIVA DEL SOFTWARE ADOBE ACROBAT ELEMENTS

Il progetto originario

DATABASE. A cura di Massimiliano Buschi

e-government La Posta Elettronica Certificata

Addition, tutto in un unica soluzione

La Certificazione ISO 9001:2008. Il Sistema di Gestione della Qualità

Università Politecnica delle Marche. Progetto Didattico

PIATTAFORMA DOCUMENTALE CRG

Finalità della soluzione Schema generale e modalità d integrazione Gestione centralizzata in TeamPortal... 6

RICERCA DELL INFORMAZIONE

Definizione di una policy per l archivio istituzionale ISS

Ciclo di vita dimensionale

La Pubblica Amministrazione consumatore di software Open Source

ARCHIVIAZIONE DOCUMENTALE NEiTdoc

E.S.B. Enterprise Service Bus ALLEGATO C11

Il sistema C.R.M. / E.R.M.

Progetto di un sistema a norma di legge per la conservazione a lungo termine di documenti elettronici

CitySoftware PROTOCOLLO. Info-Mark srl

Organizzare spazi e contenuti di una consultazione online

Intesa Spa Ottobre 2015

C4B Doc. Gestione Documentale, permette di. organizzare l archiviazione e, la gestione dei documenti

La visibilità internazionale delle riviste italiane di cultura dalla carta al digitale

Architettura Foronet

Opendoc DLS Digital Library System

ƒ Gli standard e la gestione documentale

Gruppo Buffetti S.p.A. Via F. Antolisei Roma

2 Giornata sul G Cloud Introduzione

Sito web per la presentazione e l accesso ai servizi di Ruven integrato con la piattaforma B2B del pacchetto software ERP Stratega.NET.

Analisi e catalogazione automatica dei Curriculum Vitae

Transcript:

Strumenti aperti per gli archivi documentali esperienze degli Open Archive nella ricerca Licenza creative commons Documento, documentazione, documentarsi Roma, 1 marzo 2007 dott. Andrea Bollini, CILEA

Agenda OAI & OpenSource Panoramica degli strumenti open L apporto del CILEA I repositories: definizione e possibili classificazioni La situazione italiana I software DSpace & EPrints Le iniziative italiane supportate dal CILEA 2

OAI & OpenSource: un binomio vincente The Open Archives Initiative develops and promotes interoperability standards that aim to facilitate the efficient dissemination of content. OAI has its roots in the open access and institutional repository movements. The basic idea behind open source is very simple: When programmers can read, redistribute, and modify the source code for a piece of software, the software evolves. People improve it, people adapt it, people fix bugs. And this can happen at a speed that, if one is used to the slow pace of conventional software development, seems astonishing. 3

OAI & OpenSource: un binomio vincente OAI: Standard di interoperabilità Visibilità dei risultati della ricerca Accesso ai risultati della ricerca OSI: Condividere conoscenza Riutilizzo, adattamento & evoluzione 4

OAI & OpenSource: un binomio vincente Diversi studi sulla differenza di impatto tra articoli disponibili in modalità Open Access e articoli disponibili solo tramite canali tradizionali, concordano nell affermare che gli articoli OA hanno un impatto significativamente più elevato. Per una bibliografia costantemente aggiornata sull argomento è possibile consultare http://opcit.eprints.org/oacitation-biblio.html 5

Panoramica degli strumenti open La forte connessione filosofica-metodologia tra OAI e OSI trova ulteriore riscontro anche nel vasto panorama di software che quest ultima ha prodotto a supporto dell iniziativa OA. Attualmente sono, infatti, disponibili strumenti open source maturi per tutte le componenti dell architettura OAI, da service provider a data provider, con vari livelli di specializzazione: strumenti omni comprensivi: CDS invenio (ex CDSware) strumenti per la realizzazione di dataproviders generici: Fedora, DSpace strumenti per la realizzazione di repositories: EPrints strumenti per la realizzazione di riviste aperte: OJS, HyperJournal framework di supporto per l implementazione di interoperabilità (OAICat, OAIHarvester2) 6

L apporto del CILEA Leader in Italia il CILEA ha attivato da oltre tre anni un team specializzato, AePIC, per assistere e guidare i propri consorziati e tutti gli enti di ricerca che ne facessero richiesta nella delicata fase di avvio, nella pianificazione e nella gestione di progetti documentali aperti. L utilizzo di software e tecnologie open source permette al CILEA di concentrarsi sulle specificità dei singoli clienti garantendo una maggiore qualità e rapidità nello sviluppo delle proprie realizzazioni. 7

L apporto del CILEA Nel corso di questi anni il CILEA si è specializzato nell impiego dei maggiori software open source citati selezionando in particolare DSpace ed EPrints per la gestione di repositories e, più in generale, digital library. L azione del CILEA, coerentemente con lo spirito dei software utilizzati, è stata condotta con una costante attenzione alle evoluzioni in atto nelle rispettive comunità di sviluppatori tanto da entrare a far parte dei contributors di EPrints, OJS e del ristretto gruppo di committers di DSpace. 8

I repositories: definizione Per repository si intende un archivio aperto in linea che renda disponibile in forma digitale la cosidetta letteratura grigia (pre-prints, dispense, tesi, ecc ) senza effettuare validazioni qualitative sui contenuti (peerreview); ogni repository prevede però normalmente delle limitazioni al deposito dettate da proprie policy interne. 9

I repositories: classificazioni Le limitazioni riguardano generalmente : - Tipologia di contenuto: ricerca, didattica - Produttori del contenuto: Istituzionali, disciplinari, misti e non limitandosi a repository open access - Tipologia di accesso: aperto, delayed o ristretto 10

Dalle policy ai requisiti funzionali Ogni policy che l archivio deve implementare ha inevitabilmente un impatto sui requisiti funzionali del progetto. Autenticazione, Workflow, Metadati & authority files, DRM sono infatti solo alcune delle caratteristiche che vengono influenzate da queste policy 11

Repository Istituzionali - IR La realizzazione di un repository istituzionale (IR) comporta normalmente la necessità di integrare il sistema di autenticazione del repository con un sistema centralizzato dell istituzione (basato ad esempio su LDAP). A livello di workflow di approvazione gli IR non presentano invece particolari necessità ed in taluni casi, anche in virtù del rapporto di fiducia tra autore/dipendente ed ente, potrebbe essere completamente disabilitato (submission=archiviazione). E infine da segnalare che quando sono previste policy restrittive per l accesso ai full-text è normalmente richiesta la gestione delle autorizzazioni tramite indirizzo IP/rete di accesso. 12

Repository disciplinari Un repository disciplinare si caratterizza dal fatto di contenere materiali di un settore scientifico ben determinato a volte anche molto ristretto. Questo comporta l adozione di metadati specifici con soggettari normalmente sottoposti ad autority files. Un processo di workflow per l immissione in archivio è assolutamente indispensabile anche solo al fine di evitare l inserimento di materiale improprio. L invio è infatti normalmente effettuato da autori sconosciuti all organizzazione(i) che supporta l archivio attraverso la registrazione autonoma nel sistema e procedure di self-archiving. 13

Repository per la didattica Un repository di materiale didattico si trova spesso a dover affrontare problemi di amministrazione decentralizzata. Un sistema che preveda l inserimento di materiale didattico deve risultare sufficientemente flessibile da permettere una gestione autonoma da parte di ogni docente dei contenuti, della loro organizzazione e modalità di accesso. Il riutilizzo del materiale avviene frequentemente deve quindi essere possibile associare il medesimo materiale a più corsi. 14

Repository per la ricerca In un repository di materiale di ricerca rivestono particolare importanza i tools di supporto al fruitore finale nell ottica del riutilizzo e della generazione di nuova conoscenza. Il materiale di ricerca viene costantemente citato dai ricercatori che quindi trarrebbero il massimo vantaggio da tools di export in formato bibliografico e strumenti di ricerca e navigazione contestuali. In una situazione ideale nello stesso repository si potrebbero inoltre trovare più versioni dello stesso articolo (pre-print, post-print, publisher version) tra cui dovrebbe essere garantita una semplice navigazione. 15

La situazione italiana Dichiarazione di Messina: 4-5 November 2004 Sottoscritta da 75 università italiane su 77 Molte università non hanno ad oggi ancora avviato progetti di repository OA e quelli esistenti stentano a decollare Atenei & enti di ricerca, soprattuto di grosse dimensione e peso scientifico, hanno difficoltà ad evadere i debiti informativi verso il MIUR ed organismi internazionali 16

La situazione italiana Pleiadi Service Provider http://www.openarchives.it/pleiadi Numero di data providers harvested: 17* Numero di documenti harvested: 7424* Media documenti/providers: 436* *Dati al 27 febbraio 2007 17

Architettura PLEIADI document archiving Tratta da: CILEA Data Providers metadata feeding development, management Il portale Pleiadi: un prototipo per la ricerca su più archivi archivi - Ugo Contino, Messina 4/5 Novembre 2004 http://www.aepic.it/conf/viewabstract.php?id=12&cf=1 Harvesting Harvesting Classification Classification Caching Caching Indexing Indexing Information retrieval Information retrieval Metadata crosswalks Metadata crosswalks UTF-8 mapping UTF-8 mapping Gateway for crawlers Gateway for crawlers Full-text search Full-text search Z39.50 for discovery services Z39.50 for discovery services Statistics Statistics Export facilities Export facilities Citation Citation parsing parsing OpenURL OpenURL Service Providers Permanent URL Permanent URL Time stamping Time stamping Copyright Copyright Legal deposit Legal deposit Digital preservation Digital preservation development, management CASPUR Service Providers Added-value metadata feeding Users document retrieval Access management Access management Profiling & User services Profiling & User services Alerting Alerting News feed News feed OA-relevant OA-relevant info info Forum management WG Forum management WG Implementators Implementators VRD VRD Portal Italian Italian OA OA list list Portal

La situazione italiana Attualmente i bibliotecari sono tra i maggiori sostenitori dell Open Access Vantaggi: metadati di qualità Svantaggi: Scarsa influenza accademica Non sono i produttori dei contenuti 19

La situazione italiana Autori sono riluttanti a depositore preoccupati dalla loro carriera E possibile incoraggiarli? come? Informazione! E necessario far comprendere ai ricercatori i vantaggi conseguenti ad una pubblicazione OA (visibilità, impatto) e ridurre le preoccupazioni relative al copyright (v. Progetto SHERPA/RoMEO) Servizi aggiuntivi! L autore deve vivere l archivio come un tool personale di supporto alla propria attività lavorativa e non un ulteriore impegno burocratico (estrazione di liste bibliografiche per la redazione del CV, integrazione con i software di gestione bibliografica, ecc ) Attualmente ci sono diversi registri, sia a livello locale sia a livello nazionale, con scopi differenti ma che richiedono essenzialmente I medesimi dati, questo obbliga il ricercatore ad un dispendioso e ripetitivo lavora di data entry 20

La suite SURplus del CILEA 21

Progettare un archivio documentale Dimensione del materiale posseduto e crescita attesa Chi possiede il contenuto: legalmente e fisicamente Chi crea contenuto Dimensione e distribuzione dello staff redazionale Funzionalità utente e target di riferimento Tipologia di contenuto Ambiente ICT 22

I software DSpace & EPrints Entrambi sono software open source che consentono la realizzazione di repository OAI DSpace presenta un data model più articolato che gli permette di gestire situazioni amministrative più complesse e far coesistere esigenze differenti all interno dello stesso repository EPrints è il software storico, nato appositamente per realizzare repository di materiale di ricerca, ha tra i suoi punti forza la semplicità di utilizzo 23

DSpace Sviluppato inizialmente dal MIT e dalla HP, viene rilasciato come OS nel 2002 Basato su tecnologie Java J2EE, conforme allo standard OAIS giunto alla versione 1.4.1 si caratterizza per una comunità vivace e produttiva le linee di sviluppo sono indicate dal gruppo di Committers definito sulla base di criteri meritocratici 24

DSpace: data models Cinque entità principali che permettono la strutturazione e aggregazione delle informazioni Comunità: raggruppamento amministrativo/logico di più collezione (e comunità); utilizzato ad es. per creare Aree Dipartimentali all interno di un unico archivio di ateneo, singole sedi per Enti distribuiti sul territorio, progetti/linee di ricerca, ecc Collezioni: sono un raggruppamento di più item omogenei per tipologia (metadati) e modalità di trattamento (workflow); rappresentano attualmente il punto principale per le personalizzazioni dell archivio Item: rappresenta la scheda bibliografica (metadati) di un singolo documento; contiene al suo interno uno o più bundles di bitstreams Bundle: sono una aggregazione di bitstream attualmente utilizzati per separare i documenti originali, quelli risultanti da trasformazioni automatiche (ad es. estrazione fulltext), licenze di archiviazione e Creative Commons Bitstream (= fulltext) 25

DSpace: gestione accounts La gestione degli accounts in DSpace avviene mediante due entità: eperson e group. La prima rappresenta un singolo utente del sistema, ne permette la gestione dei dati anagrafici e l accesso al sistema. La seconda è un aggregatore di più accounts (o gruppi) utilizzata per semplificare la gestione dei permessi (il gruppo degli studenti di Fisica, il gruppo dei docenti, ecc ) 26

DSpace: DRM La gestione dei permessi è molto flessibile è infatti possibile definire policy di lettura, modifica e creazione per tutte le entità del datamodels. Attualmente la webui e il server OAI-PMH non supporta però nativamente le eventuali restrizioni alla visibilità dei metadati. A livello di API è inoltre possibile definire policy di accesso temporali. 27

DSpace: caratteristiche della WebUI Interfaccia web conforme XHTML e WAI Multilinguismo Semplici possibilità di branding (CMS) Facilmente personalizzabile Identificativo persistente (Handle) per ogni Comunità, collezione è item 28

DSpace: retrieval e disseminazione Potente motore di ricerca basato su Lucene con indici personalizzabili e ricerca fulltext Indici e liste di scorrimento personalizzabili Notifica via RSS e email dei nuovi contenuti Supporto dello standard OpenURL per l accesso ai servizi di tipo SFX dell istituzione Supporto allo standard SRW/U Identificativo persistente per ogni item, comunità e collezione: handle OAI-PMH: METS, MODS, DCQualified, MPEG-21 e semplice creazione di formati personalizzati 29

DSpace: metadati Gestione di schemi multipli di metadati Possibilità di definire il formato di immissione per ogni metadato (nome, data, lista controllata, ecc ) UTF-8 Supporto per multilinguismo dei metadati 30

DSpace: autenticazione Supporto per LDAP Supporto per CAS Supporto per certificati X.509 Facile scrittura di metodi personalizzati Inserimento in gruppi in base all IP di provenienza Possibilità di utilizzare simultaneamente più modalità di autenticazione 31

DSpace: Import/Export Import da formato XML nativo, XML+XSL, PDF, personalizzato Export in XML secondo vari formati con la possibilità di utilizzare tutti i formati definiti per OAI-PMH (METS, MODS, DCQualified, MPEG-21) 32

DSpace: uno sguardo al futuro E da poco terminata la revisione architetturale che porterà alla nascita della versione 2.0; la transizione avverrà in maniera progressiva mantenendo la migrazione dalle versioni precedenti più semplice possibile Le maggiori novità riguarderanno la revisione dell architettura software che semplificherà ulteriormente l estendibilità, la modularità e la manutenzione del prodotto rafforzando quindi la possibilità di riutilizzo come componente Il data model sarà esteso consentendo di associare metadati personalizzati ad ogni oggetto dell architettura (possibile supporto per il MAG) Miglioramenti alle performance per garantire la corretta gestione di masse critiche di documenti L introduzione di un motore di workflow che consentirà la massima flessibilità nei processi di immissione, verifica, validazione e accettazione dei documenti 33

Alcune iniziative by CILEA E-lis - http://eprints.rclis.org/ Earth-prints (Ist. Nazionale Geofisica e Vulcanologia) http://www.earth-prints.org AIR (Univ. Milano) http://air.unimi.it AperTO (Univ. Torino) http://aperto.unito.it Archivio digitale del ceum (Univ. Macerata) - http://archiviodigitale.unimc.it/ E-ms (Ist. Medicina Sociale) - ArmiDA (Univ. Milano) http://armida.unimit.it Biblioteca Digitale Medievistica di prossima attivazione SSPAL.doc di prossima attivazione DSpace@UniPr http://dspace-unipr.cilea.it Envimarch (CNR di Potenza) di prossima attivazione 34

E-LIS Il più vasto repository di Library & Information Science, coordinato da uno staff readazionale internazionale che garantisce metadati qualitativamente elevati. Attualmente possiede oltre 5100+ documenti ad accesso aperto Basato sul software open source EPrints 35

Earth-prints.org Giovane repository disciplinare: raccoglie materiale di ricerca sulla geofisica Promosso dall Istituto Nazionale di Geofisica e Vulcanologia che l utilizza come proprio IR Attualmente possiede un patrimonio di oltre 1600+ documenti quasi tutti disponibili ad accesso aperto 36

AIR: Archivio Istituzionale della Ricerca Univ. degli studi di Milano IR dell Università degli Studi di Milano utilizzato dai dipendenti per l evasione di debiti informativi nei confronti dell istituzione Avviato nel maggio del 2006 possiede attualmente un patrimonio di oltre 15000+ schede bibliografiche purtroppo solo in minima parte corredata da fulltext Attivazione di nuove soluzioni tecnologiche e organizzative con servizi di supporto ai docenti per incentivare l inserimento dei fulltext 37

SSPAL.DOC: l archivio istituzionale IR della Scuola Superiore per la Pubblica Amministrazione Locale diventerà accessibile pubblicamente a breve Prima esperienza significativa di utilizzo delle tecnologie OAI in una P.A. Recupero del pregresso della Scuola Nazionale, con revisione e normalizzazione dei metadati da parte dei bibliotecari Funzionalità di ricerca, scorrimento e navigazione dell archivio orientata agli utenti tipici della scuola 300+ documenti ad accesso aperto 38