Documento. Documento. Documenti nel Web. L'Information Retrieval 19/05/2015. La Ricerca dell Informazione: Oggetti e Attori



Documenti analoghi
Le informazioni. Fondamenti di informatica. I documenti. Information retrieval. Information retrieval. Ricerche alternative 19/02/2015

RICERCA DELL INFORMAZIONE

Documento. Documento. Ricerca di Informazioni. Esigenza Informativa 13/05/2011. La Ricerca dell Informazione per le Scienze Umane

Fondamenti di Informatica

L INDICIZZAZIONE SEMANTICA

Breve guida alla ricerca bibliografica on-line. A cura di Tilde Tocci

Biblioteca di Ateneo: servizi e strumenti per la ricerca. di Ilaria Moroni

Open Archives e motori di ricerca. di Ilaria Moroni

Dai sistemi documentari al knowledge management: un'opportunità per la pubblica amministrazione

XXIII Convegno ASS.I.TERM. «Terminologia e normalizzazione nella catalogazione semantica»

Cercare documenti Web

AtoZ IL CATALOGO DI BIBLIOTECA VIRTUALE

Archivio globale della Maremma

Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF

Sebina OpenLibrary OPAC

Archiviazione ottica documentale

L Open Archive e il suo sviluppo nell Università di Verona. Maria Gabaldo 1 febbraio 2013

Tracce di approfondimento per il capitolo 6 La ricerca di informazioni per le scienze umane

L architettura del sistema può essere schematizzata in modo semplificato dalla figura che segue.

Gli e-books per le scienze mediche

Siti Web e Information Architecture: organizzare i contenuti e strutturare le informazioni

Lezione 1. Introduzione e Modellazione Concettuale

Come ragiona un editore

C A T A L O G O. Catalogo del Sistema Bibliotecario Padovano. Gruppo Lavoro per il Coordinamento dei Corsi all Utenza

Trovare nelle risorse della Biblioteca- per Infermieristica

Sardegna digital library VALORIZZAZIONE E FRUIZIONE DEI BENI

MetaLib. Oppure cliccare su una lettera per avere la lista delle banche dati iniziando dalla lettera selezionata.

INTRODUZIONE ALLA RICERCA BIBLIOGRAFICA. A cura delle biblioteche Umanistiche e Giuridiche

Accesso all informazione. Accesso all informazione. Accesso all informazione INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042)

La gestione del documento

Oltre il diritto d autore: Creative Commons. Formazione Volontari SCN 2010 Mediateca Centro Linguistico di Ateneo - febbraio 2010

Ministero dell Istruzione, dell Università e della Ricerca

Archiviazione ed accesso all'informazione (I. Zangara)

UNIPV Ricognizione fondi librari elenco delle sezioni e delle voci

MetaBib: il portale della Biblioteca Digitale. di Stefania Fraschetta

PER RIVISTO 18/03/05. Che cos è la International Children s Library (ICDL - Biblioteca Internazionale Digitale per Bambini)?

Guida all uso dei Focus Tematici

informarisorse IEEE/IET Electronic Library InFormare sull uso delle risorse elettroniche Risorse specialistiche. Politecnico

Struttura del formato MARC21 Bibliografico per la catalogazione delle risorse elettroniche. Griglia consigliata dei campi a lunghezza variabile.

DESY è un prodotto ideato e sviluppato da

ARCHIVIAZIONE DOCUMENTALE NEiTdoc

MC2 SERVIZI INFORMATICI S.r.l. LA DIGITALIZZAZIONE DEI DOCUMENTI CARTACEI

Il ciclo dell informazione scientifica ed il ruolo dei professionisti dell informazione

La biblioteca digitale IOV - IRCCS Una guida rapida al sito web

informarisorse Discovery service Summon InFormare sull uso delle risorse elettroniche Risorse multidisciplinari

Risorse e strumenti per la ricerca bibliografica

informarisorse Tracciarisorse InFormare sull uso delle risorse elettroniche Risorse multidisciplinari

Dall Archivio al Polo tecnologico dell audiovisivo didattico e documentale per l Alto Lazio

Concorso 197 Prima Prova TEST 2 1

[ PIANO DI ADEGUAMENTO SITO WEB ]

EXPLOit Content Management Data Base per documenti SGML/XML

PROCESSO DI INDICIZZAZIONE SEMANTICA

I.T.C. Mario Pagano Napoli

GUIDA OPAC SEBINA Come utilizzare il catalogo della Biblioteca Medica. Modalità di ricerca e servizi al lettore

GUIDA ALL USO DEI CATALOGHI ONLINE

Un portale per l editoria medico-scientifica italiana

Il seguente Syllabus è relativo al Modulo 7, Reti informatiche, e fornisce i fondamenti per il test di tipo pratico relativo a questo modulo

Librerie digitali. Introduzione. Cos è una libreria digitale?

Informatica Industriale Modello funzionale: Informazione Progettazione concettuale

Relazione introduttiva Febbraio 2006

Protocollo Informatico (D.p.r. 445/2000)

Ipertesti e Internet. Ipertesto. Ipertesto. Prof.ssa E. Gentile. a.a

Banche dati italiane per Scienze della Formazione. di Ilaria Moroni

COSA STAI CERCANDO? STRUMENTI E RISORSE PER LA RICERCA BIBLIOGRAFICA

MetaMAG METAMAG 1 IL PRODOTTO

Informatica Industriale Modello funzionale Casi d uso

Addition X DataNet S.r.l.

Biblioteca di Ateneo: servizi e strumenti per la ricerca. di Ilaria Moroni

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

RECOGNITION ProductInfo

Applicazione: InfoDir: Information Directory, il Catalogo dei dati e dei servizi

2.1 Introduzione ai linguaggi di marcatura

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

Dynamic 07 -Software per la lettura ottica e data capture. G.Q.S. Srl Global Quality Service Via Bernini, 5/7 Corsico (MILANO)

Organizzazione delle informazioni: Database

Macchine per l elaborazione dell informazion e. Sistemi di Elaborazione delle Informazioni. Informatica II

Protocollo Informatico (D.p.r. 445/2000)

P.O.R. SARDEGNA MISURA 3.13 ALLEGATO A. SCHEDA PROGETTO per la creazione di BIBLIOTECA SCIENTIFICA REGIONALE

Protezione delle registrazioni di tracciamento da modifiche non autorizzate A R.1.6 [TU /52/1/b]

Guide e tutorial di RCS Education. Guida MOSAICO

ELEMENTI ESSENZIALI DEL PROGETTO. SETTORE e Area di Intervento: Patrimonio artistico e culturale (D)- cura e conservazione biblioteche (01)

E completamente personalizzabile potrete variare colori, i Vs. dati i riferimenti per i contatti, i prodotti in tempo reale.

PROGRAMMAZIONE MODULARE. Periodo mensile. Ore previste

OGNI GIORNO SELEZIONIAMO LE NEWS CHE PARLANO DI TE

BANCHE DATI. Informatica e tutela giuridica

INFORMATICA LE470 Editoria multimediale - Definizioni

BOOKMARKWEB NOTE DI RILASCIO

Sistema di Gestione Documentale V.2.5.x. ARCHIVIAZIONE OTTICA, FASCICOLAZIONE E PROTOCOLLO V.2.5.x

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

I database relazionali (Access)

La piattaforma di lettura targhe intelligente ed innovativa in grado di offrire servizi completi e personalizzati

regolamento scuola primaria e secondaria

Sistemi Informativi e Basi di Dati

Una biblioteca per il Sociale

Bollettino Ufficiale della Regione Puglia n. 177 del

Sebina OpenLibrary OPAC

PROGRAMMAZIONE MODULARE DI INFORMATICA CLASSE QUINTA - INDIRIZZO MERCURIO SEZIONE TECNICO

Alfa Layer S.r.l. Via Caboto, Torino ALFA PORTAL

4Serials Opendoc Document Management System

Transcript:

2 La Ricerca dell Informazione: Oggetti e Attori BIBLIOTECONOMIA E RICERCA DELLE INFORMAZIONI IN INTERNET Informatica Generale (AA 2014-15) Documento Documento 3 4 conoscenze e informazioni letteratura di riferimento per una specifica disciplina informazione fattuale (dati) sono registrate su supporti fisici documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale risorsa continuativa (più frequente in ambito analogico): documento costituito da più parti che si aggiungono successivamente al contenuto iniziale (es.: rivista, opera multivolume) risorsa integrativa (più frequente in ambito digitale): documento il cui contenuto è modificato con frequenza elevata (es. home page di un sito web) ciclo di vita: periodo di tempo nel quale il contenuto del documento è aggiornato o rilevante Documenti nel Web 5 difficoltà valutare il grado di aggiornamento stabilire i confini del documento (contenuti esterni integrati mediante link ipertestuali, riorganizzazione dei contenuti) contestualizzare l'informazione (capire quale documento si sta consultando) 6 L'Information Retrieval 1

Esigenza Informativa Ricerca di Informazioni 7 8 Anomalous State of Knowledge (ASK) percezione soggettiva di una lacuna di conoscenza che determina una ricerca d informazione tacit knowledge retrieval: rivolgersi ad un esperto information retrieval: interrogare il catalogo di una biblioteca, una web directory, un motore web full text retrieval: consultare un documento reference linking: consultare i documenti riferiti in un documento Information Retrieval (IR) Ricerca dell Informazione 9 processo interattivo richiesta (query) formulata dall utente (chi cerca le informazioni) risposta (result) fornita da un sistema che seleziona, tra tutte le informazioni di cui dispone, quelle pertinenti con la query indicizza le informazioni (indica come reperire i documenti che le contengono) ordina le informazioni secondo il grado di rilevanza (relevance ranking) non fornisce direttamente conoscenza sull'argomento ma informa sull'esistenza (o non esistenza) e sulla localizzazione di fonti 10 definire il target informativo (argomento, aspetti principali, limitazioni linguistiche, temporali ) tradurre il target in un profilo di ricerca (stringa di termini e relazioni tra essi) inserire il profilo in uno o più sistemi di information retrieval in base a numerosità e bontà dei risultati riformulare il profilo di ricerca allargare la ricerca (pearl growing) restringere la ricerca (onion peeling) navigare tra le citazioni (citation search) una volta raggiunto un set soddisfacente filtrarlo ed ordinarlo (ranking) monitorare le fonti nel tempo (aggiornamento) Information Retrieval 11 disciplina tecnico/scientifica nata negli anni 50 classical IR: nelle DB web IR: nei motori di ricerca 12 Indicizzazione dei Documenti e Metadati 2

Query Query 13 14 query con termini generici su motore generalista es: Umberto Eco tesi su Google (circa 250.000 risultati) query con valori qualificati su motore specialistico es. "ricerca libri avanzata" su Google Libri Titolo = tesi Autore = Umberto Eco 4 risultati Metadati per l IR Indicizzazione 15 Ih kj kjh kjh kjh kjh metadato kjh jj lkj lkj lkj lkj lkj lkj lkj lkj lkj lkj lkj metadato lkj lkj lkj lkj lk jlk jlk jlk jl kjl kj lkj lkj lkjl kj lkj lkj lkj. Lkj lkj lk jlk jlk jlk jl kjlmetadato kj lkj lkj lkj lkj lkj lkj lkj. hgfhhgf hgf hgf hgmetadato hgf hgf hgf hgf hg hgf hgf hggf hgf hf hgf hgfh gfhgf hgf hgf hgf hg hgf. metadato gjh jhg jhg jh jhg jhg metadato: attributo strutturato del documento che ne promuove il reperimento indicizzazione: inserimento di metadati (cercando di anticipare i criteri di ricerca) record: insieme di metadati che fornisce una descrizione sufficientemente articolata del documento schema di metadati: insieme predefinito di elementi che per ogni metadato indicano nome (etichetta) valore che può assumere regole di utilizzo formati di scambio (per la condivisione con altri sistemi) 16 manuale catalogatore: operatore umano specializzato che si occupa dell indicizzazione (di solito solo da frontespizio e poche altre parti (paratesto)) abstract: indicizzazione di articoli scientifici da parte dell autore social tagging: indicizzazione distribuita nel web automatica eseguita da un sistema di IR può essere su tutto il testo (full text indexing) Metadati ISBN 17 descrittivi (es. titolo, autore, lingua, data di pubblicazione ) identificatore (es. ISBN, DOI ) semantici: riguardano il contenuto intellettuale (es. parole chiave, abstract, codice di classificazione ) di localizzazione: riguardano l esemplare fisico o copia del documento (es. segnatura, URL ) amministrativi e gestionali: riguardano le modalità di archiviazione e manutenzione strutturali: collegano le varie componenti di risorse composte 18 International Standard Book Number www.isbn.it 13 cifre (5 parti separate da - ) prima parte (3 cifre): identifica il tipo di manufatto (libro: 978 e in futuro anche 979) seconda parte: area linguistica (identifica il Paese o l'area linguistica dell'editore) terza parte: prefisso editore (identifica l'editore/marchio editoriale) quarta parte: numero identificativo del titolo quinta parte (1 cifra): numero di controllo (garanzia contro possibili errori) 3

DOI Metadati 19 20 Digital Object Identifier: standard che consente l'identificazione duratura, all'interno di una rete digitale, di qualsiasi entità che sia oggetto di proprietà intellettuale (testi, immagini, risorse audio o video, software ) e di associarvi metadati www.doi.org benefici: persistenza (alla modifica dell ubicazione del materiale ) cooperazione con altri dati, provenienti da altre fonti estensibilità (possibile aggiungere nuove caratteristiche e servizi attraverso l amministrazione dei Gruppi dei DOI Name) indipendenza dalla piattaforma aggiornamenti dinamici esterni: registrati all esterno del documento primario, in un documento secondario (surrogato) (es. scheda catalografica) interni: all interno del documento primario specifici tag nei documenti digitali (es. tag nello header dei file HTML) Elenchi di Record di Metadati 21 indici: liste di surrogati, supportano il browsing (es. bibliografie, web directory ) gestiti in modalità DB: supportano ricerche più articolate (es. cataloghi online di biblioteche ) 22 La Biblioteca come Sistema di IR Biblioteca Tradizionale Biblioteca: Evoluzione 23 missione: rendere liberamente accessibili le informazioni di interesse per il pubblico di riferimento funzioni: selezionare e acquisire documenti disporli fisicamente nella collezione segnalarne la presenza agli utenti (catalogo, strumenti di disseminazione) facilitarne la ricerca e l accesso (reference: istruzione e aiuto agli utenti) gestirne la circolazione (consultazione, prestito, copie analogiche e digitali (download)) conservarli (riordino, pulizia, rilegatura, sostituzione) scartarli (al termine del ciclo di vita) 24 documenti digitali (testuali e multimediali): ebooks, ejournals, banche dati, audio, video, immagini accesso remoto necessità di confrontarsi con le nuove realtà di gestione e circolazione delle conoscenze (web ) funzioni di gestione: automazione, accesso online 4

IR in Biblioteca Catalogo 25 biblioteca a scaffale aperto disposizione fisica dei documenti per argomento browsing a scaffale biblioteca a scaffale chiuso catalogo: collezione di surrogati (schede catalografiche) intestazione (punto di accesso): metadato utilizzato come criterio di ordinamento segnatura: metadato che indica la collocazione fisica descrizione: altri metadati 26 catalogo per autore/titolo intestazione = cognome dell autore o titolo per opere anonime o collettive, riviste catalogo per soggetto intestazione = stringa di testo che esprime l argomento catalogo cartaceo schede mobili in cassetti catalogo informatizzato realizzato con DB OPAC (Online Public Access Catalog) Catalogazione Bibliografica OPAC: Esempio 27 ramo della biblioteconomia (library science) principi internazionali di catalogazione: Statement of International Cataloguing Principles (2009) Functional Requirements for Bibliographic Records (FRBR) standard catalografici: schemi di metadati metadati descrittivi International Standard Bibliographic Description (ISBD) (2011) codici di catalogazione nazionali: in Italia: Regole Italiane di Catalogazione (REICAT) metadati semantici testuali (soggetti) in Italia: Nuovo Soggettario (2006) metadati semantici codificati (codici di classificazione) Classificazione Decimale Dewey 28 OPAC della Biblioteca Nazionale Centrale di Firenze http://opac.bncf.firenze.sbn.it/opac Registrazione Bibliografica Registrazione Bibliografica 29 30 record bibliografico visualizzazione nell OPAC intestazione segnatura visualizzazione in formato UNIMARC XML (formato di scambio internazionale tra le biblioteche basato su XML) punti di accesso indispensabili: metadati indicizzati più utilizzati come criteri di ricerca (titolo, autore, soggetto, anno, identificatore standard) punti di accesso aggiuntivi: gli altri metadati (Paese, lingua ) 5

Controllo di Autorità 31 effettuato dal catalogatore per risolvere problemi di omonimia (più autori con lo stesso nome) sinonimia (più nomi per lo stesso autore) si crea un record di autorità e le varianti sono rinvii ad esso 32 FRBR: Modello Concettuale 33 Entità dell Universo Bibliografico opera: puro contenuto intellettuale di un documento espressione: modo in cui l opera si realizza (es. in forma di testo, in forma di immagini in movimento ) manifestazione: l oggetto fisico in cui l espressione si materializza (es. il libro, il film ) esemplare: la singola copia che istanzia la manifestazione (es. una copia del libro o di un DVD ) 34 Relazioni tra Documenti di equivalenza: tra i documenti cambia solo la manifestazione (es. fotocopie, ristampe, digitalizzazioni ) derivativa: cambia solo l espressione (es. traduzioni, nuove edizioni, revisioni, riduzioni cinematografiche) descrittiva: cambia l opera: uno dei documenti commenta, critica, recensisce o analizza l altro Relazioni tra Documenti 35 sequenziale: un documento continua l altro (es. sequel di un film) di accompagnamento: un documento si aggiunge ad un altro (es. supplemento di una rivista) 36 La Catalogazione Semantica: la Soggettazione 6

Soggettazione Soggettazione: Esempio 37 38 descrizione dell argomento principale (aboutness) del documento con una o più stringhe di testo strutturate (soggetti) i termini della stringa sono scelti da un vocabolario controllato regole in Italia: Nuovo Soggettario (2006) prima fase: analisi concettuale titolo: Adolescenti tra piazze reali e piazze virtuali soggetto: Oggetto: Adolescenti Azione: Adolescenti Relazioni sociali Luogo: Adolescenti Relazioni sociali Bergamo Forma del contenuto: Adolescenti Relazioni sociali Bergamo Inchieste sociologiche Controllo del Vocabolario 39 linguaggio di indicizzazione: vocabolario dei termini utilizzati per la soggettazione non controllato: utilizza i termini contenuti nel documento da catalogare (es. liste di keyword) controllato: si basa su un vocabolario controllato, elenco di descrittori, termini preferiti cui sono associati termini nonpreferiti (sinonimi, quasi sinonimi, forme varianti ) thesauro: vocabolario controllato con indicazione delle relazioni tra i descrittori di concetti correlati esistono anche in versione multilingue 40 La Catalogazione Semantica: la Classificazione 41 Classificazione Bibliografica classificazione dei documenti in aree disciplinari attribuisce ad ogni documento un codice alfabetico numerico misto utile anche per la collocazione a scaffale si basa su uno schema di classificazione ambito di applicazione generale: per l intero sapere umano specialistico: per singole discipline rappresentazione dei concetti enumerativo: i concetti sono elencati gerarchicamente a faccette: ogni concetto è la combinazione di singoli termini (faccette) 42 Classificazione Decimale Dewey Melvil Dewey (1851 1931): bibliotecario statunitense Dewey Decimal Classification lo schema più diffuso nel mondo 30 lingue 135 Paesi 60 biblioteche nazionali schema generale, enumerativo codice numerico 7

Classificazione Decimale Dewey CDD: Esempio 43 classificazione gerarchica del sapere 10 classi (aree disciplinari) 000: generalità 100: flosofia 200: religione 300: scienze sociali 400: linguaggio 500: scienze naturali e matematiche 600: tecnologia (scienze applicate) 700: belle arti e arti decorative 800: letterature 900: geografia - storia 44 Zangara Aldo, Il post-infarto e le patologie associate: interventi preventivi, curativi e riabilitativi nella pratica clinica, Piccin, 1997, ISBN 88-299-1353-7 600 scienze applicate 610 medicina 616 malattie 616.1 specifiche malattie 616.12 malattie del cuore 616.123 malattie delle coronarie 616.1237 infarto miocardico 616.123705 misure preventive OPAC: Navigatore Dewey 45 46 La Biblioteca Specialistica Come Produttore di Contenuti Barriere all Accesso Accesso Aperto 47 48 non sempre è possibile accedere al testo pieno di un documento barriere economiche: richiesta di abbonamento o pay-per-view barriere legali: legate al copyright, strumenti di digital rights management inibiscono alcuni utilizzi (stampa, download ) barriere tecniche formati proprietari che richiedono SW a pagamento formati non interoperabili forme non fruibili per i disabili open access (OA) dagli anni 1980, la comunità scientifica percepisce Internet come strumento ideale pe il libero scambio di informazioni 8

Licenze Creative Commons Biblioteca Digitale 49 licenze di diritto d'autore redatte da Creative Commons (CC), ente non-profit USA possono essere applicate a tutti i tipi di opere dell'ingegno via di mezzo tra copyright completo (full-copyright) e pubblico dominio (public domain) some rights reserved ("alcuni diritti riservati"): l'autore decide quali diritti riservarsi e quali concedere liberamente salvaguardano il riconoscimento della paternità intellettuale 50 Digital Library: servizio informativo in cui le risorse sono disponibili in formato digitale le funzioni di acquisizione, archiviazione, preservazione, recupero e accesso sono realizzate con tecnologie digitali Modalità di Consultazione Vantaggi in Consultazione 51 distribuzione remota di file per consultazione off-line consultazione online in ambiente web consultazione avanzata con sistemi di information retrieval o sistemi di analisi testuale 52 comodità e rapidità accesso a documenti rari, deperibili, di difficile consultazione nessun limite di spazio e tempo accesso contemporaneo per diversi utenti possibile interrelazione tra documenti eterogenei personalizzazioni facile riutilizzo (copia e incolla) dei contenuti network tra gli utenti Formato dei Documenti Digitalizzazione dei Testi 53 54 immagine raster (copia anastatica digitale) codifiche puro testo (ASCII, UNICODE ) formati applicativi proprietari (Postscript, PDF, RTF ) formati non proprietari (CoCoA, DBT ) linguaggi di marcatura (HTML, XML, SGML ) speech recognition dall originale o anastatiche digitali a MRF OCR (Optical Character Recognition) riconoscimento vocale (speech recognition) il testo deve essere letto più adatto dell OCR per manoscritti o stampe antiche 9

Archivio Aperto Rivista Scientifica ad Accesso Aperto 55 biblioteca digitale che supporta l autoarchiviazione dei documenti da parte degli autori nasce in ambito accademico per supportare la circolazione del sapere tra i ricercatori archivio istituzionale: supporta i ricercatori collegati ad un istituzione (tesi, preprint, dispense, slide ) archivio disciplinare: contributi in un ambito scientifico da tutto il mondo 56 rivista scientifica con comitato editoriale con processo di revisione per la selezione degli articoli pubblicata in un archivio aperto 57 FINE 10