RICERCA DELL INFORMAZIONE

Documenti analoghi
Rappresentazione della Conoscenza. Lezione 10. Rappresentazione della conoscenza, D. Nardi, 2004, Lezione 10 0

Lo schema complessivo con cui opera il servizio è quello rappresentato in figura. 1

I WEBQUEST SCIENZE DELLA FORMAZIONE PRIMARIA UNIVERSITÀ DEGLI STUDI DI PALERMO. Palermo 9 novembre 2011

SOLUZIONI INFORMATICHE PER LO STUDIO LEGALE

DPCM 31 OTTOBRE 2000 (G. U , SERIE GENERALE, N. 272) REGOLE TECNICHE PER IL PROTOCOLLO INFORMATICO DI CUI AL DECRETO DEL PRESIDENTE DELLA

LA SOLUZIONE PROPOSTA E L ATTIVAZIONE DEL SERVIZIO Luisa Semolic Insiel S.p.A.

ƒ Gli standard e la gestione documentale

[ PIANO DI ADEGUAMENTO SITO WEB ]

Archiviazione ottica documentale

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

Introduzione all Information Retrieval

La gestione del documento

Architettura del. Sintesi dei livelli di rete. Livelli di trasporto e inferiori (Livelli 1-4)

di Grazia Lucantoni a.s

Modello OAIS. Modello di riferimento. Il Modello. Prof.ssa E. Gentile a.a Un modello di riferimento dovrebbe descrivere:

Anno scolastico 2015 / Piano di lavoro individuale. ITE Falcone e Borsellino. Classe: IV ITE. Insegnante: DEGASPERI EMANUELA

Protezione delle registrazioni di tracciamento da modifiche non autorizzate A R.1.6 [TU /52/1/b]

Ipertesti e Internet. Ipertesto. Ipertesto. Prof.ssa E. Gentile. a.a

EXPLOit Content Management Data Base per documenti SGML/XML

La pubblicazione online degli elaborati tecnici degli strumenti urbanistici

Analisi dei requisiti e casi d uso

1. BASI DI DATI: GENERALITÀ

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web

SOFTWARE A SUPPORTO DELLA GESTIONE AMMINISTRATIVA DELLO SPORTELLO UNICO SPECIFICA DEI REQUISITI UTENTE

Il motore semantico della PA piemontese. Marta Garabuggio - Regione Piemonte Carlo Fortunato CSI - Piemonte

Lezione 1. Introduzione e Modellazione Concettuale

MANUALE DELLA QUALITÀ Pag. 1 di 6

TECNOLOGIA - SCUOLA PRIMARIA

Regolamento GESTIONE E AGGIORNAMENTO SITO WEB ISTITUZIONALE

Dall Archivio al Polo tecnologico dell audiovisivo didattico e documentale per l Alto Lazio

Il glossario della Posta Elettronica Certificata (PEC) Diamo una definizione ai termini tecnici relativi al mondo della PEC.

SCUOLA PRIMARIA I.C. di CRESPELLANO PROGRAMMAZIONE ANNUALE DI TECNOLOGIA E INFORMATICA

IL PORTAFOGLIO EUROPASS PER LA TRASPARENZA E LA MOBILITÀ. Luogo Presentazione: Verona Autore: Silvia Lotito Data: 27 novembre 2015

SPERIMENTAZIONE DEL SERVIZIO DI SUPPORTO PER LA GESTIONE DEI RICORSI TRIBUTARI IN MATERIA DI FISCALITA LOCALE (ICI/IMU TARES)

Dematerializzare per Semplificare

Informazione e dato. Gabriella Trucco

La Metodologia adottata nel Corso

Unipi EPrints, l'archivio istituzionale dell'università di Pisa

Gestione automatica delle Fatture Elettroniche per la Pubblica Amministrazione (Fatture PA)

COMUNE DI CIGLIANO REGOLAMENTO DELLA RETE CIVICA E SITO INTERNET COMUNALE

ISTITUTO TECNICO ECONOMICO MOSSOTTI

L archivio di impresa

LA CONSERVAZIONE DELLA MEMORIA DIGITALE FIGURE PROFESSIONALI E RESPONSABILITÀ

LE FIGURE PROFESSIONALI PER LA CONSERVAZIONE DEGLI ARCHIVI DIGITALI

Applicazione: InfoDir: Information Directory, il Catalogo dei dati e dei servizi

REALIZZAZIONE LAN

Conservazione del documento informatico ed i conservatori accreditati. Agenzia per l Italia Digitale

BASE DI DATI: introduzione. Informatica 5BSA Febbraio 2015

IL PROBLEMA DELLA RICERCA DI INFORMAZIONI su Internet e sul web

Ministero della Salute

RadarWeb PA Una metodologia per la rilevazione della qualità dei siti web della PA. Palermo, 04 aprile 2012

GESTIONE DELLA FORMAZIONE E

L architettura del sistema può essere schematizzata in modo semplificato dalla figura che segue.

Portale Multicanale delle PA del territorio della Regione Emilia-Romagna: un inizio di rete semantica di informazioni

Il Dipartimento individua conoscenze, abilità e competenze in uscita nel biennio e nel triennio ripartite come segue:

REGOLAMENTO SULLA FACOLTÀ DI ACCESSO TELEMATICO E RIUTILIZZO DEI DATI

2.1 Introduzione ai linguaggi di marcatura

CitySoftware PROTOCOLLO. Info-Mark srl

DESY è un prodotto ideato e sviluppato da

Gli aggiornamenti della normativa italiana e Il Codice dell Amministrazione digitale dlgs 82/05

Breve guida alla ricerca bibliografica on-line. A cura di Tilde Tocci

SCHEDA PRODOTTO PAG. 1 J O B T I M E W F. Variazioni mensili al cartellino presenze. Versione 6.1. JOBTIME Work Flow

PROCESSO DI INDICIZZAZIONE SEMANTICA

A cura di Giorgio Mezzasalma

Laboratorio informatico Banche dati off line

Informatica per la comunicazione" - lezione 10 -

xmlegeseditor un editore open-source per la redazione di testi normativi

commercialista, consulente del lavoro XBOOK la soluzione per l'organizzazione dello studio professionale

Capitolo 5. Cercare informazioni sul Web

DNA ERP Document Management System

I linguaggi di marcatura e XML per la codifica dei dati d archivio

L AIR nell Agenzia Nazionale per la Sicurezza delle Ferrovie (ANSF) Le schede. Osservatorio sull Analisi d Impatto della Regolazione.

Dai sistemi documentari al knowledge management: un'opportunità per la pubblica amministrazione

Il modello di ottimizzazione SAM

APPENDICE C extensible Markup Language

ELEMENTI ESSENZIALI DEL PROGETTO. SETTORE e Area di Intervento: Patrimonio artistico e culturale (D)- cura e conservazione biblioteche (01)

Edok Srl. FatturaPA Light. Servizio di fatturazione elettronica verso la Pubblica Amministrazione. Brochure del servizio

Siti Web e Information Architecture: organizzare i contenuti e strutturare le informazioni

Lezione 8. Motori di Ricerca

Centro Tecnico per la Rete Unitaria della Pubblica Amministrazione

IL SISTEMA INFORMATIVO

PIANO DI LAVORO ANNUALE DEL DIPARTIMENTO DI MATERIA DIPARTIMENTO DI INFORMATICA INDIRIZZO TECNICO SCIENTIFICO NUCLEI FONDAMENTALI DI CONOSCENZE

Domenico Longhi. Dalla Informazione Geografica alla Infrastruttura Geografica. Le attività delle Regioni

La Fatturazione Elettronica

CONSERVAZIONE SOSTITUTIVA

Database. Si ringrazia Marco Bertini per le slides

WORKSHOP W 05 I luoghi e i modi della informazione sulle Scienze della Terra: dalla biblioteca al web. Rimini, 11 Settembre 2007.

Sistema di Gestione Documentale V.2.5.x. ARCHIVIAZIONE OTTICA, FASCICOLAZIONE E PROTOCOLLO V.2.5.x

Capitolo 4 Pianificazione e Sviluppo di Web Part

Piazza dei Martiri, 1/ Bologna

Programmazione per la disciplina Informatica PROGRAMMAZIONE DI MATERIA: INFORMATICA SECONDO BIENNIO AMMINISTRAZIONE FINANZA E MARKETING

REGOLAMENTO PER LA GESTIONE DELL ALBO PRETORIO ON LINE

Motori di ricerca. Andrea Marin

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

Concetti di base di ingegneria del software

- OLIMPIADI DI PROBLEM SOLVING - Informatica e pensiero algoritmico nella scuola dell'obbligo

FORMAZIONE AVANZATA IL CONSERVATORE DEI DOCUMENTI DIGITALI

WebGis - Piano Comprensoriale di Protezione Civile

InterNet: rete di reti

MetaMAG METAMAG 1 IL PRODOTTO

Transcript:

RICERCA DELL INFORMAZIONE

DOCUMENTO documento (risorsa informativa) = supporto + contenuto analogico o digitale locale o remoto (accessibile in rete) testuale, grafico, multimediale

DOCUMENTO risorsa continuativa (ambito analogico): documento costituito da più parti che si aggiungono successivamente al contenuto iniziale (es.: rivista, opera multivolume); risorsa integrativa (ambito digitale): documento il cui contenuto è modificato con frequenza elevate (es. home page di un sito web); ciclo di vita: periodo di tempo nel quale il contenuto del documento è aggiornato o rilevante.

ESIGENZA INFORMATIVA Anomalous State of Knowledge (ASK): percezione soggettiva di una lacuna di conoscenza che determina una ricerca d informazione: ricerca di un documento conosciuto; ricerca di un argomento specifico; esplorazione (browsing) all interno di un ambito disciplinare;

ESIGENZA INFORMATIVA navigazione (surfing) partendo da un documento e seguendo collegamenti; serendipità (serendipity): guidato solo dalla curiosità spero di essere fortunato e trovare qualcosa d interessante.

RICERCA DI INFORMAZIONI tacit knowledge retrieval: rivolgersi ad un esperto; information retrieval: interrogare il catalogo di una biblioteca, una web directory, un motore web ; full text retrieval: consultare un documento; reference linking: consultare i documenti riferiti in un documento.

INFORMATION RETRIEVAL Disciplina tecnico/scientifica nata negli anni 50: classical IR: nelle DB; web IR: nei motori di ricerca

INFORMATION RETRIEVAL Tale disciplina include due attività: 1. Indicizzazione corpus (insieme esteso e strutturato di testi in formato digitale manipolabile da un calcolatore); 2. Ricerca dei documenti di interesse. RILEVANZA

INFORMATION RETRIEVAL La rilevanza è la nozione al centro dell information retrieval! L intento è quello di recuperare tutti i documenti rilevanti riducendo al minimo quelli non rilevanti recuperati.

INDICIZZAZIONE L attività detta di indicizzazione viene effettuata proprio per produrre una descrizione del contenuto di un documento e per associarla, a scopo di ricerca, al documento stesso. Indicizzare un testo significa estrarre un insieme di parole,dette parole chiave, significative per un contesto specifico e associarle al testo originario.

INDICIZZAZIONE Manuale:catalogatore: operatore umano specializzato che si occupa dell indicizzazione (di solito solo da frontespizio e poche altre parti); indicizzazione di articoli scientifici da parte dell autore; social tagging: indicizzazione distribuita nel web.

INDICIZZAZIONE Automatica:eseguita da un sistema di IR; può essere su tutto il testo (full text indexing); Semi-automatica: prodotta dall uomo con l aiuto del computer che suggerisce i termini da usare.

INDICIZZAZIONE Molti sistemi di recupero automatico si affidano a strumenti quali i thesauri. Un thesaurus è una sorta di dizionario gerarchizzato, un insieme strutturato di termini scelti per la capacità di facilitare la descrizione di concetti in un dominio. Strumento documentale di indicizzazione.

INDICIZZAZIONE Un thesaurus consente di rappresentare ogni documento con una selezione rigorosa di parole. Rappresenta un database di termini chiave organizzati semanticamente per argomento: aiuta l utente ad ottimizzare le richieste di informazioni. Roget s thesaurus: http://thesaurus.com/roget-alpha- Index.html

METADATI Un metadato è un informazione che descrive un insieme di dati. Tale concetto ha un ruolo importantissimo nella gestione di qualunque tipo di contenuto informativo o documentale, soprattutto quando l informazione disponibile è molta e deve essere dunque selezionata e organizzata per facilitarne il reperimento e l uso.

METADATI Sono dei mattoni fondamentali del nuovo WEB. Sono dati utilizzati per descrivere e classificare altri dati. Un esempio tipico di metadati è costituito dalla scheda del catalogo di una biblioteca, la quale contiene informazioni circa il contenuto e la posizione di un libro, cioè dati riguardanti i dati che si riferiscono al libro.

METADATI- FUNZIONI La funzione principale di un sistema di metadati è quella di consentire il raggiungimento dei seguenti obiettivi: Ricerca, che consiste nell individuare l esistenza di un documento; Localizzazione, ovvero rintracciare una particolare occorrenza del documento; Selezione, realizzabile analizzando, valutando e filtrando una serie di documenti.

METADATI- TIPOLOGIE Esistono molti tipi possibili di metadati, ne sono state tentate diverse classificazioni, una distinzione abbastanza diffusa è la seguente: Descrittivi; Gestionali-amministrativi; Strutturali.

METADATI- TIPOLOGIE Descrittivi (ad esempio, il titolo di un libro) hanno lo scopo fondamentale di descrivere l informazione primaria. Servono per identificare e recuperare gli oggetti digitali. Un esempio: Dublin Core è un sistema di metadati costituito da un nucleo di elementi essenziali ai fini della descrizione di qualsiasi materiale digitale accessibile via rete informatica.

METADATI- TIPOLOGIE Gestionali-amministrativi usati per la gestione dell oggetto digitale. Essi assumono un importanza preponderante ai fini della conservazione permanente degli oggetti digitali: possono documentare i processi tecnici associati alla conservazione permanente, fornire informazioni sulle condizioni e i diritti di accesso agli oggetti digitali, certificare l autenticità e l integrità del contenuto.

METADATI- TIPOLOGIE Gestionali-amministrativi. Un esempio: OAIS (Open Archival Information System) definisce concetti, modelli e funzionalità inerenti agli archivi digitali e gli aspetti di digital preservation.

METADATI- TIPOLOGIE Strutturali descrivono le relazioni che collegano le parti di un oggetto composito. Forniscono dati di identificazione e localizzazione del documento. Un esempio: XML (extensible Markup Language) è un linguaggio di marcatura che consente di definire e controllare il significato degli elementi contenuti in un documento o in un testo.

XML Rispetto all HTML l'xml ha uno scopo ben diverso: mentre il primo definisce una grammatica per la descrizione e la formattazione di pagine web il secondo è utilizzato per descrivere documenti strutturati. Mentre l HTML ha un insieme ben definito e ristretto di tag, con l'xml è invece possibile definirne di propri; tali tag sono utilizzati per assegnare una semantica al testo.

METADATI I metadati, sono informazione, di norma altamente strutturata, utilizzata per descrivere, strutturare o gestire una risorsa informativa o un insieme di risorse informative attraverso l identificazione di alcune sue proprietà e l assegnazione ad esse di specifici valori.

INTEROPERABILITA Capacità di un sistema o di un prodotto informatico di cooperare e di scambiare informazione con affidabilità e ottimizzazione delle risorse. Necessità di adottare insiemi standardizzati di metadati.

INTEROPERABILITA Si tratta di una prospettiva di estensione dell attuale Rete nella quale l informazione sia fornita con significati ben definiti, maggiormente in grado di abilitare persone e computer a lavorare in cooperazione (Tim Berners Lee - James Hendler - Ora Lassila. The Semantic Web, Scientific American, maggio 2001).

INTEROPERABILITA La Open Archives Initiative (OAI) ha elaborato un quadro di riferimento che si è affermato come modello per l architettura della biblioteca digitale. Le istituzioni pubbliche che intendono valorizzare gli oggetti digitali realizzati per uso pubblico devono tenere in considerazione l estrema rilevanza del modello OAI.