PROCESSO DI INDICIZZAZIONE SEMANTICA



Documenti analoghi
L INDICIZZAZIONE SEMANTICA

EMILIO BERTOCCI I LINGUAGGI DI INDICIZZAZIONE

Database. Si ringrazia Marco Bertini per le slides

Progettaz. e sviluppo Data Base

Corso di Valutazione Economica dei Progetti e dei Piani. Marta Berni AA

SCENARIO. Personas ALICE Lucchin / BENITO Condemi de Felice. All rights reserved.

Costruzione del thesaurus, analisi a faccette, categorie

APPUNTI DI MATEMATICA ALGEBRA \ INSIEMISTICA \ TEORIA DEGLI INSIEMI (1)

Strumenti di modellazione. Gabriella Trucco

Capitolo II. La forma del valore. 7. La duplice forma in cui si presenta la merce: naturale e di valore.

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

L indicizzazione per soggetto

Nuovo soggettario. Gruppo Soggetti Sbt

La Convenzione sui diritti dell infanzia

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Capitolo 13. Interrogare una base di dati

Conclusioni del Garante europeo per la protezione dei dati innanzi al Tribunale dell Unione Europea Caso T-343/13 Lussemburgo, 24 Marzo 2015

Appunti sulla Macchina di Turing. Macchina di Turing

Calcolatori: Algebra Booleana e Reti Logiche

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

II.f. Altre attività sull euro

Esercitazione di Basi di Dati

Organizzazione degli archivi

LINGUA COMUNITARIA INGLESE SCUOLA SECONDARIA CLASSE PRIMA

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente

Dalla progettazione concettuale alla modellazione di dominio

risulta (x) = 1 se x < 0.

Cercare documenti Web

Lezioni di Matematica 1 - I modulo

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale.

Progettazione di Basi di Dati

MANUALE MOODLE STUDENTI. Accesso al Materiale Didattico

Il concetto di valore medio in generale

Strutturazione logica dei dati: i file

LE CARATTERISTICHE DEI PRODOTTI MULTIVARIANTE

Volontariato. Sulle delibera della regione Marche che trasferisce al Centro servizi volontariato risorse per sostenere progetti delle associazioni

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

LABORATORIO DI INFORMATICA

Introduzione all Information Retrieval

L EFFICACIA DELLE MISURE DI POLITICA ATTIVA DEL LAVORO REALIZZATE IN PROVINCIA DI TORINO NEL

Esercizio data base "Biblioteca"

Nota interpretativa. La definizione delle imprese di dimensione minori ai fini dell applicazione dei principi di revisione internazionali

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

LINGUA INGLESE E SECONDA LINGUA COMUNITARIA

Corrispondenze e funzioni

GUIDA ALLA RILEVANZA

Soluzione dell esercizio del 2 Febbraio 2004

Excel. A cura di Luigi Labonia. luigi.lab@libero.it

Indice. pagina 2 di 10

Appendice III. Competenza e definizione della competenza

Sistema Informativo Geografico:

Pro e contro delle RNA

Quali sono le ragioni per passare alle competenze? Stimoli esterni: Consiglio europeo di Lisbona (22-23/03/2000);

Corso di. Dott.ssa Donatella Cocca

IL CATALOGO E LA CATALOGAZIONE EMILIO BERTOCCI IL CATALOGO E LA CATALOGAZIONE

Ministero delle Attività Produttive

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da

Gli attributi di STUDENTE saranno: Matricola (chiave primaria), Cognome, Nome.

1 Giochi a due, con informazione perfetta e somma zero

Automazione Industriale (scheduling+mms) scheduling+mms.

Le competenze per la gestione e lo sviluppo delle risorse umane nelle università e negli enti di ricerca

Algebra di Boole ed Elementi di Logica

ATTIVITA E TECNICHE PER L INSEGNAMENTO DELL ITALIANO L2 BIBLIOGRAFIA ESSENZIALE Piacenza IV Circolo didattico Marta Pioggiosi

INGLESE CLASSE PRIMA

Corso di Informatica

Osservazioni sulla continuità per le funzioni reali di variabile reale

Introduzione ai database relazionali

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate

IL MIO PRIMO SITO: NEWS

Che cosa e come valutano le prove di matematica e con quali risultati. nell A.S

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Soluzione di equazioni quadratiche

PROGETTO REGIONALE MISURAZIONE E VALUTAZIONE DELLE BIBLIOTECHE VENETE

Corso di Informatica

CALCOLO COMBINATORIO

Le Mappe di Karnaugh.

Officina Meccanica. Analisi, progetto e sviluppo

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

2. Semantica proposizionale classica

COMPETENZE DI BASE IN LINGUA INGLESE TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE FISSATI DALLE INDICAZIONI NAZIONALI PER IL CURRICOLO 2012

Consenso Informato e Privacy

SCUOLA PRIMARIA SCIENZE NATURALI E SPERIMENTALI. Competenza: 1. Comunicazione efficace Indicatore: 1.1 Comprensione

I WEBQUEST SCIENZE DELLA FORMAZIONE PRIMARIA UNIVERSITÀ DEGLI STUDI DI PALERMO. Palermo 9 novembre 2011

Il test può essere fatto seguendo alcune semplici indicazioni: Nelle aree segnalate (risposta, domanda successiva, spazio con la freccia,) sono

BASI DI DATI - : I modelli di database

Database 1 biblioteca universitaria. Testo del quesito

UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI

Raccomandazione del Parlamento europeo 18/12/2006 CLASSE PRIMA COMPETENZE ABILITÀ CONOSCENZE. Operare con i numeri

ARCHIVI E DATABASE (prof. Ivaldi Giuliano)

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Dimensione di uno Spazio vettoriale

PROGRAMMAZIONE ANNUALE PER L INSEGNAMENTO DELLA LINGUA E CIVILTA INGLESE - I BIENNIO ANNO SCOLASTICO 2013/2014

IL PORTFOLIO EUROPEO DELLE LINGUE. Mónica Sandra Lista Rodríguez

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Il sistema operativo: interazione con l utente

Transcript:

PROCESSO DI INDICIZZAZIONE SEMANTICA INDIVIDUAZIONE DEI TEMI/CONCETTI SELEZIONE DEI TEMI/CONCETTI ESPRESSIONE DEI CONCETTI NEL LINGUAGGIO DI INDICIZZAZIONE

TIPI DI INDICIZZAZIONE SOMMARIZZAZIONE INDICIZZAZIONE ESAUSTIVA PRINCIPALI SECONDARI MARGINALI TEMI/CONCETTI I concetti principali sono quelli che costituiscono l'oggetto principale di un documento, quelli secondari rivestono minore importanza ma hanno comunque un rilievo autonomo, quelli marginali sono trattati solo in funzione di altri concetti, oppure la loro trattazione ha dimensioni insignificanti. Esempio di concetti secondari: si può segnalare con un soggetto la presenza di una bibliografia di notevole rilievo in una pubblicazione il cui oggetto principale è un altro. Esempio di concetti marginali: la trattazione dei singoli episodi della vita di una persona nell'ambito di una biografia (il concetto di biografia infatti di per sé li ingloba tutti). NOTA: la terminologia non è standard. Queste distinzioni sono ispirate soprattutto ai lavori di Benedetto Aschero.

LINGUAGGIO NATURALE LINGUAGGIO DI INDICIZZAZIONE POSTCOORDINAZIONE PRECOORDINAZIONE PAROLE CHIAVE CLASSIFICAZIONE SOGGETTI Interpretazione del prospetto. All'uso del linguaggio naturale per l'indicizzazione è generalmente associata la postcoordinazione e l'uso di parole chiave, mentre all'uso di un linguaggio artificiale di indicizzazione sono generalmente associati sistemi di classificazione e soggetti. Questa ripartizione però non è assoluta: infatti le parole chiave possono essere formulate sulla base di un linguaggio di indicizzazione. Risulta invece difficile pensare all'uso di sistemi di classificazione e alla formulazione di soggetti complessi nell'ambito del linguaggio naturale.

CHE COSA NON SI SOGGETTA secondo alcune concezioni tradizionali Vi sono alcune categorie di opere che talvolta vengono indicate come non adatte alla soggettazione. In questo prospetto si tenta di riassumerle e di dare una valutazione sulla fondatezza di questa esclusione. OPERE GENERALI (es. enciclopedie e periodici generali) Corretto non soggettarle perché il loro ambito è troppo vasto e non può essere espresso né da un soggetto unico né da una quantità ragionevole di soggetti. Si dà però un soggetto formale che indichi il tipo di pubblicazione. OPERE DI FANTASIA Si possono soggettare usando un linguaggio di indicizzazione che lo permetta (anzi, si tratta di cosa molto utile). Il Soggettario di Firenze e il Nuovo Soggettario non possono essere usati per questo scopo. CLASSICI Si soggettano normalmente perché ovviamente hanno un contenuto concettuale esattamente come le opere di altro genere. Non si capisce perché si dovrebbe presupporre che i lettori interessati li conoscano già (motivazione addotta in alcuni testi di biblioteconomia), e perché si dovrebbe comunque impedire di trovarli, insieme ad altre opere, in una ricerca per soggetto. OPERE NON RECENTI E SUPERATE Si soggettano normalmente. L'indicazione contraria può derivare dall'idea che il vero catalogo della biblioteca sia quello per autori, mentre il catalogo per soggetti sarebbe una sorta di catalogo popolare utile per le esigenze più correnti di informazione. In realtà una indicizzazione per soggetto appropriata serve da supporto anche per ricerche sofisticate e quindi deve indicare tutto ciò che è pertinente, lasciando al lettore il compito di valutare che cosa è utile per le sue ricerche. LIBRI ANTICHI Si soggettano normalmente perché hanno un contenuto concettuale come gli altri per cui non si capisce che cosa si opponga a soggettarli (a meno che si usi un linguaggio di indicizzazione che non permette di esprimerne i concetti). Inoltre non si vede perché dovrebbe esserci questo limite per le edizioni antiche, mentre le edizioni moderne delle stesse opere si classificano senza problemi con la Dewey. ATTENZIONE: la cosa è controversa e diversi catalogatori dell'antico non sarebbero d'accordo.

Un linguaggio di indicizzazione deve essere comprendere: un vocabolario, cioè un insieme di termini (inteso in senso ampio, può trattarsi di descrittori, classi ecc.) in base ai quali formulare le voci utili all'indicizzazione una notazione, cioè una specificazione di quali simboli vanno usati per esprimere i termini e la sintassi (ad esempio, la Dewey ha una notazione numerica, il Nuovo Soggettario usa il linguaggio naturale una sintassi, cioè le regole per combinare gli elementi del vocabolario per costruire soggetti complessi o per combinare diverse classi una semantica che stabilisce come termini, classi e soggetti vanno interpretati. La semantica dei linguaggi di indicizzazione si può ricondurre a due tipologie largamente utilizzate nell'ambito della logica, della linguistica e della filosofia del linguaggio. SEMANTICA ESTENSIONALE I termini/concetti si riferiscono ad una collezione di oggetti e non alle loro caratteristiche distintive. Esempio: il termine uomo in senso estensionale si riferisce alla collezione degli esseri umani, e non alle caratteristiche per cui essi sono tali piuttosto che un'altra cosa. Un'importantissimo esempio di teoria con semantica intensionale è la teoria degli insiemi (e in particolare l'assiomatizzazione di Zermelo-Fraenkel), per la quale un insieme si identifica con una collezione di oggetti (assioma di estensionalità: un insieme è determinato unicamente ed univocamente dai suoi elementi), e per questo, ad esempio, esiste un solo insieme vuoto e un oggetto può far parte solo una volta di uno stesso insieme (un insieme non ha elementi duplicati). SEMANTICA INTENSIONALE I termini/concetti si riferiscono alle caratteristiche distintive degli oggetti (caratteristiche che possono essere intrinseche agli oggetti stessi o essere relative ad una modalità di conoscenza o rappresentazione). Per quanto riguarda l'indicizzazione semantica si può affermare che: il Soggettario di Firenze, il Nuovo Soggettario e per lo più i soggettari hanno una semantica estensionale, perché le loro voci si riferiscono a collezioni di oggetti (le cose di cui i documenti parlano) la Classificazione Decimale Dewey e in generale le classificazioni per materia hanno una semantica intensionale perché il loro criterio fondamentale di suddivisione è la materia, ossia un punto di vista, una modalità di conoscenza

TIPOLOGIE DI SISTEMI DI CLASSIFICAZIONE Secondo la struttura: enumerativi: enumerano tutte le singole classi (esempi: Dewey nella prima edizione) a fondamento enumerativo: enumerano un insieme di classi immediatamente utilizzabili ma, attraverso apposite regole, permettono anche la formulazione di classi non elencate espressamente (esempi: Dewey nelle edizioni recenti) sintetiche: le classi vengono formulate combinando, attraverso apposite regole, degli insiemi di concetti di base, che vengono comunque enumerati espressamente (esempi: Classificazione Colon); una parte enumerativa è necessaria, altrimenti sarebbe definita solo la sintassi ma non il vocabolario della classificazione Secondo la notazione: linguaggio naturale: le classi vengono espresse utilizzando termini del linguaggio naturale (nell'ambito di apposite regole); tipico soprattutto dei soggettari e dei tesauri, difficilmente utilizzato nelle classificazioni linguaggio artificiale: le classi vengono espresse utilizzando una notazione diversa dal linguaggio naturale, consistente ad esempio in numeri o in combinazioni di numeri e lettere notazione espressiva della struttura: la notazione ha una struttura che corrisponde alla struttura logica della classificazione; ad esempio la notazione Dewey rappresenta la gerarchia delle classi e sottoclassi: 025.4 è una classe che fa parte di 025, che a sua volta fa parte di 020 che a sua volta fa parte di 000 notazione non espressiva della struttura: la notazione individua univocamente una classe ma non ne esprime la struttura logica