Ipotesi sull'applicazione del modello relazionale a corpora linguistici

Documenti analoghi
BASI DATI: algebra relazionale

Interrogare una base di dati: algebra relazionale e SQL. Savino Castagnozzi Giorgio Macauda Michele Meomartino Salvatore Picerno Massimiliano Sartor

Informatica per le Scienze Umane. Introduzione al corso: programma dettagliato

Basi di Dati: Corso di laboratorio

Concordanze e collocazioni. Analisi del testo letterario 1 Isabella Chiari

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

V. Moriggia Modelli di Base Dati. Modelli di Base Dati. a.a. 2001/

Liste di autorità per l indicizzazione e la conservazione digitale dell archivio del CNUCE e della CGI

Informatica per le Scienze Umane. Introduzione al corso: programma

Ripasso Concetti Pratica in Access Link utili. ECDL - Database. European Computer Driving Licence - Modulo 5 - Database LEZIONE 3

Query. Query (Interrogazioni) SQL SQL. Significato dell interrogazione. Sintassi

Corso di Informatica. Software di produttività personale e database. Ing Pasquale Rota

INFORMATICA PER LE SCIENZE UMANE a.a. 2015/2016

SQL. Il nome sta per Structured Query Language Le interrogazioni SQL sono dichiarative

Prof. Pagani Corrado HTML

Basi di Dati: Corso di laboratorio

Interrogare una base di dati: Algebra relazionale e SQL. Alessandro Bardine Alessandro Ciaramella Vincenzo Galella Rudy Manganelli

1. DML RICORDIAMO. Contenuti: 2.1. Le principali operazioni su relazioni utilizzate nel DML

Informatica e Bioinformatica: Basi di Dati

Per salvaguardare la vista, si consiglia al traduttore di munirsi di un monitor con schermo lucido.

DBMS. Affidabilità. Privatezza dei dati. Efficienza. Efficacia. Un DBMS deve garantire:

Basi di Dati. Corso di Informatica. Memorizzazione dei Dati. Accesso ai Dati. Corso di Laurea in Conservazione e Restauro dei Beni Culturali

Corso di Access. Prerequisiti. Modulo L2A (Access) 2.5 Sottomaschere e Report avanzati

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

Interrogazioni nidificate

CAPITOLO V. DATABASE: Il modello relazionale

Introduzione a MapGuide Author 6.5

SELECT s.nome, e.data Studenti s, Esami e WHERE e.materia = 'BD' AND e.voto = 30 AND e.matricola = s.matricola

Informatica per la Comunicazione/ Verdicchio/ 25/09/2013/ Domande / VERSIONE 1

Laboratorio di Basi di Dati prova totale 20 febbraio 2013

Introduzione al Semantic Web

Il linguaggio SQL. Il linguaggio SQL. Il linguaggio SQL. Il linguaggio SQL. Il linguaggio SQL: fondamenti. Il linguaggio SQL

DBMS (Data Base Management System)

MODULO DI ISCRIZIONE AI CORSI PER LA PREPARAZIONE ALLA CERTIFICAZIONE ECDL. l sottoscritt. nat a il giorno e residente a, Provincia in n.

Elena Baralis 2007 Politecnico di Torino 1

L organizzazione dei documenti nei sistemi multimediali

Bibliografia. INFORMATICA GENERALE Prof. Alberto Postiglione. Scienze della Comunicazione Università di Salerno. Definizione di DB e di DBMS

Laboratorio Architettura

Cap. 1-I 1 I sistemi informatici

Il modello relazionale

DATABASE.

LABORATORIO di INFORMATICA

SQL. SQL: "storia. Sviluppato nella metà degli anni settanta (1974) presso il laboratorio di ricerca IBM di S.Josè. Dal 1983 ca. "standard di fatto"

Pag Politecnico di Torino 1

Basi di dati I 19 settembre 2016 Tempo a disposizione: un ora e 45 minuti.

DIPARTIMENTO DISCIPLINARE: STORIA (ST) N.B. L'ordine delle competenze non è tassonomico, ma è da considerare secondo una mappa concettuale.

Esercitazione: Interrogazioni SQL

Viene richiesto di MIN CARD(S,E) = 1 UPDATE DELETE MAX CARD(S,E) = 3 INSERT UPDATE

SISTEMI OPERATIVI, RETI, INTERNET

OBIETTIVI MINIMI Anno scolastico TIC-TIT. 1. Foglio elettronico: funzioni fondamentali (Excel)

Esercitazione 4: Trigger in DB2

Servlet & JDBC ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010. Servlet: interazione con un DBMS. In Java è possibile interagire con un DBMS attraverso

Introduzione ai database relazionali

MICROSOFT ACCESS IL MODELLO E/R

Argomenti XML JSON. Linguaggi per la definizione e lo scambio di dati strutturati, semi-strutturati, non strutturati. XML Data Model JSON

CURRICOLO DIPARTIMENTO INFORMATICA PRIMO BIENNIO

Annotazione semantica di eventi calcistici

ACCESS Esercitazione (query complesse) Ing. Cosimo Orlacchio

Il linguaggio SQL: le viste

RELAZIONI E BASI DI DATI

Basi di Dati. Esercitazione SQL. Paolo Papotti. 19 maggio 2005

traduzione dal tedesco Anna Colotto, Elisa Fiocchi 09/11/2005

Silvia Chiusano, Paolo Garza 1

Concetti base programmazione. Antonio Gallo

30 Circolo Didattico G. Parini - Scuola Primaria- a.s. 2007/2008

Algebra relazionale. Algebra relazionale. Operatori dell algebra relazionale. Operatori dell algebra relazionale. Algebra relazionale.

I motori e gli ostacoli per la Supply Chain. I fattori di sviluppo della supply chain 1

SQL [2] Concetti avanzati di SQL. Esempi di interrogazioni

Esame Informatica Generale 13/04/2016 Tema A

Cerca i film in Campania con Trailer e Trama

Relazioni e tabelle. Introduzione alle Basi di Dati Relazionali. Relazioni uno a uno. Esempio

B a s i d i D a t i ( M o d u l o T e o r i a ) P r o v a s c r i t t a

Il sistema informativo deve essere di tipo centralizzato e accessibile mediante un computer server installato nella rete locale dell albergo.

Caratteristiche dei linguaggi per Database

DATABASE RELAZIONALI

OPERAZIONI SULLA STRUTTURA

Le basi di dati. Le basi di dati. dalla teoria all'utilizzo di tutti i giorni. Alessandro Tanasi

Sommario. Introduzione... 13

ASP e Database. A cura di Michele Cavalieri

ESERCIZIO 1 (12 punti) Dato il seguente schema relazionale, che modella le informazioni relative ad un negozio di libri online:

SQL quick reference. piccolo manuale di riferimento dei principali comandi SQL (prof. Claudio Maccherani, Perugia, 2013)

Operatori di base. σ F (r) = {t t r. F(t) = true} SELEZIONE σ F (r)

Interrogazioni nidificate

Basi di Dati: Corso di laboratorio

Corso di Basi di Dati A.A. 2015/2016

ArcGIS - ArcView ArcCatalog

Elementi di gestione di dati con MS Access 2000

Basi di Dati Ingegneria Informatica e delle Telecomunicazioni

Access. P a r t e t e r z a

Corso di Access. Modulo L2 A (Access) 1.4 Le maschere

COGNOME MATRICOLA. Con vincoli di integrità referenziale: RECENSIONE.NomeUtente à UTENTE.Username RECENSIONE.TitoloSerie à SERIETV.

Sistemi Informativi Territoriali

SQL terza parte D O C E N T E P R O F. A L B E R T O B E L U S S I. Anno accademico 2010/11

SQL: Structured Query Language. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma

Domande utili alla preparazione dell orale di Informatica all Esame di Stato

Il linguaggio SQL: query innestate

TRADUZIONE DI SCHEMI

ESERCIZI SQL. Esercizio 1

Si definisca il relativo schema E/R (nella metodologia proposta a lezione) e si evidenzino eventuali vincoli inespressi e attributi derivati.

1 (4) 2 (4) 3 (7) 4 (5) 5 (6) 6 (6)

Transcript:

Ipotesi sull'applicazione del modello a linguistici Simone Torsani XXI Convegno Ass.I.Term, Roma, 26 maggio 2011 Terminologie e ontologie: definizioni e comunicazione fra norma e uso

Obiettivi Impiego di metadati in linguistici (soprattutto dal web) A supporto di ricerche (in questo caso terminologiche e lessicologiche): Analisi comparative Analisi diacroniche 2

Indice Problematiche della Metadati e Metadati e modello Modello, Metadati e Web Definizione di Estrazione/creazione Analisi 3

Problematiche della Metadati e Modello, Due contributi esemplari Lüderling et al. (2007): più generale (web data for linguistic purposes), notano l importanza dell uso di metadati per analisi: Comparative (metadati per categorizzare) Diacroniche (metadati per ordinare cronologicamente) Claridge (2007): più specifico (corpus from the web: message boards), utilizzo (limitato) di metadati in messaggi di forum (poco standard, a basso livello ) Entrambi analizzano il Web come corpus (vol. Corpus Linguistics and the Web) Emergono i punti deboli degli a disposizione e/o nell uso dei metadati 4

Metadati e Metadati e Modello, Metadatazione a diversi livelli (Burnard, 2004) alto (sul corpus), intermedio (sui componenti/testi), basso (su porzioni del testo - annotazioni) In Claridge (2007) si nota un utilizzo poco efficiente della metadatazione Per es. non uniformità (es. date in formati diversi 05:06pm Nov 22, 2004 vs. 2 Feb 2005 16:33) sarebbe difficile utilizzarli per categorizzare / ordinare Importanza nella scelta del sistema più efficiente / produttivo di metadatazione (per es. il sistema ) 5

Metadati e modello Metadati e Modello, Modello = tabella di base di dati Ogni relazione è un insieme (tupla) di attributi Testo = {id, anno, categoria, autore, testo} Ogni oggetto è un istanza di questa relazione ogni oggetto è un aggregato di attributi Se a un testo si aggiungono metadati, questi possono essere considerati come attributi e il corpus diventa una tabella: 1 testo = 1 record 1 record = attributi (di cui una parte è testo, un altra sono metadati) Funzione query interrogazione della BD utilizzando criteri basati sugli attributi (e l algebra ): SQL (structured query language) SELECT * FROM testi WHERE anno>2008 AND anno<2011 La distinzione tra Base dati e Corpus non è sempre chiara 6

Modello, basi di dati Metadati e Modello, e L associazione base dati / corpus non è nuova e il confine tra i due non è netto, come si nota anche da alcuni termini utilizzati Diversi Corpus Query Language (per interrogare con query), per es. basati su espressioni regolari [lemma = "bias"] [word = "towards toward"] []{1,3}[tag= "NN."] (cerca collocazioni) Corpus DWDS (tedesco) integra metadati cronologici (ordina per anno di pubblicazione) Barbiers et al. (2007) corpus/database di dialetti olandesi: usano diverse tabelle per immagazzinare metadati (più base dati che corpus) Si tende ad oscillare verso uno o l altro estremo (base dati vs. corpus e relativi di analisi) 7

Metadati e Web I Metadati e Modello, Un maggior uso dei metadati rende necessaria la definizione di specifici ambiti di competenza (tra corpus/analisi linguistica e database/query). Il Web, i cui testi sono ricchi in metadati e oggi sempre più utilizzato come fonte per i, rende urgente chiarire ruolo e procedure e dell uno e dell altro sistema anche in relazione agli obiettivi 8

Metadati e Web II Metadati e Modello, Il Web è uno degli elementi più innovativi nel settore Nel Web è facile che i testi siano associati / contengano metadati (come in Claridge) anche in diverse forme: Metatag (es. date ) Nel testo vero e proprio Diversi sistemi di estrazione dei metadati: Scraping Information Extraction Es. 1 siti di aziende: es. Sito di Intel pagine seriali (nella struttura) di schede madri Es. 2 forum di discussione specializzato : es. www.tomshw.it Testo e metadato sono separati (estrazione) e associati (nella relazione) 9

Metadati e Web III Metadati e Modello, In un ottica di analisi di corpus, per combinare al meglio le due funzioni ( e categorizzazione) è importante mantenerle distinte: 1) analisi testuale (attributi testo) e 2) query di selezione (attributi metadato) - v. Barbiers et al. (2007) 10

Definizione di - Metadati e Modello, Estrazione Sistema di estrazione deve individuare e separare metadati dal testo Deve normalizzare (standardizzare) i metadati (per es. le date) Realizzabile con piattaforme che esistono già (GATE) 11

Definizione di - Metadati e Modello, Analisi Il sistema di analisi deve permettere di eseguire una testuale classica Deve essere flessibile e adattarsi ai vari metadati Deve integrare le funzioni di testuale (concordanza, collocazioni ecc ) con funzioni di query sui metadati che: filtrino / categorizzino i risultati ordinino i risultati cronologicamente L esempio mostrato in Barbiers et al. (2007) è più una base dati che un corpus 12

Conclusioni Metadati e Modello, Il Web è una fonte sempre più utilizzata per la costruzione di L utilizzo di metadati permette di svolgere molte più operazioni Il recupero di metadati da pagine web è più facile (in percentuale) rispetto a testi normali Lo sviluppo di sistemi in grado di estrarre / convertire / associare metadati sarà sempre più importante in questo ambito L uso di un sistema che combini le due funzioni appare il più efficiente per ottenere risultati migliori, più standardizzati e applicabili a un numero illimitato di documenti 13