Introduzione alla Linguistica Computazionale

Похожие документы
Linguistica Computazionale. 22 settembre 2014

PROGETTAZIONE FORMATIVA ANNUALE PROGETTAZIONE ANNUALE DIDATTICA:

AREA TEMATICA SVILUPPO COMPETENZE DI BASE LINGUE STRANIERE

A.A INDIRIZZO LA96 Analisi e intervento psicologico per l età adulta. Prof. Claudia Casadio

ITALIANO RIFLESSIONE SULLA LINGUA

CURRICOLO DISCIPLINARE DI ITALIANO ASCOLTO E PARLATO. Traguardi per lo sviluppo delle competenze. Obiettivi di apprendimento( conoscenze e

La comunicazione e il linguaggio

1. BASI DI DATI: GENERALITÀ

INFORMATICA GENERALE. Prof Alberto Postiglione Dipartim. Scienze della Comunicazione Univ. Salerno. Università degli Studi di Salerno

LABORATORIO DI INFORMATICA

CURRICOLO di ITALIANO classe terza

ISTITUTO TECNICO ECONOMICO MOSSOTTI

CORSO DI ITALIANO CLASSE PRIMA

Linguaggi e Paradigmi di Programmazione

LINGUA INGLESE SCUOLA PRIMARIA

Dislessia e mappe semantiche

NUCLEO FONDANTE CONOSCENZE ABILITA' COMPETENZE

Introduzione all Information Retrieval

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

DAI CURRICOLI DISCIPLINARI AI PERCORSI DI APPRENDIMENTO TRASVERSALI

Risultati delle prove di ingresso delle classi prime e raffigurazione del profilo medio delle conoscenze e abilità degli allievi.

CURRICOLO DI ITALIANO CLASSE PRIMA

Istituto Comprensivo di Pralboino Curricolo Verticale

Fine classe terza COMPETENZE SPECIFICHE CONOSCENZE ABILITÀ METODOLOGIA/ STRATEGIE COMUNI. Lessico approfondito relativo agli argomenti trattati.

4, 5 ANNO DELLA SCUOLA PRIMARIA

PIANO DI STUDIO PERSONALIZZATO CLASSI SECONDE E TERZE PRIMO BIENNIO

PERCORSO DIDATTICO SPECIFICO PER ALUNNI CON DSA. DATI RELATIVI ALL ALUNNO Cognome e nome: Data e luogo di nascita: Istituto: Classe:

SCUOLA PRIMARIA SCIENZE NATURALI E SPERIMENTALI. Competenza: 1. Comunicazione efficace Indicatore: 1.1 Comprensione

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

AREA TEMATICA SVILUPPO COMPETENZE DI BASE LINGUE STRANIERE

Laboratorio informatico Banche dati off line

LICEO SCIENTIFICO STATALE LEONARDO DA VINCI"

Linguaggi per COMUNICARE. Il linguaggio è un sistema codificato di segni che consente la comunicazione, intesa come scambio di informazioni

Tecnologie del parlato

Napoletano Francesca - Psicologa - Formatrice

La valutazione dell italiano

Origini e caratteristiche dei calcolatori elettronici

PIANO DIDATTICO PERSONALIZZATO

Quadro comune europeo di riferimento per le lingue. Apprendimento, insegnamento, valutazione

OFFERTA FORMATIVA PER OCCUPATI

Asse linguistico Propedeutico al 1 livello 1 periodo

SCUOLA PRIMARIA CURRICOLO DI ITALIANO SECONDO BIENNIO

Appunti del corso di Informatica 1 (IN110 Fondamenti) 4 Linguaggi di programmazione

ISTITUTO DI ISTRUZIONE SUPERIORE J.C. MAXWELL Data: 08 /09 /15 Pag. di. PROGRAMMAZIONE ANNUALE A.S 2015/ 2016 MANUTENZIONE e ASSISTENZA TECNICA

PROGRAMMAZIONE ANNUALE DI LINGUA ITALIANA - SCUOLA PRIMARIA IST. COMP. DON MILANI CERNUSCO S/N -

Normale, conforme agli obiettivi della classe ai sensi degli artt. 12 e 13 dell O.M.

Istituto Tecnico Tecnologico (ITT) Montani Fermo

Question Answering e semantica Tecnologie emergenti per le imprese. IKL 08 - Intercultural Knowledge Landscapes

La produzione del testo scritto: generare e pianificare le idee

ISTITUTO COMPRENSIVO VIA NOVARIA VILLANTERIO Via Novaria, Villanterio Tel. 0382/ Fax 0382/ SCUOLA DI A.S.

Fondamenti di Informatica. Allievi Automatici A.A Nozioni di Base

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

TECNOLOGIA - SCUOLA PRIMARIA

Attenzione! il valore della Rimodulazione è superiore alla cifra di Negoziazione

Direzione Didattica. Marie Curie. Via Guicciardi, 1 Milano. Anno scolastico: / Plesso classe. Team docenti (e relative materie di insegnamento):

UNITÀ DI APPRENDIMENTO N 1

TECNOLOGIA CLASSE PRIMA TRAGUARDI DI COMPETENZA DA SVILUPPARE AL TERMINE DELLA CLASSE PRIMA

Linguaggi di programmazione

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali

Dispensa di Informatica I.1

INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI

IL SISTEMA INFORMATIVO

INGLESE CLASSE PRIMA

SCHEDA DI PROGRAMMAZIONE DISCIPLINARE PER LA CERTIFICAZIONE DELLE COMPETENZE NEL BIENNIO DELL OBBLIGO DA RIPORTARE SUL P.O.F. A.S.

SCUOLA PRIMARIA Anno Scolastico 2014/2015 CURRICOLO DI TECNOLOGIA OBIETTIVI DI APPRENDIMENTO AL TERMINE DELLA CLASSE TERZA DELLA SCUOLA PRIMARIA

Indaco. Industrial Data Collection

CHE COS È L INFORMATICA

CERTIFICAZIONE DELLE COMPETENZE ITALIANO

LINGUAGGI, CREATIVITA, ESPRESSIONE TECNOLOGIA - INFORMATICA

PIANO DIDATTICO PERSONALIZZATO

IL CURRICOLO DI SCUOLA ARTE E IMMAGINE

L informatica INTRODUZIONE. L informatica. Tassonomia: criteri. È la disciplina scientifica che studia

Digital Signal Processing: Introduzione

I Problemi e la loro Soluzione. Il Concetto Intuitivo di Calcolatore. Risoluzione di un Problema. Esempio

CURRICOLO DI INGLESE SCUOLA SECONDARIA DI PRIMO GRADO

PROGRAMMAZIONE ANNUALE PER L INSEGNAMENTO DELLA LINGUA E CIVILTA INGLESE - I BIENNIO ANNO SCOLASTICO 2013/2014

Appendice III. Competenza e definizione della competenza

Metodologie di programmazione in Fortran 90

Alunno/a DSA Classe a. s. Docente Materia/e

LA COMUNICAZIONE NELLA MADRELINGUA. Numeri e spazio, fenomeni e viventi (MATEMATICA)

PROGETTAZIONE ANNUALE. A. S. 200_/0_ Classe sez.

Progetto di formazione e ricerca SCUOLA SECONDARIA DI PRIMO GRADO. ITALIANO Competenze linguistico-comunicative. Competenze di cittadinanza

COS È UN LINGUAGGIO? LINGUAGGI DI ALTO LIVELLO LA NOZIONE DI LINGUAGGIO LINGUAGGIO & PROGRAMMA

SCUOLA PRIMARIA DISCIPLINA DI RIFERIMENTO : TECNOLOGIA CLASSE PRIMA

PROGRAMMA DI LABORATORIO TRATTAMENTO TESTI

I.Ri.Fo.R. Regionale Toscano Onlus. Analisi dei fabbisogni per la formazione di Trascrittori testi in braille, ingranditi ed elettronici

INGLESE COMUNICAZIONE NELLE LINGUE STRANIERE. b. Utilizza la lingua inglese nell uso delle tecnologie dell informazione e della comunicazione

Esercizi del programma (solo su CD-ROM)

Informazione e dato. Gabriella Trucco

PROGETTO SCIENZE CLASSI PRIME SECONDARIA I GRADO A.S. 2013/2014

AREA TEMATICA SVILUPPO COMPETENZE DI BASE LINGUE STRANIERE

Il Software e Il Sistema Operativo. Prof. Francesco Accarino IIS Altiero Spinelli A.S. 09/10

Introduzione al Semantic Web

OBIETTIVI IN TERMINI DI: COMPETENZE, ABILITÀ, CONOSCENZE E ATTIVITÀ COMPETENZA ABILITÀ CONOSCENZE ATTIVITÀ

Транскрипт:

Introduzione alla Linguistica Computazionale Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Ludici Adattati da Alessandro Lenci Dipartimento di Linguistica T. Bolelli

Elaborazione del Parlato e del Linguaggio (Speech and Language Processing) L idea di dare ai computer la capacità di elaborare il linguaggio naturale èmolto antica In A Space Odyssey (Kubrick, 2001) HAL 9000 èun agente artificiale che può dialogare con gli uomini utilizzando il linguaggio umano in Star Wars (Lucas, 1977) C 3PO èun robot protocollare cioè si occupa proprio delle comunicazioni tra umani e robot 2

Elaborazione del Parlato e del Linguaggio Quali conoscenze linguistiche dovrebbero possedere tali agenti? articolare e decodificare i suoni di una lingua fonetica articolatoria e acustica, fonologia, prosodia, ecc. conoscere le parole di una lingua, la loro struttura e la loro organizzazione lessico e morfologia comporre le parole in espressioni linguistiche complesse (sintagmi, frasi, ecc.) sintassi assegnare significati alle espressioni linguistiche semplici e complesse semantica (lessicale e composizionale) usare le frasi nei contesti, situazioni e modi appropriati agli scopi comunicativi pragmatica 3

Quali e Quante Discipline Scientifiche? La progettazione di HAL 9000 coinvolge molte discipline ad esempio: robotica intelligenza artificiale linguistica scienze cognitive Noi ci occuperemo di rappresentazione e analisi del testo Alla fine del corso avrete conoscenze di base, ma fondamentali, di linguistica computazionale Sarà fornito lo strumentario di base per il linguista computazionale 4

Linguistica Computazionale La Linguistica Computazionale èlo studio di sistemi informatici per la comprensione e la produzione di linguaggio naturale. R. Grishman, ``Computational Linguistics An Introduction'', 1986 La Linguistica Computazionale si occupa dello sviluppo di una teoria computazionale del linguaggio, sfruttando le nozioni di algoritmi e strutture dati provenienti dall Informatica. J. Allen, ``Natural Language Understanding'', 1994 5

Cosa èla linguistica computazionale? La linguistica computazionale si occupa dell analisi ed elaborazione del linguaggio naturale attraverso l uso di metodologie informatiche La linguistica computazionale si concentra sullo sviluppo di formalismi descrittivi del funzionamento del linguaggio naturale, tali che si possano trasformare in programmi eseguibili dai computer. 6

Cosa èla linguistica computazionale? Come si applica il trattamento automatico dell informazione (Informatica) al linguaggio naturale? 1. esplorazione ed analisi dei dati linguistici con strumenti informatici 2. sviluppo di sistemi informatici dotati di conoscenze linguistiche e in grado di esibire capacità linguistiche comparabili a quelle umane 3. elaborazioni di modelli computazionali e simulazioni della competenza linguistica umana, della sua acquisizione e del suo uso linguaggio naturale 7

Cosa può fare il computer per il linguaggio? Usare il linguaggio implica produrre dati linguistici libri, giornali, pagine web, conversazioni, e mail, chat, ecc. Il computer come gestore ed elaboratore di dati: immagazzinare calcolare ordinare comparare ricercare Analisi computazionali dei dati linguistici le potenzialità standard del computer possono essere usate per la gestione e l analisi avanzata dei dati linguistici 8

Analisi computazionale dei dati linguistici La linguistica computazionale permette di affrontare queste ricerche attraverso metodi e strumenti informatici per la rappresentazione e gestione di grandi quantità di dati linguistici digitalizzazione di testi trascrizioni del parlato dati linguistici raccolti sul campo ecc. ricerche ed esplorazioni avanzate del testo metodi matematici e statistici per analizzare i dati linguistici ed elaborare modelli del linguaggio 9

Cosa può fare il computer per il linguaggio? Il Natural Language Processing (NLP) o Trattamento Automatico del Linguaggio (TAL) cerca di dotare il computer di conoscenze linguistiche allo scopo di: progettare programmi e sistemi informatici che assistano l uomo in compiti linguistici traduzione gestione dei documenti e della conoscenza, ecc. sviluppare sistemi informatici che usano il linguaggio naturale per: interagire con essere umani in maniera naturale estrarre automaticamente informazioni da testi o da altri media estendere dinamicamente la propria competenza linguistica 10

Natural Language Processing (NLP) Alcune applicazioni Correttori correttori ortografici, grammaticali, ecc. Recupero intelligente di documenti Information Retrieval Riconoscimento automatico del parlato Automatic Speech Recognition (ASR) Sintesi automatica della voce Text To Speech (TTS) Estrazione automatica di informazione da testi Information Extraction (IE) Interrogare documenti attraverso domande in linguaggio naturale Question Answering (QA) Traduzione (semi) automatica di testi Machine translation Interazione (conversazione) uomo macchina multimodale Agenti conversazionali complessi 11

NLP correttori grammaticali Word Correttore grammaticale 12

NLP traduzione automatica Google traduzione automatica 2008 13

NLP traduzione automatica Google traduzione automatica... 2009 14

NLP traduzione automatica Google traduzione automatica... 2012 15

NLP question answering 16

Natural Language Processing (NLP) Un applicazione vicina : l Atlante Linguistico Siciliano L ALS si occupa di sociolinguistica cioè di come i fattori sociali ed economici influenzano gli elementi della lingua. L aspetto principale che viene investigato ècome la popolazione si rapporta all utilizzo dell italiano e del dialetto siciliano sia nell uso che nella percezione. Aspetti linguistici pronuncia Cadenza Aspetti traduttivi passaggio da un codice all altro Aspetti percettivi quando si usa un codice piuttosto di un altro come viene percepito l uso di un codice in un determinato contesto 17

Natural Language Processing (NLP) Un applicazione vicina : l Atlante Linguistico Siciliano Lo strumento per la raccolta dei dati è l intervista ad una popolazione modello di raccolta dati: 17 interviste per centro suddiviso in 5 famiglie composte da 3 generazioni differenti più 2 adolescenti extra (nonno, padre, figlio) dati memorizzati su file audio necessità di strumenti specifici strumenti di trascrizione (dall audio al testo su supporto informatico) strumenti di annotazione (dal testo al testo arricchito di informazioni sui fenomeni sociolinguistici) strumenti di visualizzazione dei risultati (mappe georeferenziate) 18

Natural Language Processing (NLP) Un applicazione vicina : l Atlante Linguistico Siciliano Annotazione: processo di arricchimento delle informazioni su un testo viene realizzato con strumenti XML secondo la seguente modalità: input: file trascritto e salvato come XML ( passaggio da testo puro a XML definizione di un modello di strutturazione delle informazioni) arricchimento secondo un insieme specifico di possibili annotazioni (TAG di un determinato schema) recupero delle informazioni memorizzate nel DB XML 19

La linguistica computazionale ieri e oggi Anni 50 1957 Nasce la Grammatica Generativa (Chomsky) Prime applicazioni del computer ai testi letterari (Padre Busa, Pisa) Metà anni 60 I primi corpora elettronici (Francis & Kucera) Anni 60-80 Modelli simbolici Logica & Intelligenza Artificiale Natural Language Understanding (Minsky, Schank, Winograd, et al.) Anni 60-80 Sviluppo della Corpus Linguistics e della statistica linguistica (Leech, Sinclair, Herdan, et al.) Anni 90-Oggi Empirical NLP NLP statistico Modelli non-simbolici (Charniak, Church, et al.) 20