Linguis'ca computazionale, treebank e altre risorse

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Linguis'ca computazionale, treebank e altre risorse"

Transcript

1 Linguis'ca computazionale, treebank e altre risorse Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale

2 Di cosa parleremo Task di LC Risorse linguis%che (diverse dai corpora) Corpora annota% e Treebank Il ProgeIo Turin University Treebank e Parallel Turin University Treebank Il progeio Universal Dependency

3 Task di LC I sistemi di LC svolgono vari %pi di analisi del testo, singolarmente o in abbinamento. Il %po di task determina: - come è faio l input - come è faio l output - quali passi intermedi di analisi devono essere svol% - quali risorse sono necessarie

4 Task di LC TuR i sistemi aiuali di LC u%lizzano risorse linguis%che per passare dall input all output. input output risorsa1 risorsa2

5 Gerarchia di Task di LC I task tradizionali possono essere pensa% in una gerarchia che ne evidenzia la crescente difficoltà: Tokenizzazione Part of Speech Tagging = analisi morfologica Parsing = analisi sintarca Analisi seman%ca Altri task nuovi si basano su di essi.

6 Tokenizzazione Consiste nel dis%nguere nel testo le unità minime morfologiche (der token). L input è il testo in forma di frase o intero testo. Es: Il ga,o dorme sul terrazzo L output è il testo suddiviso in token. Es: tok1=il tok2=ga,o tok3=dorme tok4=su tok5=il tok6=terrazzo

7 Part of Speech (PoS) tagging Consiste nell associare ad ogni token una descrizione della sua morfologia. L input è il singolo token. Es: Il L output è il token con associate le rela%ve informazioni morfologiche Es: Il ARTICOLO DETERMINATIVO SINGOLARE MASCHILE

8 Part of Speech tagging La descrizione della morfologia di una parola (il PoS tagging) può includere anche la lemma%zzazione. Essa è di faio necessaria per iden%ficare la categoria gramma%cale della parola e può essere resa esplicita nell output del PoS tagging. Es: Il IL ARTICOLO DETERMINATIVO SINGOLARE MASCHILE

9 Part of Speech tagging e risorse Quali risorse si u%lizzano per fare il PoS tagging? Collezioni di lemmi Collezioni di forme (MORPH- IT) Dizionari con informazioni morfologiche Corpora con già applicato il PoS tagging (per fare apprendimento) (POSTWITA)

10 Morph- It (Zanche,a, Baroni) È una risorsa lessicale basata su forme che con%ene: - per ogni forma il lemma, la categoria gramma%cale e caraieris%che morfologiche - serve il Part of Speech tagging e la lemma%zzazione

11 Morph- It (Zanche,a, Baroni) Con%ene 505,074 voci che corrispondono a 35,056 lemmi. È stata costruita partendo da un corpus di 380 milioni di token (ar%coli di La Repubblica dal 1985 al 2000) annotato con lemmi e parte della morfologia, poi arricchito con le forme mancan% e la morfologia mancante. h,p://sslmitdev- online.sslmit.unibo.it/linguisccs/morph- it.php

12 PoSTWITA (Bosco, Tamburini, Mazzei, Bolioli) Con%ene 301 tweet annota% dal punto di vista morfologico. L annotazione è stata faia automa%camente e correia a mano. Rappresenta la lingua italiana dei social media.

13 Parsing Consiste nell associare ad ogni frase una descrizione della sua sintassi. L input è la frase tokenizzata e analizzata morfologicamente (dal PoS tagging).

14 Parsing: input 1 Il ART DEF MAS SING 2 ga,o NOM COM MAS SING 3 dorme VERB IND PRES 3 SING 4 su PREP 5 il ART DEF MAS SING 6 terrazzo NOM COM MAS SING

15 Parsing: output 1 Il ART DEF MAS SING SoggeLo di 3 2 ga,o NOM COM MAS SING Argomento di 1 3 dorme VERB IND PRES 3 SING Radice 4 su PREP Modificatore di 3 5 il ART DEF MAS SING Argomento di 4 6 terrazzo NOM COM MAS SING Argomento di 5

16 Parsing: output dorme VERB IND PRES 3 SING Soggetto Modificatore Il ART DEF MAS SING Argomento gatto NOM COM MAS SING su PREP Argomento il ART DEF MAS SING Argomento terrazzo NOM COM MAS SING

17 Parsing e risorse Quali risorse si u%lizzano per fare il parsing? I treebank, ampie collezioni di frasi annotate dal punto di vista morfologico e sintarco. In linea di principio servirebbe solo l annotazione sintarca, ma dato che quella morfologica ne è un prerequisito, si meie anche quella negli stessi da%. Dei treebank parleremo in deiaglio più avan%.

18 Analisi seman%ca Consiste nell associare ad ogni frase una descrizione della sua seman%ca. L input è la frase tokenizzata, analizzata morfologicamente (dal PoS tagging) e sintarcamente (dal parsing).

19 Analisi seman%ca È il %po di analisi più difficile per la quale esistono solo alcuni sub- task sviluppa%. Tra di essi ci%amo il word sense disambigua%on per il quale esistono risorse linguis%che molto importan%: BabelNet h,p://babelnet.org/ Mul%WordNet h,p://mulcwordnet.sk.eu/ english/home.php/

20 Gerarchia di Task di LC I task nuovi si basano su quelli tradizionali, ad esempio la Sen%ment analysis sovente u%lizza forme di (parziale) analisi morfologica e sintarca.

21 Sen%ment analysis Consiste nell associare ad ogni porzione data di testo un valore di polarità o una classificazione. L input è il testo, eventualmente analizzato morfologicamente e/o sintarcamente. L output è il testo classificato secondo la polarità o altra classe definita.

22 Sen%ment analysis e risorse - Lessici per la sen%ment analysis: contengono parole con associata una polarità (AFINN) - Quando un sistema di sen%ment analysis deve rilevare la polarità di un testo cerca le parole del testo nel lessico, se le trova prende la loro polarità e sommando tuie le polarità delle parole calcola quella della frase.

23 Esempi di risorse linguis%che Mario MonC: Berlusconi risparmi all'italia il biasimo per aver causato un disastro #mariomoncpremier > Polarità Nega%va Mario #MonC Senatore a vita è una splendida noczia per tuw gli italiani, è l'emblema di quei ci,adini meritevoli che onorano la Patria. > Polarità Posi%va

24 Le risorse linguis%che La quan%tà e la varietà di risorse linguis%che dimostra la loro centralità per la LC. Una parte consistente della comunità della LC lavora solo per costruire risorse. Esistono molte risorse per l inglese, ma anche per altre lingue (a volte costruite a par%re dalle prime).

25 Le risorse linguis%che - Con il termine risorse linguis%che si indicano i corpora e tuie le altre - Sono delle raccolte di informazioni a cui i sistemi di LC accedono durante lo svolgimento del loro compito - Esse rappresentano il versante preiamente linguis%co della LC

26 CORPORA e TREEBANK A par%re dalla fine degli anni 90 si applicano nella LC approcci basa% su corpora. Inizialmente si traia di corpora molto grandi non annota% (approcci non supervisiona%). In seguito si traia di corpora meno grandi ma annota% (approcci supervisiona%).

27 Annotazione e corpora Come annotare i da%? Le informazioni annotate variano parecchio a seconda dello scopo per cui si costruisce il corpus, perché le informazioni che i sistemi devono apprendere sono streiamente correlate al compito che il sistema deve svolgere.

28 Annotazione e corpora Come annotare i da%? - Corpora per sen%ment analysis: polarità, stance, ironia, target... - Corpora per named en%ty recogni%on: persone, luoghi, aziende, date... - Corpora per Part of Speech tagging: lemmi, categorie gramma%cali,...

29 Annotazione e treebank Come annotare i da%? Per ogni livello di annotazione vengono faie delle scelte sia sulla teoria linguis%ca da prendere come riferimento sia sul modo in cui fisicamente mostrare i da%.

30 Annotazione e treebank Quali da% annotare? Occorre scegliere i tes% da introdurre nel corpus in modo che siano rappresenta%vi del linguaggio che si vuole traiare.

31 Annotazione e treebank Quali da% annotare? un corpus é un campione significa%vo e rappresenta%vo di un linguaggio SE: con%ene frasi non ristreie è bilanciato rispeio al genere, alla collocazione geografica e sociale, al tempo MA non rappresenta mai TUTTO il linguaggio nel suo complesso

Linguis'ca computazionale e approcci corpus- based

Linguis'ca computazionale e approcci corpus- based Linguis'ca computazionale e approcci corpus- based Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2016-2017 Sistemi di NLP Per definire un sistema di NLP occorre conoscerne

Dettagli

Linguis'ca computazionale e treebank

Linguis'ca computazionale e treebank Linguis'ca computazionale e treebank Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2016-2017 Il proge=o Turin University Treebank ObieFvo: sviluppare una risorsa linguis%ca,

Dettagli

Analisi morfologica. Si analizza ogni parola PRESA SINGOLARMENTE e se ne esplicitano le cara%eris/che gramma/cali:

Analisi morfologica. Si analizza ogni parola PRESA SINGOLARMENTE e se ne esplicitano le cara%eris/che gramma/cali: E so%oproblemi Per ges/re le difficoltà che la comprensione del linguaggio nel suo complesso comporta, si scompone il compito (task) del NLP in vari so%oproblemi (subtasks) rela/vamente indipenden/ e consisten/

Dettagli

Linguistica computazionale: task sul linguaggio naturale"

Linguistica computazionale: task sul linguaggio naturale Linguistica computazionale: task sul linguaggio naturale" Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale NLP e subtask Ci focalizziamo su alcuni subtask rappresentativi:" Information

Dettagli

Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte)"

Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte) Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte)" Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale NLP e subtask Ci

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Trattamento Automatico della Lingua 24 novembre 2014 Tecnologie del linguaggio Sistemi in grado di accedere al contenuto di informazione attraverso l elaborazione automatica

Dettagli

Corpora e linguistica computazionale

Corpora e linguistica computazionale Corpora e linguistica computazionale Cristina Bosco Corso di Informatica applicata alla comunicazione multimediale 2013-2014 Elaborare il linguaggio naturale Il problema della comprensione del linguaggio

Dettagli

Linguis'ca computazionale e approcci corpus- based

Linguis'ca computazionale e approcci corpus- based Linguis'ca computazionale e approcci corpus- based Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Sistemi di NLP Per definire un sistema di NLP occorre conoscerne

Dettagli

Computer assisted transla0on (CAT - 2) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale

Computer assisted transla0on (CAT - 2) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale Computer assisted transla0on (CAT - 2) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Cosa è una Memoria di Traduzione Una TM (Transla0on Memory) è un archivio di materiali

Dettagli

Linguistica Computazionale 2004 Presentazione del Corso

Linguistica Computazionale 2004 Presentazione del Corso 13 febbraio 2004 1 Informazioni generali Docente Marco Baroni Email baroni@sslmit.unibo.it Telefono 0453/374744 Homepage del corso http://www.e-learning.sslmit.unibo.it/compling04/ Orario lezioni Lunedì

Dettagli

Classificare i nomi propri -Esercitazione-

Classificare i nomi propri -Esercitazione- Classificare i nomi propri -Esercitazione- Lucia Passaro CoLing Lab Laboratorio di Linguistica Computazionale http://colinglab.humnet.unipi.it/ lucia.passaro@for.unipi.it Pisa 29 Novembre 2017 Analisi

Dettagli

Didattica delle lingue moderne LM. Elena Nuzzo

Didattica delle lingue moderne LM. Elena Nuzzo Didattica delle lingue moderne LM ì Elena Nuzzo Video: il ruolo della lingua materna Le sequenze evolutive Tu, gli apprenden2 sviluppano la lingua rispe5ando le stesse sequenze, anche se con tempi e risulta2

Dettagli

Data Journalism. Analisi dei dati. Angelica Lo Duca

Data Journalism. Analisi dei dati. Angelica Lo Duca Data Journalism Analisi dei dati Angelica Lo Duca angelica.loduca@iit.cnr.it Obiettivo L obiettivo dell analisi dei dati consiste nello scoprire trend, pattern e relazioni nascosti nei dati. di analisi

Dettagli

Introduzione al Test in Itinere

Introduzione al Test in Itinere Introduzione al Test in Itinere Roberto Basili Università di Roma, Tor Vergata Argomenti oggetto di esame Rappresentazioni vettoriali per la classificazione Clustering Algoritmi di apprendimento automatico

Dettagli

TECNOLOGIE DEL LINGUAGGIO

TECNOLOGIE DEL LINGUAGGIO Internet Festival 10 ottobre 2014 TECNOLOGIE DEL LINGUAGGIO NUOVI MESTIERI, NUOVE RICERCHE Maria Simi Dipartimento di Informatica Università di Pisa Internet Festival 10 ottobre 2014 INTRODUZIONE Il settore

Dettagli

Sviluppo di Risorse Linguistiche per l Ambiente di Scrittura Assistita (ASA)

Sviluppo di Risorse Linguistiche per l Ambiente di Scrittura Assistita (ASA) Università degli Studi di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea Triennale in Informatica Informatica e Linguistica Linguistica Sviluppo di Risorse Linguistiche per l Ambiente

Dettagli

Introduzione. TALN Corpus-based computational linguistics. Rapporto tra forme, classificazioni e lemmi. Liste e classi di frequenza del lessico

Introduzione. TALN Corpus-based computational linguistics. Rapporto tra forme, classificazioni e lemmi. Liste e classi di frequenza del lessico TALN Stu Statistici TALN Corpus-based computational linguistics Seminario del corso Trattamento Automatico del Linguaggio Naturale (a. a. 01 02) 2 Introduzione Gli strumenti informatici ed i meto statistici

Dettagli

ISTRUZIONI PROGETTO FASE 4

ISTRUZIONI PROGETTO FASE 4 ISTRUZIONI PROGETTO FASE 4 Data consegna: tre giorni (72 ore) prima della verbalizzazione Questo documento contiene le istruzione per l esecuzione della fase 4 del progetto. Per informazioni o domande

Dettagli

I Big Data e la Linguis/ca Computazionale Il proge7o SEMPLICE Alessandro Lenci CoLing Lab, Università di Pisa

I Big Data e la Linguis/ca Computazionale Il proge7o SEMPLICE Alessandro Lenci CoLing Lab, Università di Pisa Firenze, 25 Settembre I Big Data e la Linguis/ca Computazionale Il proge7o SEMPLICE Alessandro Lenci CoLing Lab, Università di Pisa 1 Dare un senso ai Big Data Noam Chomsky Big Data is a step forward.

Dettagli

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2)

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2) Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,

Dettagli

Lingua, statistica e computazione

Lingua, statistica e computazione Lingua, statistica e computazione Isabella Chiari Facoltà di Scienze Umanistiche Università La Sapienza di Roma Roma, 25 novembre 2005 UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA DIPARTIMENTO DI MECCANICA

Dettagli

Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale"

Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale" Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale Alcune domande - Che cosa sono la

Dettagli

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio Messaggio Insieme di sequenze di simboli, le parole,

Dettagli

Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione

Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,

Dettagli

Linguistica dei corpora. Daniela Trotta

Linguistica dei corpora. Daniela Trotta Linguistica dei corpora Daniela Trotta dtrotta@unisa.it Competenze del linguista computazionale 1. capacità di selezionare e raccogliere i dati linguistici 2. conoscenza di metodi formali 3. padronanza

Dettagli

Come procedere nell annotazione di un corpus!

Come procedere nell annotazione di un corpus! Come procedere nell annotazione di un corpus! Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale Strumenti base! Per lavorare sull annotazione ci servono alcuni strumenti:! editor

Dettagli

Matematica, Informatica e Discipline Umanistiche. Salvatore Venticinque

Matematica, Informatica e Discipline Umanistiche. Salvatore Venticinque Matematica, Informatica e Discipline Umanistiche Salvatore Venticinque salvatore.venticinque@unina2.it Distanze siderali: un luogo comune Odio l'italiano Sono Negato per la matematica Forma mentis, predisposizione?

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Collocazioni e misure statistiche di associazione 27 ottobre 2014 Le parole in contesto You shall know a word by the company it keeps J. R. Firth (1957) XXXXX andamento_della_x;

Dettagli

Odi et amo in Twi-er Cris1na Bosco, Viviana Pa8 T4T 3 Dicembre 2016

Odi et amo in Twi-er Cris1na Bosco, Viviana Pa8 T4T 3 Dicembre 2016 Odi et amo in Twi-er Cris1na Bosco, Viviana Pa8 Dipar&mento di Informa&ca Università degli studi di Torino bosco@di.unito.it, pa=@di.unito.it T4T 3 Dicembre 2016 Team Giancarlo RUFFO Cris&na BOSCO Viviana

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Part of Speech Tagging 1 dicembre 2014 Analisi morfo-sintattica (POStagging) Il PoS Tagging è utilizzato per la disambiguazione morfologica. id forma lemma pos tratti 1 Il il

Dettagli

Ma, alla fine come si svolgono i corsi di addestramento e formazione a Ricine ed in Casen8no?

Ma, alla fine come si svolgono i corsi di addestramento e formazione a Ricine ed in Casen8no? Ma, alla fine come si svolgono i corsi di addestramento e formazione a Ricine ed in Casen8no? La loca8on Si lavora in bosco in soprassuoli rappresenta8vi della realtà forestale regionale di norma ubica8

Dettagli

Linguistica Computazionale: esercitazioni

Linguistica Computazionale: esercitazioni Esercitazione 1 Felice Dell'Orletta ItaliaNLP Lab (www.italianlp.it) presso Istituto di Linguistica Computazionale A. Zampolli CNR felice.dellorletta@ilc.cnr.it 24 settembre 2014 Linguistica Computazionale:

Dettagli

Curriculum vitae di Cristina Bosco

Curriculum vitae di Cristina Bosco Curriculum vitae di Cristina Bosco Studi ed attività di ricerca Da ottobre 2006, è ricercatrice afferente al dipartimento di Informatica presso la Facoltà di Scienze Matematiche Fisiche e Naturali dell'università

Dettagli

Docente: FABRIZIO DIECI. Scuola: Liceo Ar2s2co Statale Klee- Barabino, Genova. Titolo del modulo: SYMBOLS IN STAGLIENO. Classe.

Docente: FABRIZIO DIECI. Scuola: Liceo Ar2s2co Statale Klee- Barabino, Genova. Titolo del modulo: SYMBOLS IN STAGLIENO. Classe. Docente: FABRIZIO DIECI Scuola: Liceo Ar2s2co Statale Klee- Barabino, Genova Titolo del modulo: SYMBOLS IN STAGLIENO Classe Disciplina Quinta, Sezione B (n. 14 studen2) DISCIPLINE PLASTICHE E SCULTOREE

Dettagli

Processi fisici Processi informativi Processi aziendali

Processi fisici Processi informativi Processi aziendali Processo Modellizzazione dei processi aziendali Dott.ssa Enrica Gentile a.a. 2003-2004 L insieme delle attività elementari che vengono svolte per raggiungere un certo obiettivo nel sistema. Possiamo avere

Dettagli

CAPITOLO 7. Cos$ e minimizzazione dei cos$

CAPITOLO 7. Cos$ e minimizzazione dei cos$ CAPITOLO 7 Cos$ e minimizzazione dei cos$ 1 Costo opportunità Il costo opportunità di una par-colare alterna-va è il guadagno associato alla migliore tra le alterna,ve non scelte 2 Costo opportunità Il

Dettagli

Algoritmi e soluzioni di problemi

Algoritmi e soluzioni di problemi Algoritmi e soluzioni di problemi 1 Informazioni e linguaggio Ottenere informazioni significa aumentare le nostre conoscenze ottenere indicazioni che ci fanno agire in un determinato modo Esempi Ad un

Dettagli

Dispensa 2. Data una grammatica context free esistono tre metodi diversi per costruirne la parsing table per un parser LR:

Dispensa 2. Data una grammatica context free esistono tre metodi diversi per costruirne la parsing table per un parser LR: Dispensa 2 2.1 Costruzione Parsing Table LR: generalità Come tutti i parser tabellari predittivi, anche i parser LR possono essere applicati solo a parsing table senza conflitti (ossia entrate multiple)

Dettagli

6. Parti del discorso e funzioni

6. Parti del discorso e funzioni Modelli linguistici 6. Parti del discorso e funzioni www.insegnaregramma2ca.it Introduzione Ciascuna parte del discorso si colloca all interno dei gruppi in modo prevedibile (per es. nell ovale art.+ nome

Dettagli

014 5 Pragmatica Lingue per scopi speciali. [014 8] Abbreviazioni e simboli Filosofia e teoria

014 5 Pragmatica Lingue per scopi speciali. [014 8] Abbreviazioni e simboli Filosofia e teoria T4 T4 014 301 Filosofia e teoria 014 301 8 Scuole, teorie, metodologie 014 301 82 Linguistica formale Notazione 01 dalla Tavola 1 come di seguito modificata Da non usare per scuole e teorie semantiche;

Dettagli

11. Il lessico dei testi

11. Il lessico dei testi Modulo B I testi brevi 11. Il lessico dei testi 27 aprile 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Analisi quantitativa del testo Vediamo esempi di analisi quantitativa del testo condotta

Dettagli

Tra$amento Automa-co del Linguaggio Naturale (1) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale

Tra$amento Automa-co del Linguaggio Naturale (1) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale Tra$amento Automa-co del Linguaggio Naturale (1) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Di cosa parleremo - definizione di NLP e MT - problemi e so$oproblemi - approcci

Dettagli

Linguaggi e Ambienti di Programmazione

Linguaggi e Ambienti di Programmazione Linguaggi e Ambienti di Programmazione Principi e tecniche diffuse che si incontrano spesso nelle applicazioni dell informatica. Compilatori Editor di struttura: riceve in input una sequenza di comandi

Dettagli

Training Set Test Set Find-S Dati Training Set Def: Errore Ideale Training Set Validation Set Test Set Dati

Training Set Test Set Find-S Dati Training Set Def: Errore Ideale Training Set Validation Set Test Set Dati " #!! Suddivisione tipica ( 3 5 6 & ' ( ) * 3 5 6 = > ; < @ D Sistemi di Elaborazione dell Informazione Sistemi di Elaborazione dell Informazione Principali Paradigmi di Apprendimento Richiamo Consideriamo

Dettagli

Applicazioni di NLP per il Semantic Web

Applicazioni di NLP per il Semantic Web Università degli Studi di Salerno Dipar1mento di Scienze Poli1che, Sociali e della Comunicazione Applicazioni di NLP per il Semantic Web Tra$amento delle polirema/che terminologiche nel dominio della A.

Dettagli

Studio della complessità linguistica e prospettive applicative

Studio della complessità linguistica e prospettive applicative Studio della complessità linguistica e prospettive applicative Dominique Brunato Istituto di Linguistica Computazionale «Antonio Zampolli» (ILC- CNR) ItalianNLP Lab 09 luglio 2015 L ItaliaNLP Lab Il gruppo

Dettagli

Modellazione di Workflow mediante le Reti di Petri. Prof. Giancarlo Fortino

Modellazione di Workflow mediante le Reti di Petri. Prof. Giancarlo Fortino Modellazione di Workflow mediante le Reti di Petri Prof. Giancarlo Fortino g.fortino@unical.it Introduzione Il successo di un sistema di workflow si basa sulla qualità dei flussi di lavoro che lo compongono.

Dettagli

Natural Language Processing

Natural Language Processing Natural Language Processing Introduzione Corso di Linguaggi & Traduttori Università degli Studi di Bari Pierpaolo Basile (Ph.D. Student) Outline Natural Language Processing Perché / Dove Un po di storia

Dettagli

L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora

L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora Costruzione di corpora 10. Valutazione del lessico 15 aprile 2014 Linguistica italiana II Mirko Tavosanis Ad una prima scorsa

Dettagli

INSEGNARE CON I TASK IL FOCUS LINGUISTICO

INSEGNARE CON I TASK IL FOCUS LINGUISTICO INSEGNARE CON I TASK IL FOCUS LINGUISTICO Il task è uno strumento utile nella didattica delle lingue poiché favorisce i processi naturali di acquisizione: offre agli apprendenti attività comunicative che

Dettagli

LATINO E GRECO. TEMPI DI RICONSEGNA DEGLI ELABORATI SCRITTI E DEI TEST OGGETTIVI: entro 15 giorni.

LATINO E GRECO. TEMPI DI RICONSEGNA DEGLI ELABORATI SCRITTI E DEI TEST OGGETTIVI: entro 15 giorni. LATINO E GRECO TEST D INGRESSO Non essendovi prerequisiti specifici, il test d ingresso è quello già somministrato per italiano. OBIETTIVI DA CONSEGUIRE NEL BIENNIO CONOSCENZE: - Morfologia (articolo per

Dettagli

Traduzione e computer (3) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015

Traduzione e computer (3) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Traduzione e computer (3) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Tipi di sistemi Fino alla metà degli anni 90 esistono solo due ;pi di sistemi di MT: Sistemi su mainframe

Dettagli

L italiano della comunicazione elettronica

L italiano della comunicazione elettronica Linguistica italiana Mirko Tavosanis A. a. 2015-2016 7. Analizzare i testi 17 novembre 2015 L italiano della comunicazione elettronica Oggi Parlare di un testo, descrivendone i tratti linguistici a diversi

Dettagli

MODELLI QUANTITATIVI. f x r = c

MODELLI QUANTITATIVI. f x r = c MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico

Dettagli

2. La gra(ica: vedere per capire

2. La gra(ica: vedere per capire Modelli linguistici 2. La gra(ica: vedere per capire www.insegnaregramma2ca.it Introduzione La rappresentazione grafica è anch essa una «forma» (quindi un astrazione) che però mostra fisicamente la stru%ura

Dettagli

Rappresentazione Binaria di Numeri Interi e in Virgola. Giuseppe Vizzari

Rappresentazione Binaria di Numeri Interi e in Virgola. Giuseppe Vizzari Rappresentazione Binaria di Numeri Interi e in Virgola Giuseppe Vizzari Codifica numeri naturali I numeri interi senza segno, ossia i numeri Naturali incluso lo 0, vengono rappresenta= a>raverso la loro

Dettagli

SINTASSI E L E M E N T I I N T R O D U T T I V I 2. Francesca Forza - Nozioni Generali di Sintassi

SINTASSI E L E M E N T I I N T R O D U T T I V I 2. Francesca Forza - Nozioni Generali di Sintassi SINTASSI 1 E L E M E N T I I N T R O D U T T I V I 2 Perché la sintassi? 2 Il significato di una frase (e quindi più in generale la semantica) non dipende solo dalle sue componenti (il lessico) ma anche

Dettagli

Fasi di un Compilatore

Fasi di un Compilatore Dipartimento di Matematica e Informatica Università di Camerino Un implementazione compilativa di un linguaggio di programmazione viene realizzata tramite un programma che prende il nome di compilatore

Dettagli

Linguistica Computazionale. 23 novembre 2016

Linguistica Computazionale. 23 novembre 2016 Linguistica Computazionae 23 novembre 2016 TAL: agoritmi di ML Esistono due grandi categorie di agoritmi basati su metodi di ML: agoritmi non supervisionati (unsupervised): non necessitano di un corpus

Dettagli

Corso di Linguaggi di Programmazione + Laboratorio

Corso di Linguaggi di Programmazione + Laboratorio Corso di inguaggi di Programmazione + aboratorio Capitolo 1 - Introduzione Si ringrazia il Dott. Marco de Gemmis per la collaborazione nella predisposizione del materiale didattico Apprendimento di un

Dettagli

Il formato EPUB 3.0. Il documento EPUB. Editoria digitale. Maria A. Alber( Informa(ca per la comunicazione digitale AA 16/17

Il formato EPUB 3.0. Il documento EPUB. Editoria digitale. Maria A. Alber( Informa(ca per la comunicazione digitale AA 16/17 Il formato EPUB 3 Editoria digitale Maria A. Alber( Informa(ca per la comunicazione digitale AA 16/17 Il documento EPUB Il formato EPUB 3 può essere visto come il collante che lega tuie le tecnologie che

Dettagli

Esercizio: apprendimento di congiunzioni di letterali

Esercizio: apprendimento di congiunzioni di letterali input: insieme di apprendimento istemi di Elaborazione dell Informazione 18 Esercizio: apprendimento di congiunzioni di letterali Algoritmo Find-S /* trova l ipotesi più specifica consistente con l insieme

Dettagli

TLT Tren)no Language Tes)ng

TLT Tren)no Language Tes)ng TLT Tren)no Language Tes)ng - 2018 L. Covi, M. Oliviero, M. Carpita, M. Chicco Trento, 6 aprile 2019 Questa inizia)va è realizzata nell ambito del progeio Azioni a supporto del Piano Tren)no Trilingue

Dettagli

Problem solving elementare su dati scalari

Problem solving elementare su dati scalari Problem solving elementare su dati scalari Problemi numerici Problemi di codifica/decodifica Problemi testuali Problemi di verifica e filtro di dati Problemi di ordinamento Sommario 2 2006 Politecnico

Dettagli

Strumenti informatici per gli studi filologici

Strumenti informatici per gli studi filologici Strumenti informatici per gli studi filologici Federico Boschetti federico.boschetti@unitn.it 1/24 IV Parte Dal corpus al treebank Alcune applicazioni ai Persiani di Eschilo 2/24 Il corpus non lemmatizzato

Dettagli

OBIETTIVI COGNITIVI LATINO CLASSI PRIME. Competenze specifiche Abilità Conoscenze ABILITÀ MORFO-SINTATTICHE

OBIETTIVI COGNITIVI LATINO CLASSI PRIME. Competenze specifiche Abilità Conoscenze ABILITÀ MORFO-SINTATTICHE OBIETTIVI COGNITIVI LATINO CLASSI PRIME Fonetica sue strutture morfosintattiche di base. 3. Arricchire il proprio bagaglio lessicale, imparando a usarlo consapevolmente. 4. Comprendere lo stretto rapporto

Dettagli

Come funziona il Part-of-Speech Tagging

Come funziona il Part-of-Speech Tagging Come funziona il Part-of-Speech Tagging Marco Baroni 14 marzo 2005 1 Introduzione Abbiamo usato taggers pre-addestrati che, dato un corpus in input, producono output taggato. In questo handout, studiamo

Dettagli

Lezione 26/09/2018. Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci

Lezione 26/09/2018. Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci Lezione 26/09/2018 Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci maila.pentucci@unimc.it Organizzazione e informazioni Descrizione del Corso 2018/19 n. 7 CFU (6+1) corrispondenti a n. 46 ore (36+10)

Dettagli

PIACENZA SMART CITY Edo Ronchi, Presidente Fondazione per lo sviluppo sostenibile Piacenza 20 aprile 2012

PIACENZA SMART CITY Edo Ronchi, Presidente Fondazione per lo sviluppo sostenibile Piacenza 20 aprile 2012 PIACENZA SMART CITY 2020 Edo Ronchi, Presidente Fondazione per lo sviluppo sostenibile Piacenza 20 aprile 2012 ObieLvi della ricerca 1. Iden5ficare un modello strategico per un progeco che individui gli

Dettagli

Progettazione per moduli Percorso di istruzione di 1 livello, 2 periodo didattico, Asse dei linguaggi Modulo 1

Progettazione per moduli Percorso di istruzione di 1 livello, 2 periodo didattico, Asse dei linguaggi Modulo 1 Modulo 1 IL TESTO NARRATIVO DURATA PREVISTA : : : Leggere, comprendere e interpretare testi scritti. Padroneggiare gli strumenti espressivi. Produrre testi di vario tipo in relazione ai differenti scopi

Dettagli

8. Importanza del signi3icato e dell intenzione

8. Importanza del signi3icato e dell intenzione Modelli linguistici 8. Importanza del signi3icato e dell intenzione www.insegnaregramma2ca.it Introduzione Anche il significato è fondamentale, ma non è considerato un «capitolo» della gramma2ca. Invece

Dettagli

Componente Lessicale. Scopi

Componente Lessicale. Scopi Componente Lessicale Scopi Riconoscere gli elementi lessicali Assegnare agli elementi lessicali informazioni sulla loro categoria grammaticale Risolvere l ambiguità grammaticale Vedi lezione sull ambiguità

Dettagli

Indicazioni per l uso degli esercizi con studenti DSA

Indicazioni per l uso degli esercizi con studenti DSA Indicazioni per l uso degli esercizi con studenti DSA Volume A - Ortografia, lessico, morfologia Unità 1 Es. 2 p. 36 Es. 1 p. 37 Es. 1 p. 38 Es. 2 p. 38 Es. 4 p. 38 Es. 5 p. 38 Es. 1, 2, 3, 4 p. 41 Es.

Dettagli

Riconoscitore di forme (tokenizer) Componente Lessicale. Struttura e funzioni del modulo lessicale. Riconoscimento e categorizzazione.

Riconoscitore di forme (tokenizer) Componente Lessicale. Struttura e funzioni del modulo lessicale. Riconoscimento e categorizzazione. Scopi Componente Lessicale Riconoscere gli elementi lessicali Assegnare agli elementi lessicali informazioni sulla loro categoria grammaticale Risolvere l ambiguità grammaticale Vedi lezione sull ambiguità

Dettagli

AIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE

AIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE AIP Seminario residenziale Psicologia del discorso e analisi dei discorsi L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE Silvia Gattino e Stefano Tartaglia Dipartimento di Psicologia Università

Dettagli

Linguistica Computazionale. 25 novembre 2016

Linguistica Computazionale. 25 novembre 2016 Linguistica Computazionae 25 novembre 2016 Schemi di annotazione sintattica Labeed bracketing identificazione dea struttura a costituenti sintagmatici (abero sintattico) [S [NP Gianni] [Aux ha] [VP dato

Dettagli

ENTE NAZIONALE SORDI PROGRAMMA DEL CORSO DI LOGOGENIA

ENTE NAZIONALE SORDI PROGRAMMA DEL CORSO DI LOGOGENIA 2 ENTE NAZIONALE SORDI Sezione Provinciale di Firenze PROGRAMMA DEL CORSO DI LOGOGENIA 1 lezione: Dott.ssa Elisa Franchi Sabato 1 Dicembre 2012 dalle ore 09:30 alle ore 12:30 pausa pranzo: 1 ora e 30 minuti

Dettagli

Reti Neurali in Generale

Reti Neurali in Generale istemi di Elaborazione dell Informazione 76 Reti Neurali in Generale Le Reti Neurali Artificiali sono studiate sotto molti punti di vista. In particolare, contributi alla ricerca in questo campo provengono

Dettagli

Per una Pubblica Amministrazione SEMPLICE

Per una Pubblica Amministrazione SEMPLICE Per una Pubblica Amministrazione SEMPLICE Alessandro Lenci CoLing Lab Laboratorio di Linguistica Computazionale http://colinglab.humnet.unipi.it/ Università di Pisa Workshop ELRC in Italia Roma, 15 marzo

Dettagli

Funzioni nella frase e sostituzioni

Funzioni nella frase e sostituzioni Scuola secondaria I grado Scuola secondaria II grado Funzioni nella frase e sostituzioni www.insegnaregramma2ca.it Vantaggi del modello dei gruppi sintattici 1. Mostra le funzioni dei gruppi, nei quali

Dettagli

Res$tuzione da$ 2018

Res$tuzione da$ 2018 Res$tuzione da$ 2018 1 I risulta$ delle prove I da% res%tui% dall'invalsi riguardano tre aspe7: l'andamento complessivo dei livelli di apprendimento degli studen% della scuola rispe

Dettagli

ANALISI DELLE POSIZIONI

ANALISI DELLE POSIZIONI ANALISI DELLE POSIZIONI L analisi delle posizioni rappresenta un focus strategico per la funzione RU; tutte le attività di GRU poggiano sull analisi delle posizioni in quanto rappresentano uno strumento

Dettagli

Università degli Studi di Roma Tor Vergata Facoltà di Ingegneria Corso di Laurea in Ingegneria Medica. Compressione dati

Università degli Studi di Roma Tor Vergata Facoltà di Ingegneria Corso di Laurea in Ingegneria Medica. Compressione dati Università degli Studi di Roma Tor Vergata Facoltà di Ingegneria Corso di Laurea in Ingegneria Medica Compressione dati Compressione dei dati Il processo di compressione consiste nell effettuare codifiche

Dettagli

UNITA DI APPRENDIMENTO. La frase e brevi testi

UNITA DI APPRENDIMENTO. La frase e brevi testi Istituto Comprensivo "Fracassetti - Capodarco" Via Visconti d Oleggio, 83 / 63900 Fermo tel: 0734/621273 - fax: 0734/601112 CF: 90055090444 CM:APIC841002 sito web: www.iscfracassetticapodarco.gov.it e-mail:

Dettagli

Linguistica Computazionale. 22 settembre 2014

Linguistica Computazionale. 22 settembre 2014 Linguistica Computazionale 22 settembre 2014 Obiettivi del corso Introduzione ai principali metodi di linguistica computazionale e di Natural Language Processing (NLP) Docenti Alessandro Lenci (Dip. di

Dettagli

Annotazione semantica di eventi calcistici

Annotazione semantica di eventi calcistici Annotazione semantica di eventi calcistici Valentino Frasnelli Liceo Linguistico Sophie Scholl - Tirocinio presso l unità di ricerca HLT-NLP Team FBK: Bernardo Magnini, Anne-Lyse Minard e Manuela Speranza

Dettagli

Logica proposizionale

Logica proposizionale Definire un linguaggio formale Logica proposizionale Sandro Zucchi 2013-14 Definiamo un linguaggio formale LP (che appartiene a una classe di linguaggi detti linguaggi della logica proposizionale) Per

Dettagli

Gruppo 1. SCHEDA GUIDA UdA 1 Referente Componenti Titolo

Gruppo 1. SCHEDA GUIDA UdA 1 Referente Componenti Titolo Gruppo 1 Lingua e linguaggio Descrivere le differenze tra lingua e linguaggio (naturale o artificiale) ed esaminarne gli elementi (alfabeto, lessico, sintassi e semantica). Individuare analogie e differenze

Dettagli

Liferay e SKOSware - come SKOSsizzare i propri contenuti. 11 Giugno 2012

Liferay e SKOSware - come SKOSsizzare i propri contenuti. 11 Giugno 2012 Liferay e SKOSware - come SKOSsizzare i propri contenuti 11 Giugno 2012 Tesauri Un tesauro è uno strumento per la condivisione del linguaggio. Vari tipi di organizzazioni collezionano in tesauri il loro

Dettagli

ELEMENTI DEL LINGUAGGIO INFORMATICO. Accademia Belle Ar:

ELEMENTI DEL LINGUAGGIO INFORMATICO. Accademia Belle Ar: 2 ELEMENTI DEL LINGUAGGIO INFORMATICO Accademia Belle Ar: 3 Parte SESTA L Umanista Informa:co, APOGEO Ed. Fabio Brivio 4 Esempio di visualizzazione del browser Lynx, primi anni 90 (per trasmissione tes:)

Dettagli

Perchè un modello Esteso? MODELLAZIONE ER ESTESA (EER) ì Consente una proge-azione più accurata dello schema di una base di da7

Perchè un modello Esteso? MODELLAZIONE ER ESTESA (EER) ì Consente una proge-azione più accurata dello schema di una base di da7 MODELLAZIONE ER ESTESA (EER) 2 Perchè un modello Esteso? Consente una proge-azione più accurata dello schema di una base di da7 Consente una rappresentazione più precisa dei vincoli fra I da7 Consente

Dettagli

LINGUA ITALIANA. Sapere Nuclei fondanti TESTO. Saper fare. Memorizzare. Comprendere. Produrre CODICE OGGETTO CULTURALE LESSICO.

LINGUA ITALIANA. Sapere Nuclei fondanti TESTO. Saper fare. Memorizzare. Comprendere. Produrre CODICE OGGETTO CULTURALE LESSICO. LINGUA ITALIANA è è Sapere Nuclei fondanti OGGETTO CULTURALE che registra i CAMBIAMENTI. CODICE Utilizzato per la COMUNICAZIONE Ha come unità fondamentale il TESTO Utilizza un LESSICO Saper fare che determinano

Dettagli

IL LABORATORIO DI ITALIANO L2. apprendere e insegnare la lingua seconda

IL LABORATORIO DI ITALIANO L2. apprendere e insegnare la lingua seconda IL LABORATORIO DI ITALIANO L2 apprendere e insegnare la lingua seconda GLI ALLIEVI Sradicamento Urgenza comunicativa Adattamento Integrazione Nuove fedeltà COSA SAPERE Progetto migratorio della famiglia

Dettagli

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI

PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI Punti chiave di un progetto di SID 1. Progettare il database direzionale (scelta dei dati elementari, struttura del db) 2. Scegliere e confezionare le informazioni

Dettagli

Il codice linguistico

Il codice linguistico Laboratorio Linguistico Il Testo narrativo Il codice linguistico www.nicolanapolitano.altervista.org App Generation Writers I. C. San Francesco Nicola Napolitano Anguillara Sabazia - RM Le funzioni e la

Dettagli

Linguaggi e Traduttori: Analisi sintattica

Linguaggi e Traduttori: Analisi sintattica Linguaggi e Traduttori: Analisi sintattica Armando Tacchella Sistemi e Tecnologie per il Ragionamento Automatico (STAR-Lab) Dipartimento di Informatica Sistemistica e Telematica (DIST) Università di Genova

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Esercitazione: analisi del testo Python : leggere un file di testo Per aprire un file di testo in Python si usa la classe codecs ed il suo metodo open( ): Il programma si aspetta

Dettagli