Linguis'ca computazionale, treebank e altre risorse
|
|
- Gabriella Parisi
- 5 anni fa
- Visualizzazioni
Transcript
1 Linguis'ca computazionale, treebank e altre risorse Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale
2 Di cosa parleremo Task di LC Risorse linguis%che (diverse dai corpora) Corpora annota% e Treebank Il ProgeIo Turin University Treebank e Parallel Turin University Treebank Il progeio Universal Dependency
3 Task di LC I sistemi di LC svolgono vari %pi di analisi del testo, singolarmente o in abbinamento. Il %po di task determina: - come è faio l input - come è faio l output - quali passi intermedi di analisi devono essere svol% - quali risorse sono necessarie
4 Task di LC TuR i sistemi aiuali di LC u%lizzano risorse linguis%che per passare dall input all output. input output risorsa1 risorsa2
5 Gerarchia di Task di LC I task tradizionali possono essere pensa% in una gerarchia che ne evidenzia la crescente difficoltà: Tokenizzazione Part of Speech Tagging = analisi morfologica Parsing = analisi sintarca Analisi seman%ca Altri task nuovi si basano su di essi.
6 Tokenizzazione Consiste nel dis%nguere nel testo le unità minime morfologiche (der token). L input è il testo in forma di frase o intero testo. Es: Il ga,o dorme sul terrazzo L output è il testo suddiviso in token. Es: tok1=il tok2=ga,o tok3=dorme tok4=su tok5=il tok6=terrazzo
7 Part of Speech (PoS) tagging Consiste nell associare ad ogni token una descrizione della sua morfologia. L input è il singolo token. Es: Il L output è il token con associate le rela%ve informazioni morfologiche Es: Il ARTICOLO DETERMINATIVO SINGOLARE MASCHILE
8 Part of Speech tagging La descrizione della morfologia di una parola (il PoS tagging) può includere anche la lemma%zzazione. Essa è di faio necessaria per iden%ficare la categoria gramma%cale della parola e può essere resa esplicita nell output del PoS tagging. Es: Il IL ARTICOLO DETERMINATIVO SINGOLARE MASCHILE
9 Part of Speech tagging e risorse Quali risorse si u%lizzano per fare il PoS tagging? Collezioni di lemmi Collezioni di forme (MORPH- IT) Dizionari con informazioni morfologiche Corpora con già applicato il PoS tagging (per fare apprendimento) (POSTWITA)
10 Morph- It (Zanche,a, Baroni) È una risorsa lessicale basata su forme che con%ene: - per ogni forma il lemma, la categoria gramma%cale e caraieris%che morfologiche - serve il Part of Speech tagging e la lemma%zzazione
11 Morph- It (Zanche,a, Baroni) Con%ene 505,074 voci che corrispondono a 35,056 lemmi. È stata costruita partendo da un corpus di 380 milioni di token (ar%coli di La Repubblica dal 1985 al 2000) annotato con lemmi e parte della morfologia, poi arricchito con le forme mancan% e la morfologia mancante. h,p://sslmitdev- online.sslmit.unibo.it/linguisccs/morph- it.php
12 PoSTWITA (Bosco, Tamburini, Mazzei, Bolioli) Con%ene 301 tweet annota% dal punto di vista morfologico. L annotazione è stata faia automa%camente e correia a mano. Rappresenta la lingua italiana dei social media.
13 Parsing Consiste nell associare ad ogni frase una descrizione della sua sintassi. L input è la frase tokenizzata e analizzata morfologicamente (dal PoS tagging).
14 Parsing: input 1 Il ART DEF MAS SING 2 ga,o NOM COM MAS SING 3 dorme VERB IND PRES 3 SING 4 su PREP 5 il ART DEF MAS SING 6 terrazzo NOM COM MAS SING
15 Parsing: output 1 Il ART DEF MAS SING SoggeLo di 3 2 ga,o NOM COM MAS SING Argomento di 1 3 dorme VERB IND PRES 3 SING Radice 4 su PREP Modificatore di 3 5 il ART DEF MAS SING Argomento di 4 6 terrazzo NOM COM MAS SING Argomento di 5
16 Parsing: output dorme VERB IND PRES 3 SING Soggetto Modificatore Il ART DEF MAS SING Argomento gatto NOM COM MAS SING su PREP Argomento il ART DEF MAS SING Argomento terrazzo NOM COM MAS SING
17 Parsing e risorse Quali risorse si u%lizzano per fare il parsing? I treebank, ampie collezioni di frasi annotate dal punto di vista morfologico e sintarco. In linea di principio servirebbe solo l annotazione sintarca, ma dato che quella morfologica ne è un prerequisito, si meie anche quella negli stessi da%. Dei treebank parleremo in deiaglio più avan%.
18 Analisi seman%ca Consiste nell associare ad ogni frase una descrizione della sua seman%ca. L input è la frase tokenizzata, analizzata morfologicamente (dal PoS tagging) e sintarcamente (dal parsing).
19 Analisi seman%ca È il %po di analisi più difficile per la quale esistono solo alcuni sub- task sviluppa%. Tra di essi ci%amo il word sense disambigua%on per il quale esistono risorse linguis%che molto importan%: BabelNet h,p://babelnet.org/ Mul%WordNet h,p://mulcwordnet.sk.eu/ english/home.php/
20 Gerarchia di Task di LC I task nuovi si basano su quelli tradizionali, ad esempio la Sen%ment analysis sovente u%lizza forme di (parziale) analisi morfologica e sintarca.
21 Sen%ment analysis Consiste nell associare ad ogni porzione data di testo un valore di polarità o una classificazione. L input è il testo, eventualmente analizzato morfologicamente e/o sintarcamente. L output è il testo classificato secondo la polarità o altra classe definita.
22 Sen%ment analysis e risorse - Lessici per la sen%ment analysis: contengono parole con associata una polarità (AFINN) - Quando un sistema di sen%ment analysis deve rilevare la polarità di un testo cerca le parole del testo nel lessico, se le trova prende la loro polarità e sommando tuie le polarità delle parole calcola quella della frase.
23 Esempi di risorse linguis%che Mario MonC: Berlusconi risparmi all'italia il biasimo per aver causato un disastro #mariomoncpremier > Polarità Nega%va Mario #MonC Senatore a vita è una splendida noczia per tuw gli italiani, è l'emblema di quei ci,adini meritevoli che onorano la Patria. > Polarità Posi%va
24 Le risorse linguis%che La quan%tà e la varietà di risorse linguis%che dimostra la loro centralità per la LC. Una parte consistente della comunità della LC lavora solo per costruire risorse. Esistono molte risorse per l inglese, ma anche per altre lingue (a volte costruite a par%re dalle prime).
25 Le risorse linguis%che - Con il termine risorse linguis%che si indicano i corpora e tuie le altre - Sono delle raccolte di informazioni a cui i sistemi di LC accedono durante lo svolgimento del loro compito - Esse rappresentano il versante preiamente linguis%co della LC
26 CORPORA e TREEBANK A par%re dalla fine degli anni 90 si applicano nella LC approcci basa% su corpora. Inizialmente si traia di corpora molto grandi non annota% (approcci non supervisiona%). In seguito si traia di corpora meno grandi ma annota% (approcci supervisiona%).
27 Annotazione e corpora Come annotare i da%? Le informazioni annotate variano parecchio a seconda dello scopo per cui si costruisce il corpus, perché le informazioni che i sistemi devono apprendere sono streiamente correlate al compito che il sistema deve svolgere.
28 Annotazione e corpora Come annotare i da%? - Corpora per sen%ment analysis: polarità, stance, ironia, target... - Corpora per named en%ty recogni%on: persone, luoghi, aziende, date... - Corpora per Part of Speech tagging: lemmi, categorie gramma%cali,...
29 Annotazione e treebank Come annotare i da%? Per ogni livello di annotazione vengono faie delle scelte sia sulla teoria linguis%ca da prendere come riferimento sia sul modo in cui fisicamente mostrare i da%.
30 Annotazione e treebank Quali da% annotare? Occorre scegliere i tes% da introdurre nel corpus in modo che siano rappresenta%vi del linguaggio che si vuole traiare.
31 Annotazione e treebank Quali da% annotare? un corpus é un campione significa%vo e rappresenta%vo di un linguaggio SE: con%ene frasi non ristreie è bilanciato rispeio al genere, alla collocazione geografica e sociale, al tempo MA non rappresenta mai TUTTO il linguaggio nel suo complesso
Linguis'ca computazionale e approcci corpus- based
Linguis'ca computazionale e approcci corpus- based Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2016-2017 Sistemi di NLP Per definire un sistema di NLP occorre conoscerne
DettagliLinguis'ca computazionale e treebank
Linguis'ca computazionale e treebank Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2016-2017 Il proge=o Turin University Treebank ObieFvo: sviluppare una risorsa linguis%ca,
DettagliAnalisi morfologica. Si analizza ogni parola PRESA SINGOLARMENTE e se ne esplicitano le cara%eris/che gramma/cali:
E so%oproblemi Per ges/re le difficoltà che la comprensione del linguaggio nel suo complesso comporta, si scompone il compito (task) del NLP in vari so%oproblemi (subtasks) rela/vamente indipenden/ e consisten/
DettagliLinguistica computazionale: task sul linguaggio naturale"
Linguistica computazionale: task sul linguaggio naturale" Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale NLP e subtask Ci focalizziamo su alcuni subtask rappresentativi:" Information
DettagliLinguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte)"
Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte)" Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale NLP e subtask Ci
DettagliLinguistica Computazionale
Linguistica Computazionale Trattamento Automatico della Lingua 24 novembre 2014 Tecnologie del linguaggio Sistemi in grado di accedere al contenuto di informazione attraverso l elaborazione automatica
DettagliCorpora e linguistica computazionale
Corpora e linguistica computazionale Cristina Bosco Corso di Informatica applicata alla comunicazione multimediale 2013-2014 Elaborare il linguaggio naturale Il problema della comprensione del linguaggio
DettagliLinguis'ca computazionale e approcci corpus- based
Linguis'ca computazionale e approcci corpus- based Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Sistemi di NLP Per definire un sistema di NLP occorre conoscerne
DettagliComputer assisted transla0on (CAT - 2) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale
Computer assisted transla0on (CAT - 2) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Cosa è una Memoria di Traduzione Una TM (Transla0on Memory) è un archivio di materiali
DettagliLinguistica Computazionale 2004 Presentazione del Corso
13 febbraio 2004 1 Informazioni generali Docente Marco Baroni Email baroni@sslmit.unibo.it Telefono 0453/374744 Homepage del corso http://www.e-learning.sslmit.unibo.it/compling04/ Orario lezioni Lunedì
DettagliClassificare i nomi propri -Esercitazione-
Classificare i nomi propri -Esercitazione- Lucia Passaro CoLing Lab Laboratorio di Linguistica Computazionale http://colinglab.humnet.unipi.it/ lucia.passaro@for.unipi.it Pisa 29 Novembre 2017 Analisi
DettagliDidattica delle lingue moderne LM. Elena Nuzzo
Didattica delle lingue moderne LM ì Elena Nuzzo Video: il ruolo della lingua materna Le sequenze evolutive Tu, gli apprenden2 sviluppano la lingua rispe5ando le stesse sequenze, anche se con tempi e risulta2
DettagliData Journalism. Analisi dei dati. Angelica Lo Duca
Data Journalism Analisi dei dati Angelica Lo Duca angelica.loduca@iit.cnr.it Obiettivo L obiettivo dell analisi dei dati consiste nello scoprire trend, pattern e relazioni nascosti nei dati. di analisi
DettagliIntroduzione al Test in Itinere
Introduzione al Test in Itinere Roberto Basili Università di Roma, Tor Vergata Argomenti oggetto di esame Rappresentazioni vettoriali per la classificazione Clustering Algoritmi di apprendimento automatico
DettagliTECNOLOGIE DEL LINGUAGGIO
Internet Festival 10 ottobre 2014 TECNOLOGIE DEL LINGUAGGIO NUOVI MESTIERI, NUOVE RICERCHE Maria Simi Dipartimento di Informatica Università di Pisa Internet Festival 10 ottobre 2014 INTRODUZIONE Il settore
DettagliSviluppo di Risorse Linguistiche per l Ambiente di Scrittura Assistita (ASA)
Università degli Studi di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea Triennale in Informatica Informatica e Linguistica Linguistica Sviluppo di Risorse Linguistiche per l Ambiente
DettagliIntroduzione. TALN Corpus-based computational linguistics. Rapporto tra forme, classificazioni e lemmi. Liste e classi di frequenza del lessico
TALN Stu Statistici TALN Corpus-based computational linguistics Seminario del corso Trattamento Automatico del Linguaggio Naturale (a. a. 01 02) 2 Introduzione Gli strumenti informatici ed i meto statistici
DettagliISTRUZIONI PROGETTO FASE 4
ISTRUZIONI PROGETTO FASE 4 Data consegna: tre giorni (72 ore) prima della verbalizzazione Questo documento contiene le istruzione per l esecuzione della fase 4 del progetto. Per informazioni o domande
DettagliI Big Data e la Linguis/ca Computazionale Il proge7o SEMPLICE Alessandro Lenci CoLing Lab, Università di Pisa
Firenze, 25 Settembre I Big Data e la Linguis/ca Computazionale Il proge7o SEMPLICE Alessandro Lenci CoLing Lab, Università di Pisa 1 Dare un senso ai Big Data Noam Chomsky Big Data is a step forward.
DettagliSommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2)
Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,
DettagliLingua, statistica e computazione
Lingua, statistica e computazione Isabella Chiari Facoltà di Scienze Umanistiche Università La Sapienza di Roma Roma, 25 novembre 2005 UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA DIPARTIMENTO DI MECCANICA
DettagliLinguistica computazionale: come accedere all informazione codificata nel linguaggio naturale"
Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale" Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale Alcune domande - Che cosa sono la
DettagliSommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio
Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio Messaggio Insieme di sequenze di simboli, le parole,
DettagliLinguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione
Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,
DettagliLinguistica dei corpora. Daniela Trotta
Linguistica dei corpora Daniela Trotta dtrotta@unisa.it Competenze del linguista computazionale 1. capacità di selezionare e raccogliere i dati linguistici 2. conoscenza di metodi formali 3. padronanza
DettagliCome procedere nell annotazione di un corpus!
Come procedere nell annotazione di un corpus! Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale Strumenti base! Per lavorare sull annotazione ci servono alcuni strumenti:! editor
DettagliMatematica, Informatica e Discipline Umanistiche. Salvatore Venticinque
Matematica, Informatica e Discipline Umanistiche Salvatore Venticinque salvatore.venticinque@unina2.it Distanze siderali: un luogo comune Odio l'italiano Sono Negato per la matematica Forma mentis, predisposizione?
DettagliLinguistica Computazionale
Linguistica Computazionale Collocazioni e misure statistiche di associazione 27 ottobre 2014 Le parole in contesto You shall know a word by the company it keeps J. R. Firth (1957) XXXXX andamento_della_x;
DettagliOdi et amo in Twi-er Cris1na Bosco, Viviana Pa8 T4T 3 Dicembre 2016
Odi et amo in Twi-er Cris1na Bosco, Viviana Pa8 Dipar&mento di Informa&ca Università degli studi di Torino bosco@di.unito.it, pa=@di.unito.it T4T 3 Dicembre 2016 Team Giancarlo RUFFO Cris&na BOSCO Viviana
DettagliLinguistica Computazionale
Linguistica Computazionale Part of Speech Tagging 1 dicembre 2014 Analisi morfo-sintattica (POStagging) Il PoS Tagging è utilizzato per la disambiguazione morfologica. id forma lemma pos tratti 1 Il il
DettagliMa, alla fine come si svolgono i corsi di addestramento e formazione a Ricine ed in Casen8no?
Ma, alla fine come si svolgono i corsi di addestramento e formazione a Ricine ed in Casen8no? La loca8on Si lavora in bosco in soprassuoli rappresenta8vi della realtà forestale regionale di norma ubica8
DettagliLinguistica Computazionale: esercitazioni
Esercitazione 1 Felice Dell'Orletta ItaliaNLP Lab (www.italianlp.it) presso Istituto di Linguistica Computazionale A. Zampolli CNR felice.dellorletta@ilc.cnr.it 24 settembre 2014 Linguistica Computazionale:
DettagliCurriculum vitae di Cristina Bosco
Curriculum vitae di Cristina Bosco Studi ed attività di ricerca Da ottobre 2006, è ricercatrice afferente al dipartimento di Informatica presso la Facoltà di Scienze Matematiche Fisiche e Naturali dell'università
DettagliDocente: FABRIZIO DIECI. Scuola: Liceo Ar2s2co Statale Klee- Barabino, Genova. Titolo del modulo: SYMBOLS IN STAGLIENO. Classe.
Docente: FABRIZIO DIECI Scuola: Liceo Ar2s2co Statale Klee- Barabino, Genova Titolo del modulo: SYMBOLS IN STAGLIENO Classe Disciplina Quinta, Sezione B (n. 14 studen2) DISCIPLINE PLASTICHE E SCULTOREE
DettagliProcessi fisici Processi informativi Processi aziendali
Processo Modellizzazione dei processi aziendali Dott.ssa Enrica Gentile a.a. 2003-2004 L insieme delle attività elementari che vengono svolte per raggiungere un certo obiettivo nel sistema. Possiamo avere
DettagliCAPITOLO 7. Cos$ e minimizzazione dei cos$
CAPITOLO 7 Cos$ e minimizzazione dei cos$ 1 Costo opportunità Il costo opportunità di una par-colare alterna-va è il guadagno associato alla migliore tra le alterna,ve non scelte 2 Costo opportunità Il
DettagliAlgoritmi e soluzioni di problemi
Algoritmi e soluzioni di problemi 1 Informazioni e linguaggio Ottenere informazioni significa aumentare le nostre conoscenze ottenere indicazioni che ci fanno agire in un determinato modo Esempi Ad un
DettagliDispensa 2. Data una grammatica context free esistono tre metodi diversi per costruirne la parsing table per un parser LR:
Dispensa 2 2.1 Costruzione Parsing Table LR: generalità Come tutti i parser tabellari predittivi, anche i parser LR possono essere applicati solo a parsing table senza conflitti (ossia entrate multiple)
Dettagli6. Parti del discorso e funzioni
Modelli linguistici 6. Parti del discorso e funzioni www.insegnaregramma2ca.it Introduzione Ciascuna parte del discorso si colloca all interno dei gruppi in modo prevedibile (per es. nell ovale art.+ nome
Dettagli014 5 Pragmatica Lingue per scopi speciali. [014 8] Abbreviazioni e simboli Filosofia e teoria
T4 T4 014 301 Filosofia e teoria 014 301 8 Scuole, teorie, metodologie 014 301 82 Linguistica formale Notazione 01 dalla Tavola 1 come di seguito modificata Da non usare per scuole e teorie semantiche;
Dettagli11. Il lessico dei testi
Modulo B I testi brevi 11. Il lessico dei testi 27 aprile 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Analisi quantitativa del testo Vediamo esempi di analisi quantitativa del testo condotta
DettagliTra$amento Automa-co del Linguaggio Naturale (1) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale
Tra$amento Automa-co del Linguaggio Naturale (1) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Di cosa parleremo - definizione di NLP e MT - problemi e so$oproblemi - approcci
DettagliLinguaggi e Ambienti di Programmazione
Linguaggi e Ambienti di Programmazione Principi e tecniche diffuse che si incontrano spesso nelle applicazioni dell informatica. Compilatori Editor di struttura: riceve in input una sequenza di comandi
DettagliTraining Set Test Set Find-S Dati Training Set Def: Errore Ideale Training Set Validation Set Test Set Dati
" #!! Suddivisione tipica ( 3 5 6 & ' ( ) * 3 5 6 = > ; < @ D Sistemi di Elaborazione dell Informazione Sistemi di Elaborazione dell Informazione Principali Paradigmi di Apprendimento Richiamo Consideriamo
DettagliApplicazioni di NLP per il Semantic Web
Università degli Studi di Salerno Dipar1mento di Scienze Poli1che, Sociali e della Comunicazione Applicazioni di NLP per il Semantic Web Tra$amento delle polirema/che terminologiche nel dominio della A.
DettagliStudio della complessità linguistica e prospettive applicative
Studio della complessità linguistica e prospettive applicative Dominique Brunato Istituto di Linguistica Computazionale «Antonio Zampolli» (ILC- CNR) ItalianNLP Lab 09 luglio 2015 L ItaliaNLP Lab Il gruppo
DettagliModellazione di Workflow mediante le Reti di Petri. Prof. Giancarlo Fortino
Modellazione di Workflow mediante le Reti di Petri Prof. Giancarlo Fortino g.fortino@unical.it Introduzione Il successo di un sistema di workflow si basa sulla qualità dei flussi di lavoro che lo compongono.
DettagliNatural Language Processing
Natural Language Processing Introduzione Corso di Linguaggi & Traduttori Università degli Studi di Bari Pierpaolo Basile (Ph.D. Student) Outline Natural Language Processing Perché / Dove Un po di storia
DettagliL italiano di stranieri, l italiano di apprendenti indagati attraverso corpora
L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora Costruzione di corpora 10. Valutazione del lessico 15 aprile 2014 Linguistica italiana II Mirko Tavosanis Ad una prima scorsa
DettagliINSEGNARE CON I TASK IL FOCUS LINGUISTICO
INSEGNARE CON I TASK IL FOCUS LINGUISTICO Il task è uno strumento utile nella didattica delle lingue poiché favorisce i processi naturali di acquisizione: offre agli apprendenti attività comunicative che
DettagliLATINO E GRECO. TEMPI DI RICONSEGNA DEGLI ELABORATI SCRITTI E DEI TEST OGGETTIVI: entro 15 giorni.
LATINO E GRECO TEST D INGRESSO Non essendovi prerequisiti specifici, il test d ingresso è quello già somministrato per italiano. OBIETTIVI DA CONSEGUIRE NEL BIENNIO CONOSCENZE: - Morfologia (articolo per
DettagliTraduzione e computer (3) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015
Traduzione e computer (3) Cris%na Bosco Informa%ca applicata alla comunicazione mul%mediale 2014-2015 Tipi di sistemi Fino alla metà degli anni 90 esistono solo due ;pi di sistemi di MT: Sistemi su mainframe
DettagliL italiano della comunicazione elettronica
Linguistica italiana Mirko Tavosanis A. a. 2015-2016 7. Analizzare i testi 17 novembre 2015 L italiano della comunicazione elettronica Oggi Parlare di un testo, descrivendone i tratti linguistici a diversi
DettagliMODELLI QUANTITATIVI. f x r = c
MODELLI QUANTITATIVI Qualunque sia il modello di estrazione di regolarità o di conoscenze dai dati empirici, esiste sempre una base statistica da cui occorre partire. Un fenomeno linguistico specifico
Dettagli2. La gra(ica: vedere per capire
Modelli linguistici 2. La gra(ica: vedere per capire www.insegnaregramma2ca.it Introduzione La rappresentazione grafica è anch essa una «forma» (quindi un astrazione) che però mostra fisicamente la stru%ura
DettagliRappresentazione Binaria di Numeri Interi e in Virgola. Giuseppe Vizzari
Rappresentazione Binaria di Numeri Interi e in Virgola Giuseppe Vizzari Codifica numeri naturali I numeri interi senza segno, ossia i numeri Naturali incluso lo 0, vengono rappresenta= a>raverso la loro
DettagliSINTASSI E L E M E N T I I N T R O D U T T I V I 2. Francesca Forza - Nozioni Generali di Sintassi
SINTASSI 1 E L E M E N T I I N T R O D U T T I V I 2 Perché la sintassi? 2 Il significato di una frase (e quindi più in generale la semantica) non dipende solo dalle sue componenti (il lessico) ma anche
DettagliFasi di un Compilatore
Dipartimento di Matematica e Informatica Università di Camerino Un implementazione compilativa di un linguaggio di programmazione viene realizzata tramite un programma che prende il nome di compilatore
DettagliLinguistica Computazionale. 23 novembre 2016
Linguistica Computazionae 23 novembre 2016 TAL: agoritmi di ML Esistono due grandi categorie di agoritmi basati su metodi di ML: agoritmi non supervisionati (unsupervised): non necessitano di un corpus
DettagliCorso di Linguaggi di Programmazione + Laboratorio
Corso di inguaggi di Programmazione + aboratorio Capitolo 1 - Introduzione Si ringrazia il Dott. Marco de Gemmis per la collaborazione nella predisposizione del materiale didattico Apprendimento di un
DettagliIl formato EPUB 3.0. Il documento EPUB. Editoria digitale. Maria A. Alber( Informa(ca per la comunicazione digitale AA 16/17
Il formato EPUB 3 Editoria digitale Maria A. Alber( Informa(ca per la comunicazione digitale AA 16/17 Il documento EPUB Il formato EPUB 3 può essere visto come il collante che lega tuie le tecnologie che
DettagliEsercizio: apprendimento di congiunzioni di letterali
input: insieme di apprendimento istemi di Elaborazione dell Informazione 18 Esercizio: apprendimento di congiunzioni di letterali Algoritmo Find-S /* trova l ipotesi più specifica consistente con l insieme
DettagliTLT Tren)no Language Tes)ng
TLT Tren)no Language Tes)ng - 2018 L. Covi, M. Oliviero, M. Carpita, M. Chicco Trento, 6 aprile 2019 Questa inizia)va è realizzata nell ambito del progeio Azioni a supporto del Piano Tren)no Trilingue
DettagliProblem solving elementare su dati scalari
Problem solving elementare su dati scalari Problemi numerici Problemi di codifica/decodifica Problemi testuali Problemi di verifica e filtro di dati Problemi di ordinamento Sommario 2 2006 Politecnico
DettagliStrumenti informatici per gli studi filologici
Strumenti informatici per gli studi filologici Federico Boschetti federico.boschetti@unitn.it 1/24 IV Parte Dal corpus al treebank Alcune applicazioni ai Persiani di Eschilo 2/24 Il corpus non lemmatizzato
DettagliOBIETTIVI COGNITIVI LATINO CLASSI PRIME. Competenze specifiche Abilità Conoscenze ABILITÀ MORFO-SINTATTICHE
OBIETTIVI COGNITIVI LATINO CLASSI PRIME Fonetica sue strutture morfosintattiche di base. 3. Arricchire il proprio bagaglio lessicale, imparando a usarlo consapevolmente. 4. Comprendere lo stretto rapporto
DettagliCome funziona il Part-of-Speech Tagging
Come funziona il Part-of-Speech Tagging Marco Baroni 14 marzo 2005 1 Introduzione Abbiamo usato taggers pre-addestrati che, dato un corpus in input, producono output taggato. In questo handout, studiamo
DettagliLezione 26/09/2018. Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci
Lezione 26/09/2018 Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci maila.pentucci@unimc.it Organizzazione e informazioni Descrizione del Corso 2018/19 n. 7 CFU (6+1) corrispondenti a n. 46 ore (36+10)
DettagliPIACENZA SMART CITY Edo Ronchi, Presidente Fondazione per lo sviluppo sostenibile Piacenza 20 aprile 2012
PIACENZA SMART CITY 2020 Edo Ronchi, Presidente Fondazione per lo sviluppo sostenibile Piacenza 20 aprile 2012 ObieLvi della ricerca 1. Iden5ficare un modello strategico per un progeco che individui gli
DettagliProgettazione per moduli Percorso di istruzione di 1 livello, 2 periodo didattico, Asse dei linguaggi Modulo 1
Modulo 1 IL TESTO NARRATIVO DURATA PREVISTA : : : Leggere, comprendere e interpretare testi scritti. Padroneggiare gli strumenti espressivi. Produrre testi di vario tipo in relazione ai differenti scopi
Dettagli8. Importanza del signi3icato e dell intenzione
Modelli linguistici 8. Importanza del signi3icato e dell intenzione www.insegnaregramma2ca.it Introduzione Anche il significato è fondamentale, ma non è considerato un «capitolo» della gramma2ca. Invece
DettagliComponente Lessicale. Scopi
Componente Lessicale Scopi Riconoscere gli elementi lessicali Assegnare agli elementi lessicali informazioni sulla loro categoria grammaticale Risolvere l ambiguità grammaticale Vedi lezione sull ambiguità
DettagliIndicazioni per l uso degli esercizi con studenti DSA
Indicazioni per l uso degli esercizi con studenti DSA Volume A - Ortografia, lessico, morfologia Unità 1 Es. 2 p. 36 Es. 1 p. 37 Es. 1 p. 38 Es. 2 p. 38 Es. 4 p. 38 Es. 5 p. 38 Es. 1, 2, 3, 4 p. 41 Es.
DettagliRiconoscitore di forme (tokenizer) Componente Lessicale. Struttura e funzioni del modulo lessicale. Riconoscimento e categorizzazione.
Scopi Componente Lessicale Riconoscere gli elementi lessicali Assegnare agli elementi lessicali informazioni sulla loro categoria grammaticale Risolvere l ambiguità grammaticale Vedi lezione sull ambiguità
DettagliAIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE
AIP Seminario residenziale Psicologia del discorso e analisi dei discorsi L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE Silvia Gattino e Stefano Tartaglia Dipartimento di Psicologia Università
DettagliLinguistica Computazionale. 25 novembre 2016
Linguistica Computazionae 25 novembre 2016 Schemi di annotazione sintattica Labeed bracketing identificazione dea struttura a costituenti sintagmatici (abero sintattico) [S [NP Gianni] [Aux ha] [VP dato
DettagliENTE NAZIONALE SORDI PROGRAMMA DEL CORSO DI LOGOGENIA
2 ENTE NAZIONALE SORDI Sezione Provinciale di Firenze PROGRAMMA DEL CORSO DI LOGOGENIA 1 lezione: Dott.ssa Elisa Franchi Sabato 1 Dicembre 2012 dalle ore 09:30 alle ore 12:30 pausa pranzo: 1 ora e 30 minuti
DettagliReti Neurali in Generale
istemi di Elaborazione dell Informazione 76 Reti Neurali in Generale Le Reti Neurali Artificiali sono studiate sotto molti punti di vista. In particolare, contributi alla ricerca in questo campo provengono
DettagliPer una Pubblica Amministrazione SEMPLICE
Per una Pubblica Amministrazione SEMPLICE Alessandro Lenci CoLing Lab Laboratorio di Linguistica Computazionale http://colinglab.humnet.unipi.it/ Università di Pisa Workshop ELRC in Italia Roma, 15 marzo
DettagliFunzioni nella frase e sostituzioni
Scuola secondaria I grado Scuola secondaria II grado Funzioni nella frase e sostituzioni www.insegnaregramma2ca.it Vantaggi del modello dei gruppi sintattici 1. Mostra le funzioni dei gruppi, nei quali
DettagliRes$tuzione da$ 2018
Res$tuzione da$ 2018 1 I risulta$ delle prove I da% res%tui% dall'invalsi riguardano tre aspe7: l'andamento complessivo dei livelli di apprendimento degli studen% della scuola rispe
DettagliANALISI DELLE POSIZIONI
ANALISI DELLE POSIZIONI L analisi delle posizioni rappresenta un focus strategico per la funzione RU; tutte le attività di GRU poggiano sull analisi delle posizioni in quanto rappresentano uno strumento
DettagliUniversità degli Studi di Roma Tor Vergata Facoltà di Ingegneria Corso di Laurea in Ingegneria Medica. Compressione dati
Università degli Studi di Roma Tor Vergata Facoltà di Ingegneria Corso di Laurea in Ingegneria Medica Compressione dati Compressione dei dati Il processo di compressione consiste nell effettuare codifiche
DettagliUNITA DI APPRENDIMENTO. La frase e brevi testi
Istituto Comprensivo "Fracassetti - Capodarco" Via Visconti d Oleggio, 83 / 63900 Fermo tel: 0734/621273 - fax: 0734/601112 CF: 90055090444 CM:APIC841002 sito web: www.iscfracassetticapodarco.gov.it e-mail:
DettagliLinguistica Computazionale. 22 settembre 2014
Linguistica Computazionale 22 settembre 2014 Obiettivi del corso Introduzione ai principali metodi di linguistica computazionale e di Natural Language Processing (NLP) Docenti Alessandro Lenci (Dip. di
DettagliAnnotazione semantica di eventi calcistici
Annotazione semantica di eventi calcistici Valentino Frasnelli Liceo Linguistico Sophie Scholl - Tirocinio presso l unità di ricerca HLT-NLP Team FBK: Bernardo Magnini, Anne-Lyse Minard e Manuela Speranza
DettagliLogica proposizionale
Definire un linguaggio formale Logica proposizionale Sandro Zucchi 2013-14 Definiamo un linguaggio formale LP (che appartiene a una classe di linguaggi detti linguaggi della logica proposizionale) Per
DettagliGruppo 1. SCHEDA GUIDA UdA 1 Referente Componenti Titolo
Gruppo 1 Lingua e linguaggio Descrivere le differenze tra lingua e linguaggio (naturale o artificiale) ed esaminarne gli elementi (alfabeto, lessico, sintassi e semantica). Individuare analogie e differenze
DettagliLiferay e SKOSware - come SKOSsizzare i propri contenuti. 11 Giugno 2012
Liferay e SKOSware - come SKOSsizzare i propri contenuti 11 Giugno 2012 Tesauri Un tesauro è uno strumento per la condivisione del linguaggio. Vari tipi di organizzazioni collezionano in tesauri il loro
DettagliELEMENTI DEL LINGUAGGIO INFORMATICO. Accademia Belle Ar:
2 ELEMENTI DEL LINGUAGGIO INFORMATICO Accademia Belle Ar: 3 Parte SESTA L Umanista Informa:co, APOGEO Ed. Fabio Brivio 4 Esempio di visualizzazione del browser Lynx, primi anni 90 (per trasmissione tes:)
DettagliPerchè un modello Esteso? MODELLAZIONE ER ESTESA (EER) ì Consente una proge-azione più accurata dello schema di una base di da7
MODELLAZIONE ER ESTESA (EER) 2 Perchè un modello Esteso? Consente una proge-azione più accurata dello schema di una base di da7 Consente una rappresentazione più precisa dei vincoli fra I da7 Consente
DettagliLINGUA ITALIANA. Sapere Nuclei fondanti TESTO. Saper fare. Memorizzare. Comprendere. Produrre CODICE OGGETTO CULTURALE LESSICO.
LINGUA ITALIANA è è Sapere Nuclei fondanti OGGETTO CULTURALE che registra i CAMBIAMENTI. CODICE Utilizzato per la COMUNICAZIONE Ha come unità fondamentale il TESTO Utilizza un LESSICO Saper fare che determinano
DettagliIL LABORATORIO DI ITALIANO L2. apprendere e insegnare la lingua seconda
IL LABORATORIO DI ITALIANO L2 apprendere e insegnare la lingua seconda GLI ALLIEVI Sradicamento Urgenza comunicativa Adattamento Integrazione Nuove fedeltà COSA SAPERE Progetto migratorio della famiglia
DettagliPROGETTI DI SISTEMI INFORMATIVI DIREZIONALI
PROGETTI DI SISTEMI INFORMATIVI DIREZIONALI Punti chiave di un progetto di SID 1. Progettare il database direzionale (scelta dei dati elementari, struttura del db) 2. Scegliere e confezionare le informazioni
DettagliIl codice linguistico
Laboratorio Linguistico Il Testo narrativo Il codice linguistico www.nicolanapolitano.altervista.org App Generation Writers I. C. San Francesco Nicola Napolitano Anguillara Sabazia - RM Le funzioni e la
DettagliLinguaggi e Traduttori: Analisi sintattica
Linguaggi e Traduttori: Analisi sintattica Armando Tacchella Sistemi e Tecnologie per il Ragionamento Automatico (STAR-Lab) Dipartimento di Informatica Sistemistica e Telematica (DIST) Università di Genova
DettagliLinguistica Computazionale
Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento
DettagliLinguistica Computazionale
Linguistica Computazionale Esercitazione: analisi del testo Python : leggere un file di testo Per aprire un file di testo in Python si usa la classe codecs ed il suo metodo open( ): Il programma si aspetta
Dettagli