Linguistica Computazionale
|
|
- Romeo Festa
- 7 anni fa
- Visualizzazioni
Transcript
1 Linguistica Computazionale Grammatiche formali e parsing 11 dicembre 2014
2 Parsing a Stati Finiti Shallow Parsing Chunking ad ogni frase viene assegnata un unica analisi sintattica sottospecificata il testo è segmentato in una sequenza piatta di unità sintattiche non-ricorsive (chunks) le relazioni sintattiche intra-chunk rimangono non risolte (per tipo ed ambito) nessun ricorso a informazione lessicale sintattico-semantica (sottocategorizzazione, restrizioni di selezione) [Il Presidente] [spera] [che] [l Unione] [Europea] [riuscirà] [a conquistare] [un ruolo] [di primo piano] [a livello] [internazionale] [entro pochi anni] 2
3 Parsing a Stati Finiti Shallow parsing Chunks corrispondono a sequenze testuali di parole adiacenti nessun livello di incassamento sono individuati usando solo informazioni morfosintattiche e vincoli sintattici locali (sequenze di tags) compatibili ma non equivalenti con i costituenti sintagmatici Applicazioni Information Extraction, Speech Recognition, NLP robusto, ecc. base di partenza per successivi analisi sintattiche dipendenze intra-chunks 3
4 Chunking e ASF Automa per chunk nominale Agg Agg Det N q 0 q 1 q 2 4
5 Shallow parsing chunking 02 [ [ CC: N_C] [ DET: IL#RD@MS] [ [ POTGOV: PERICOLO#S@MS]] il IL#RD@MS+ pericolo PERICOLARE#V@S1IP PERICOLO#S@MS+ 04 [ [ CC: FV_C] [ [ AUX: ESSERE#V] [ MOD: POTERE#V@S3II] [ PREMODIF: NON#B] [ POTGOV: SOTTOVALUTARE#V@MSPR SOTTOVALUTATO#A@MS]] non NON#B+ poteva POTERE#V@S3II+ essere ESSERE#S@MS ESSERA#S@FP ESSERE#V@F+ sottovalutato SOTTOVALUTARE#V@MSPR+ SOTTOVALUTATO#A@MS+ word id forma lemma pos tratti id tipo accordo ruolo 1 Il il RD MS 1 DET 2 pericolo pericolo S MS 1 POTGOV 3 non non B NULL 2 PREMODIF 4 poteva potere V S3II 2 MOD 5 essere essere V F 2 AUX 6 sottovalutato sottovalutare V MSPR 2 POTGOV 5
6 Full parsing Full Parser ricostruisce l organizzazione sintagmatica completa della frase e le relazioni di dipendenza funzionale tra i costituenti arg [S [NP Il Presidente] subj [VP spera [S che [NP l Unione Europea] i [VP riuscirà subj [PP a [S PRO i [VP conquistare obj_d [NP un ruolo [PP di primo piano] [PP a livello internazionale]] [PP entro pochi anni]]]]]]]] 6
7 Grammatiche formali Le grammatiche formali forniscono un modello computazionale per descrivere la struttura sintattica del linguaggio Grammatica Context-Free (CF) (Phrase-Structure Grammar) insieme di regole (produzioni) che generano tutte e solo le frasi grammaticali di una lingua (grammatiche generative) assegnano a ciascuna frase la struttura sintagmatica appropriata Una grammatica CF è una quadrupla <N, Σ, P, S> tale che: N è l insieme dei simboli non terminali; Σ è l insieme dei simboli terminali; P è un insieme d produzioni, ciascuna della forma A à α 1,, α n, dove A è un simbolo non terminale e α 1,, α n è una sequenza ordinata di simboli terminali o non terminali; S N è il simbolo iniziale (sentence) 7
8 Grammatiche formali Simboli terminali (Σ) le parole del linguaggio generato (descritto) dalla grammatica uomo, giornale, il, un, legge, ecc. Simboli non terminali (N) i simboli usati dalla grammatica per descrivere i costituenti sintagmatici NP, VP, V, N, Det, ecc. Produzioni regole di riscrittura di simboli (p 1 ) S à NP VP (p 4 ) N à giornale uomo (p 2 ) NP à Det N (p 5 ) Det à il un (p 3 ) VP à V NP (p 6 ) V à legge regole di inserzione lessicale 8
9 Grammatiche formali Linguaggio generato da una grammatica G (L G ) l insieme di tutte le stringhe di L generate da G dato un alfabeto Σ, una grammatica G genera una stringa di simboli x Σ* se esiste una derivazione di x in G La stringa αaβ deriva la stringa αγβ (αaβ αγβ), se e solo esiste una produzione nella grammatica A à γ S NP VP Derivazione Data un grammatica G = <N, Σ, P, S>, una derivazione di una frase x Σ* è una sequenza di stringhe x 1,, x n, tc. x 1 = S, x=x n e per ogni x i esiste una produzione tale che x i x i+1 9
10 Grammatiche formali S 1 NP VP 2 Det N VP 5 un N VP 4 un uomo VP 3 un uomo V NP 6 un uomo legge NP 2 un uomo legge Det N 5 un uomo legge il N 4 un uomo legge il giornale L G = {un uomo legge il giornale, un giornale legge un uomo, il giornale legge il giornale, un uomo legge un uomo, il uomo legge un giornale, un giornale legge un giornale, } Per ogni derivazione di una stringa da parte di G esiste un albero sintagmatico (parse tree) che la rappresenta: [S [NP [Det un] [N uomo]] [VP [V legge] [NP [Det il] [N giornale]]]] PARSING Assegnazione ad una frase del suo albero sintagmatico 10
11 Grammatiche e ambiguità Una stringa x generata da una grammatica G è sintatticamente ambigua se e solo esiste più di una derivazione di x in G (p 1 ) S à NP VP (p 6 ) PP à P NP (p 2 ) NP à Det N (p 7 ) N à uomo giornale occhiali (P 3 ) NP à Det N PP (p 8 ) Det à il un gli (p 4 ) VP à V NP (p 9 ) V à legge (p 5 ) VP à V NP PP (p 10 ) P à con S 1 NP VP 2 Det N VP 8 un N VP 7 un uomo VP 4 un uomo V NP 9 un uomo legge NP 3 un uomo legge Det N PP 8 un uomo legge il N PP 7 un uomo legge il giornale PP 6 un uomo legge il giornale P NP 10 un uomo legge il giornale con NP 2 un uomo legge il giornale con Det N 8 un uomo legge il giornale con gli N 7 un uomo legge il giornale con gli occhiali S 1 NP VP 2 Det N VP 8 un N VP 7 un uomo VP 5 un uomo V NP PP 9 un uomo legge NP PP 2 un uomo legge Det N PP 8 un uomo legge il N PP 7 un uomo legge il giornale PP 6 un uomo legge il giornale P NP 10 un uomo legge il giornale con NP 2 un uomo legge il giornale con Det N 8 un uomo legge il giornale con gli N 7 un uomo legge il giornale con gli occhiali 11
12 Grammatiche ed ambiguità [S [NP [Det un] [N uomo]] [VP [V legge] [NP [Det il] [N giornale] [PP [P con] [NP [Det gli] [N occhiali]]]]]] [S [NP [Det un] [N uomo]] [VP [V legge] [NP [Det il] [N giornale]] [PP [P con] [NP [Det gli] [N occhiali]]]]] 12
13 Ricorsività e ASF Organizzazione ricorsiva dei costituenti [S [NP [ S [NP ]]] [VP [NP [PP [NP [PP NP]]]]]] Un esempio di grammatica CF ricorsiva NP à Det N PP PP à P NP left-recursive right-recursive 13
14 Automi e grammatiche formali Automi e grammatiche servono entrambi per definire linguaggi (formali) Le grammatiche CF appartengono ad una famiglia di grammatiche formali che differiscono per il tipo di regole Grammatiche lineari (regolari) una grammatica è regolare se e solo se ogni regola è della forma A à xb o A à x, dove A e B sono simboli non terminali e x è un simbolo terminale ogni regola ha a destra al più un simbolo non terminale TEOREMA Per ogni ASF esiste sempre una grammatica regolare che genera lo stesso linguaggio (e viceversa) 14
15 Automi, grammatiche e linguaggi La gerarchia di Chomsky Linguaggi Tipo 0 Grammatiche non ristrette Macchine di Turing Linguaggi Tipo 1 Grammatiche Context Sensitive Linear Bounded Automata Linguaggi Tipo 2 Grammatiche CF Automi a Pila English is not a finite state language Chomsky (1957) Linguaggi Tipo 3 Grammatiche regolari Automi a Stati Finiti 15
16 Parsing e ambiguità Ambiguità sintattica un espressione linguistica può avere più di un analisi sintattica ambiguità soggetto oggetto Ha chiamato Gianni. [[ha chiamato] [ sogg Gianni]] [[ha chiamato] [ ogg Gianni]] PP attachment Ho visto l uomo nel parco col telescopio [ V mangia] [NP il panino] [PP col prosciutto] [ V mangia] [NP il panino] [PP con le mani] V NP PP à a. [ V NP PP] b. [ V [NP PP]] ADJ-attachment Il dottore ha visitato il paziente nudo. 16
17 Lessico e ambiguità Informazione lessicale Permette di ridurre il numero di ambiguità nel parsing Rappresenta l ingrediente necessario per estrarre dal testo il contenuto informativo Lessici computazionali codificano informazione lessicale sintattica e semantica in forma accessibile a programmi di NLP grammatica S à VP NP sogg Ha telefonato Gianni S à VP OK! S S VP à V VP VP à V NP ogg NP sogg VP NO! lessico telefonare V intrans V Gianni V NP ogg ha telefonato ha telefonato Gianni 17
18 Selezione sintattica lessicale Restrizioni di sottocategorizzazione contesto sintattico selezionato da un termine lessicale tipi di complementi (NP, PP, ecc.) selezionati numero di complementi (0,1, 2, ecc.) selezionati obbligatorietà dei complementi caso grammaticale NP subj mangiare NP obj NP subj partire PP_da risposta PP_a u Parzialmente indipendenti dalle proprietà semantiche di una parola: u to donate vs. to give in inglese John donated a book to Mary John gave a book to Mary * John donated Mary a book John gave Mary a book u mangiare vs. divorare in italiano Gianni ha mangiato * Gianni ha divorato 18
19 Lessici computazionali sintattici L informazione sintattico-lessicale è rappresentata in frames di sottocategorizzazione Frames di sottocategorizzazione: numero degli argomenti selezionati dalla testa lessicale categoria sintattica dei costituenti che possono realizzare gli argomenti (PP, NP, ecc.) tratti lessicali degli argomenti (es. tipo di preposizione in un PP argomentale) funzione grammaticale degli argomenti (Subj, Obj, ecc.) opzionalità, controllo, ausiliare selezionato, ecc. & telefonare # $! $ & & CAT : NP ## SUBCAT :! $ $ SLOT _1: $!!! $ % % FUN : subj" "! $ % AUX : avere!" & partire # $! $ & & CAT : NP # #! $ $ SLOT _1: $!!! $ $ % FUN : subj"!! $ SUBCAT : $,!! $ $ & CAT : PP #) * '!! $ $ SLOT _ 2 : $! * '!! $ $ $ FUN : obl! * '!! $ % + $ % PREP : per! "("! $ % AUX : essere!" 19
20 Lessici computazionali sintattici ComLeX ( ) lessico computazionale sintattico per l inglese ~ entrate (nomi, verbi e aggettivi) PAROLE-CLIPS ( ) (verb :orth "build" :subc ((np) (np-for-np) (part-np :adval ("up"))) :TAGS ((TAG :BYTE-NUMBER :SOURCE "brown" :LABEL (NP)) (TAG :BYTE-NUMBER :SOURCE "brown" :LABEL (NP)) (TAG :BYTE-NUMBER :SOURCE "brown" :LABEL (NP))) (noun :orth "assertion" :subc ((noun-that-s) (noun-be-that-s))) lessico di sottocategorizzazione per l italiano ~ entrate (nomi, verbi, aggettivi, avverbi) abbinare; V;avere; 0; np;np;pp.con; abbassare; V;essere; 1; np;inf.a; CON_S; abituare; V;avere; 0; np;np;inf.a;0; CON_O assegnazione; S ;pp.di;pp.a;pp.da_parte_di;0;0 20
21 Full parsing e lessico arg La disponibilità di informazione lessicale è la condizione necessaria per ricostruire l organizzazione sintagmatica completa della frase e le relazioni di dipendenza funzionale tra i costituenti [S [NP Il Presidente] subj [VP spera [S che [NP l Unione Europea] i [VP riuscirà subj [PP a [S PRO i obj_d [VP conquistare [NP un ruolo [PP di primo piano] [PP a livello internazionale]] [PP entro pochi anni]]]]]]]] 21
22 Dependency Parsing come problema di classificazione Esistono diversi metodi per trasformare un compito di analisi sintattica in un compito di classificazione Yamada e Matsumoto (2003), Shift/Reduce parser (o transition-based parser) parser Il compito di analizzare sintatticamente una frase diventa il compito di predire l azione che il parser deve fare per costruire l albero sintattico della frase Ad ogni passo dell analisi il parser usa un classificatore addestrato su una TreeBank (o training corpus) allo scopo di predire quale azione deve compiere dato l insieme delle feature (locali+ contestuali) estratte in quel determinato momento 22
23 Dependency Parsing come problema di classificazione Il parser costruisce l albero a dipendenza analizzando la frase da sinistra verso destra e compiendo tre azioni: Shift, Right e Left: Shift: non c è nessuna relazione tra le due parole target analizzate, l analisi si muove verso destra: Io vidi una donna con gli occhiali --> io vidi una donna con gli occhiali Right: esiste una relazione tra le due parole, il nodo sinistro è considerato dipendente del nodo testa a destra Io vidi una donna con gli occhiali --> io vidi donna con gli occhiali 23 una
24 Dependency Parsing come problema di classificazione Left: esiste una relazione tra le due parole, il nodo sinistro è considerato testa del nodo dipendente a desta io vidi donna con gli occhiali -- > io vidi con gli occhiali una donna una L algoritmo prosegue fino a quando non è stato completato l albero, ovvero sono stati creati tutti i link sintattici 24
25 Dependency parsing come problema di classificazione A questo punto abbiamo ottenuto un albero sintattico non marcato (gli archi non sono marcati con le relazioni di dipendenza: soggetto, oggetto, complemento di tempo, etc). Come possiamo fare per ottenere un albero marcato? Esistono almeno due modi: attraverso un secondo passo di analisi nel quale si classifica ogni arco con la classe sintattica più probabile (problema di classificazione) semplicemente aumentando il numero delle azioni del parser, non più solo Shift, Right e Left, ma: Shift, Right_soggetto, Right_oggetto, Right_comp_di_tempo, ecc. Left_soggetto, Left_oggetto, Left_comp_di_tempo,.. 25
26 Dependency Parsing come Problema di Classificazione Quindi il compito di analisi sintattica di una frase diventa un compito di classificazione che può essere diviso in tre fasi: estrazione delle feature (locali e contestuali) rispetto alle due parole analizzate stima dell azione da eseguire attraverso l algoritmo di apprendimento supervisionato (dato un modello di feature pesate) esecuzione dell azione e creazione dell albero 26
Le grammatiche formali
Le grammatiche formali Il carattere generativo dei sistemi linguisticii i Consideriamo i la seguente frase: Un gatto rincorre il topo Non facciamo difficoltà a riconoscere che si tratta di una frase sintatticamente
DettagliCorso di Linguaggi e Traduttori 1 AA GRAMMATICHE
Corso di Linguaggi e Traduttori 1 AA 2004-05 GRAMMATICHE 1 Definizione di Grammatica Formalmente definiamo un grammatica G mediante una quadrupla V, V, P S ( ) N T, dove: V N e l insieme dei simboli non
DettagliDefinizione di Grammatica
Corso di Linguaggi e Traduttori 1 AA 2004-05 GRAMMATICHE 1 Definizione di Grammatica Formalmente definiamo un grammatica G mediante una quadrupla ( VN, VT, P, S ) dove: V N e l insieme dei simboli non
DettagliGrammatiche context-free
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2013-2014 Linguaggi Formali e Compilatori Grammatiche context-free Giacomo PISCITELLI Politecnico di Bari G. Piscitelli pag. 1 di 28 Grammatiche
DettagliUnità Didattica 2 I Linguaggi di Programmazione
Unità Didattica 2 I Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche
DettagliAnalizzatore lessicale o scanner. Lo scanner rappresenta un'interfaccia fra il programma sorgente e l'analizzatore sintattico o parser.
Analizzatore lessicale o scanner Dispensa del corso di Linguaggi e Traduttori A.A. 2005-2006 Lo scanner rappresenta un'interfaccia fra il programma sorgente e l'analizzatore sintattico o parser. Lo scanner,
DettagliGrammatiche Parse trees Lezione del 17/10/2012
Fondamenti di Programmazione A.A. 2012-2013 Grammatiche Parse trees Lezione del 17/10/2012 AUTILI MARCO http://www.di.univaq.it/marco.autili/ Riassunto lezione precedente Sintassi vs Semantica Stringhe,
DettagliL elaborazione del linguaggio naturale
L elaborazione del linguaggio naturale fondamenti teorici dell intelligenza artificiale: la capacità di elaborare simboli è alla base del comportamento intelligente. L esempio di elaborazione simbolica
DettagliGrammatiche. Grammatiche libere da contesto Grammatiche regolari Potenza delle grammatiche libere e regolari Struttura di frase: Alberi di derivazione
Grammatiche Grammatiche libere da contesto Grammatiche regolari Potenza delle grammatiche libere e regolari Struttura di frase: Alberi di derivazione Esempio dei numeri interi Si consideri il linguaggio
DettagliLinguaggi di Programmazione
Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche del Linguaggio
DettagliLinguistica Generale
Linguistica Generale Docente: Paola Monachesi Aprile-Maggio 2003 Contents 1 I sintagmi e la struttura a costituenti 2 2 Alberi sintattici 3 3 Una minigrammatica dell inglese 3 4 Un lessico dell inglese
DettagliAspetti semantici e sintattici del verbo. Alcune proprietà semantiche e sintattiche dei verbi sono codificate nel nostro lessico mentale.
Aspetti semantici e sintattici del verbo Alcune proprietà semantiche e sintattiche dei verbi sono codificate nel nostro lessico mentale. Aspetti teorici La struttura argomentale La struttura tematica La
DettagliStruttura sintagmatica. Strutture. Alberi, o indicatori sintagmatici. Categorie grammaticali
Struttura sintagmatica Strutture Le parole si organizzano in sintagmi (gruppi, costituenti) gerarchizzati gli uni rispetto agli altri (1) [la signora ] [ legge [il giornale ]] (2) la signora legge il giornale
DettagliLINGUAGGI DI ALTO LIVELLO. Si basano su una macchina virtuale le cui mosse non sono quelle della macchina hardware
LINGUAGGI DI ALTO LIVELLO Si basano su una macchina virtuale le cui mosse non sono quelle della macchina hardware 1 LINGUAGGI DI ALTO LIVELLO Barriera di astrazione Fortran Cobol Basic Pascal Python C
DettagliElaborazione del linguaggio naturale. Part seven. Our Aim. Fabio Massimo Zanzotto. Modular and Robust parsing
Elaborazione del linguaggio naturale Fabio Massimo Zanzotto Part seven Modular and Robust parsing Our Aim Lines of development Grammatical Representation Power: CFG (context free grammars) DCG Feature
DettagliPumping lemma per i linguaggi Context-free
Pumping lemma per i linguaggi Context-free Sia L un linguaggio context-free. E possibile determinare una costante k, dipendente da L, tale che qualunque stringa z! L con z > k si può esprimere come z=
DettagliPROLOG E ANALISI SINTATTICA DEI LINGUAGGI Quando si vuole definire in modo preciso la sintassi di un linguaggio si ricorre a una grammatica G=(V n,v t
PROLOG E ANALISI SINTATTICA DEI LINGUAGGI Quando si vuole definire in modo preciso la sintassi di un linguaggio si ricorre a una grammatica Una grammatica permette di stabilire se una sequenza di simboli
DettagliCome funziona il linguaggio COME FUNZIONA IL LINGUAGGIO
Come funziona il linguaggio COME FUZIOA IL LIGUAGGIO SITASSI Il cervello di ogni persona contiene un dizionario di parole e dei concetti che esse rappresentano (dizionario mentale) e un insieme di regole
DettagliISTRUZIONI PROGETTO FASE 4
ISTRUZIONI PROGETTO FASE 4 Data consegna: tre giorni (72 ore) prima della verbalizzazione Questo documento contiene le istruzione per l esecuzione della fase 4 del progetto. Per informazioni o domande
DettagliCorso di Programmazione Linguaggi di Programmazione
Corso di Programmazione Linguaggi di Programmazione Dott. Stefano Ferilli ferilli@di.uniba.it Università degli Studi di Bari Dipartimento di Informatica Linguaggio Insieme di sequenze di simboli appartenenti
Dettagli1 Modulo operativo: Le abilità linguistiche: ascoltare. 2 Modulo operativo: Le abilità linguistiche: parlare
1 Modulo operativo: Le abilità linguistiche: ascoltare 2 Modulo operativo: Le abilità linguistiche: parlare 3 Modulo operativo: Le abilità linguistiche: leggere 4 Modulo operativo: Le abilità linguistiche:
DettagliLinguaggi Regolari e Linguaggi Liberi
Linguaggi Regolari e Linguaggi Liberi Linguaggi regolari Potere espressivo degli automi Costruzione di una grammatica equivalente a un automa Grammatiche regolari Potere espressivo delle grammatiche 1
DettagliParsing Sintattico con Context Free Grammars
Seminari del Corso di Linguistica Computazionale Siena 19 maggio 2003 Parsing Sintattico con Context Free Grammars Michelangelo Falco - falco@f2o.org Sommario Sintassi e Context Free Grammars (CFG) Problemi
DettagliVerificare se una grammatica e LL(1) e costruirne la tabella di parsing. Verificare se una grammatica e LR(0) e costruirne la tabele ACTION e GOTO
ANALISI SINTATTICA TIPO 1: Data un linguaggio scrivere una grammatica che lo generi TIPO 2: Verificare se una grammatica non contestuale è ambigua TiPO 3: Verificare se una grammatica e LL(1) e costruirne
DettagliINTRODUZIONE AL TESTO FILOSOFICO
INTRODUZIONE AL TESTO FILOSOFICO MEDIANTE FORME DI ANNOTAZIONE SEMANTICA Ciclo seminariale 4 febbraio 2011 4 marzo 2011 Fra ontologie e mappe: un introduzione Francesco Bianchini DI COSA PARLEREMO Mappe
DettagliParser Bottom UP. Giuseppe Morelli
Parser Bottom UP Giuseppe Morelli Parser Bottom UP Un parser Bottom Up lavora costruendo il corrispondente albero di parsing per una data stringa di input partendo dalle foglie (bottom) e risalendo via
DettagliSviluppo di Risorse Linguistiche per l Ambiente di Scrittura Assistita (ASA)
Università degli Studi di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea Triennale in Informatica Informatica e Linguistica Linguistica Sviluppo di Risorse Linguistiche per l Ambiente
DettagliLe grammatiche formali
Le grammatiche formali Le grammatiche formali costituiscono la base di numerose teorie ed applicazioni. Sul piano teorico costituiscono la base della teoria della grammatica generativa di Chomsky, come
DettagliQuiz sui linguaggi CF
Fondamenti dell Informatica 1 semestre Quiz sui linguaggi CF Prof. Giorgio Gambosi a.a. 2014-2015 Problema 1: Si consideri la seguente grammatica context free G, dove S, NP, V P, P P, A sono i simboli
DettagliFasi di un Compilatore
Dipartimento di Matematica e Informatica Università di Camerino Un implementazione compilativa di un linguaggio di programmazione viene realizzata tramite un programma che prende il nome di compilatore
DettagliCorso di Fondamenti di Informatica Linguaggi di Programmazione
di Cassino e del Lazio Meridionale Corso di Informatica Linguaggi di Programmazione Anno Accademico 2014/2015 Francesco Tortorella Linguaggi di programmazione Un calcolatore basato sul modello di von Neumann
DettagliConnettivi del linguaggio e della logica
Connettivi del linguaggio e della logica Fino a che punto il significato di,, e corrisponde al significato delle espressioni del linguaggio naturale e o, se... allora... e non? e e Congiunzioni e connettivi
DettagliIntroduzione al Corso
Introduzione al Corso 1 Argomenti trattati nella lezione: INTRODUZIONE AL CORSO CONCETTI GENERALI GERARCHIA DI CHOMSKY ESPRESSIONI REGOLARI AUTOMI A STATI FINITI ESEMPI DI APPLICAZIONI LINGUISTICHE Introduzione
DettagliUn po di storia sui linguaggi
LINGUAGGI DI ALTO LIVELLO Si basano su una macchina virtuale le cui mosse non sono quelle della macchina hardware 1 Un po di storia sui linguaggi 1957 John Backus e colleghi della IBM rilasciano la prima
DettagliDispensa 3. 1.1 YACC: generalità
Dispensa 3 1.1 YACC: generalità Il tool Yacc (acronimo per Yet Another Compiler Compiler) è uno strumento software che a partire da una specifica grammaticale context free di un linguaggio scritta in un
DettagliNatural Language Processing. Parte 3: Sintassi e grammatica chunking e costituenti
Natural Language Processing Parte 3: Sintassi e grammatica chunking e costituenti 2 Sintassi La sintassi fornisce le regole con cui le parole sono organizzate in una frase a livello dei seguenti elementi
DettagliSintassi (Linguistica e Glottologia 2012) Jacopo Garzonio
Sintassi (Linguistica e Glottologia 2012) Jacopo Garzonio (j.garzonio@gmail.com) Analisi sintattica La sintassi è il livello di analisi delle frasi. Come per 'parola', adottiamo un concetto ad hoc di 'frase',
DettagliLinguaggi Regolari e Linguaggi Liberi
Linguaggi Regolari e Linguaggi Liberi Potenza espressiva degli automi Potenza espressiva delle grammatiche 9/11/2004 Programmazione - Luca Tesei 1 Linguaggi Regolari Tutti i linguaggi che possono essere
DettagliGRAMMATICA FORMALE. Albero sintattico
GRAMMATICA FORMALE Una quadrupla VT,VN,P,S dove: VT è un insieme finito di simboli terminali VN è un insieme finito di simboli non terminali Pè uninsieme finito di produzioni, ossiadi regole di riscrittura
DettagliCosa è l Informatica?
Cosa è l Informatica? Scienza degli elaboratori elettronici (Computer Science) Scienza dell informazione Scienza della rappresentazione, memorizzazione, elaborazione e trasmissione dell informazione Elaboratore
DettagliEspressioni regolari
spressioni Regolari Un FA (NFA o DFA) e una macchina a stati finiti che riconosce linguaggi regolari. Una espressione regolare e un modo dichiarativo (o algebrico) per descrivere un linguaggio regolare.
DettagliAnalisi sintattica (parser)
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2013-2014 Linguaggi Formali e Compilatori Analisi sintattica (parser) Giacomo PISCITELLI Analisi sintattica: il parser Problema di base dell analisi
DettagliCap. 4 Berruto / Cerruti LA SINTASSI. Linguistica generale ( ) - Chiari Pagina 1
Cap. 4 Berruto / Cerruti LA SINTASSI Linguistica generale (2012-13) - Chiari Pagina 1 Sintassi l l È il livello di analisi che si occupa della struttura della frasi Il suo oggetto di studio è come si combinano
Dettagliacuradi Luca Cabibbo e Walter Didimo Esercizi di Informatica teorica - Luca Cabibbo e Walter Didimo 1
acuradi Luca Cabibbo e Walter Didimo Esercizi di Informatica teorica - Luca Cabibbo e Walter Didimo 1 richiami teorici sulle grammatiche di Chomsky esercizivari esercizi su grammatiche ed espressioni regolari
DettagliSINTASSI E L E M E N T I I N T R O D U T T I V I. Francesca Forza - Nozioni Generali di Sintassi 1
SINTASSI 1 E L E M E N T I I N T R O D U T T I V I LINGUISTICA 2 La linguistica è costituita da più discipline che hanno oggetti di studio diversi: 1. FONETICA (che studia i foni) 2. FONOLOGIA (che studia
DettagliLinguistica Generale
Linguistica Generale Docente: Paola Monachesi Aprile-Maggio 2003 Contents 1 Ordine delle parole in italiano 2 2 Sintagmi e ordine dei costituenti 3 3 I test di costituenza 3 4 Grammatica dell italiano
DettagliContext Free Grammar e DCG
Intelligenza Artificiale A.A. 2004-2005 28 Giugno 2005 Context Free Grammar e DCG Marco Pennacchiotti pennacchiotti@info.uniroma2.it Tel. 0672597334 Ing.dell Informazione, stanza 1035 (primo piano) Sommario
DettagliLinguaggi e Traduttori: Analisi sintattica
Linguaggi e Traduttori: Analisi sintattica Armando Tacchella Sistemi e Tecnologie per il Ragionamento Automatico (STAR-Lab) Dipartimento di Informatica Sistemistica e Telematica (DIST) Università di Genova
DettagliAlgoritmi e Principi dell'informatica Seconda Prova in Itinere - 14 Febbraio 2014
Algoritmi e Principi dell'informatica Seconda Prova in Itinere - 14 Febbraio 2014 Nome..Cognome.Matr. Laureando Avvisi importanti Il tempo a disposizione è di 1 ora e 30 minuti. Se non verranno risolti
DettagliDispense del corso di Linguaggi di programmazione e laboratorio Linguaggi formali(versione non definitiva con diversi refusi) Francesco Sisini
Dispense del corso di Linguaggi di programmazione e laboratorio Linguaggi formali(versione non definitiva con diversi refusi) Francesco Sisini 04 Giugno 2014 Indice 0.1 Automi.................................
DettagliEspressioni Regolari
Espressioni Regolari Le espressioni regolari sono costituite dalle stringhe sull alfabeto Σ = Σ {+,,*,(,),φ} ottenute secondo le seguenti regole: 1. φ e ciascun membro di Σ sono Epressioni Regolari 2.
DettagliLez. 5 La Programmazione. Prof. Salvatore CUOMO
Lez. 5 La Programmazione Prof. Salvatore CUOMO 1 2 Programma di utilità: Bootstrap All accensione dell elaboratore (Bootsrap), parte l esecuzione del BIOS (Basic Input Output System), un programma residente
DettagliLinguaggi formali e compilatori
POLITECNICO DI MILANO Linguaggi formali e compilatori Appunti Stefano Invernizzi Anno accademico 2010-2011 Corso del prof. Angelo Morzenti Sommario Introduzione ai linguaggi... 5 Terminologia di base...
DettagliParole note, nuovi significati: linguaggio, determinismo e infinito
Parole note, nuovi significati: linguaggio, determinismo e infinito Angelo Montanari Dipartimento di Matematica e Informatica Università degli Studi di Udine Ciclo di seminari su un Vocabolario Filosofico
DettagliCURRICOLO DI ITALIANO CLASSE PRIMA
CURRICOLO DI ITALIANO CLASSE PRIMA Conoscere l ordine alfabetico; Riconoscere le vocali dal punto di vista grafico e fonico; Riconoscere e isolare le vocali nelle parole che le contengono; Riconoscere
DettagliTraduzione guidata dalla sintassi
Traduzione guidata dalla sintassi Attributi e definizioni guidate dalla sintassi Dipartimento di Matematica e Informatica mariarita.diberardini@unicam.it Analisi Semantica Analisi sintattica - output:
Dettagli(1) Collegarsi all indirizzo (più un codice numerico comunicato durante l esercitazione)
PARSING CON PHP Costruzione di grammatiche (1) Collegarsi all indirizzo http://www.ciscl.unisi.it/lab (più un codice numerico comunicato durante l esercitazione) (2) aprire la stra per l editing delle
DettagliLinguistica Computazionale. 22 settembre 2014
Linguistica Computazionale 22 settembre 2014 Obiettivi del corso Introduzione ai principali metodi di linguistica computazionale e di Natural Language Processing (NLP) Docenti Alessandro Lenci (Dip. di
DettagliDispensa 1. Da un punto di vista logico l architettura di un compilatore si può suddividere in due parti: Analisi e Sintesi.
Dispensa 1 1. Introduzione ai compilatori Compilatore Un compilatore è un programma che legge un programma scritto in un linguaggio (sorgente) e lo traduce in un programma equivalente in un altro linguaggio
DettagliAnalisi sintattica efficiente
Il problema Analisi sintattica efficiente Giacomo Baldi Elaborazione del Linguaggio Naturale Data una frase già segmentata in tokens si vuole costruire in modo efficiente la struttura della frase secondo
DettagliIntro. Traduzione guidata dalla sintassi. Attributi. Due notazioni a diversi livelli. Due notazioni a diversi livelli. Il flusso concettuale
Intro Traduzione guidata dalla sintassi Attributi e Definizioni guidate dalla sintassi In questa ultima parte del corso vediamo, in breve, una tecnica che permette di effettuare analisi semantiche e traduzione
DettagliMa il programma in Fig. 8.2 del libro? Stampa hello, world, dato un input n se e solo se l equazione
Problemi che i calcolatori non possono risolvere E importante sapere se un programma e corretto, cioe fa uello che ci aspettiamo. E facile vedere che il programma Ma il programma in Fig. 8.2 del libro?
DettagliParsing Robusto Approcci Statistici e Simbolici per il riconoscimento sintattico su larga scala
Parsing Robusto Approcci Statistici e Simbolici per il riconoscimento sintattico su larga scala R. Basili, F. M. Zanzotto Dipartimento di Informatica, Sistemi e Produzione Universita' di Roma Tor Vergata
DettagliUniversità degli studi Roma Tre. linguaggio Java. A cura di A. Orlandini. Linguaggi: Sintassi e Semantica - Il. Il linguaggio Java
Università degli studi Roma Tre Linguaggi: Sintassi e Semantica Il A cura di A. Orlandini 1 Obiettivi Distinguere la sintassi dalla semantica di un linguaggio Conoscere le convenzioni del meta-linguaggio
DettagliAnalizzatore lessicale o scanner
Analizzatore lessicale o scanner Lo scanner rappresenta un'interfaccia fra il programma sorgente e l'analizzatore sintattico o parser. Lo scanner, attraverso un esame carattere per carattere dell'ingresso,
DettagliL intelligenza artificiale
L intelligenza artificiale Le macchine possono pensare? Le macchine sono intelligenti? AI (IA) La storia Il termine Intelligenza Artificiale (IA)) venne introdotto per la prima volta nel 1956 da John McCarthy,,
DettagliPROGRAMMA DELL INSEGNAMENTO. Prof. Emanuele Banfi / Prof. Ignazio Mauro Mirto. Modulo 1 Elementi di Fonetica e Fonologia
PROGRAMMA DELL INSEGNAMENTO Docenti Prof. Emanuele Banfi / Prof. Ignazio Mauro Mirto Insegnamento LINGUISTICA GENERALE Modulo 1 Elementi di Fonetica e Fonologia 1.1. Alfabeti e corrispondenza biunivoca;
DettagliForma Normale di Chomsky
2. Eliminazione delle produzioni unitarie Forma Normale di Chomsky Una produzione si dice unitaria se è della forma A! B. Le produzioni unitarie in pratica consistono in una ridenominazione di variabili,
DettagliAlberi e alberi binari I Un albero è un caso particolare di grafo
Alberi e alberi binari Un albero è un caso particolare di grafo È costituito da un insieme di nodi collegati tra di loro mediante archi Gli archi sono orientati (ogni arco esce da un nodo origine ed entra
DettagliLinguaggi formali e compilazione
Linguaggi formali e compilazione Corso di Laurea in Informatica A.A. 2015/2016 Linguaggi formali e compilazione sul corso Sito web: http://algogroup.unimore.it/people/mauro/dida/2015-2016 / Ricevimento:
DettagliLinguaggi di Programmazione Corso C. Parte n.3 Linguaggi Liberi da Contesto e Linguaggi Contestuali. Nicola Fanizzi
Linguaggi di Programmazione Corso C Parte n.3 Linguaggi Liberi da Contesto e Linguaggi Contestuali Nicola Fanizzi (fanizzi@di.uniba.it) Dipartimento di Informatica Università degli Studi di Bari Grammatiche
DettagliCorso di Matematica per la Chimica. Dott.ssa Maria Carmela De Bonis a.a
Dott.ssa Maria Carmela De Bonis a.a. 2013-14 Programmi Un elaboratore riceve dei dati in ingresso, li elabora secondo una sequenza predefinita di operazioni e infine restituisce il risultato sotto forma
DettagliLinguaggi di programmazione - Principi e paradigmi 2/ed Maurizio Gabbrielli, Simone Martini Copyright The McGraw-Hill Companies srl
Approfondimento 2.1 Non è questo il testo dove trattare esaurientemente queste tecniche semantiche. Ci accontenteremo di dare un semplice esempio delle tecniche basate sui sistemi di transizione per dare
Dettagli014 5 Pragmatica Lingue per scopi speciali. [014 8] Abbreviazioni e simboli Filosofia e teoria
T4 T4 014 301 Filosofia e teoria 014 301 8 Scuole, teorie, metodologie 014 301 82 Linguistica formale Notazione 01 dalla Tavola 1 come di seguito modificata Da non usare per scuole e teorie semantiche;
DettagliForme Normali. Forma normale di Chomsky. E caratterizzata da regole di due tipi. A! BC dove A, B, C $ V N A! a con a $ V T. Forma normale di Greibach
Forme Normali A partire da una grammatica Context-free G è sempre possibile costruire una grammatica equivalente G ovvero L(G) = L(G ) che abbiano le produzioni in forme particolari, dette forme normali.
DettagliLinguistica Computazionale
Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento
Dettagli! " " # $ " " # (& ) Nell analisi del linguaggio si distingue, classicamente, fra:
! " " # $ " " # 1!! " # $%! &' % (&) *+ % & 2 ' IUT IN LINGUAGGIO NATURALE I like vegetables Interpretazione semantica e formalizzazione coerente con l architettura del sistema Es.: Like (U, egetables)
DettagliANALISI DELLE PAROLE COMPLESSE Q U E S T I O N I D I M E T O D O P A R T E 1. Francesca Forza - Linguistica Generale 2
ANALISI DELLE PAROLE COMPLESSE 1 Q U E S T I O N I D I M E T O D O P A R T E 1 Perché? Parole complesse: struttura interna. rappresentare tale struttura in modi espliciti e non ambigui. La struttura che
DettagliAppuntiBicoccaAppuntiBicoccaAppu ntibicoccaappuntibicoccaappuntibic occaappuntibicoccaappuntibicoccaa ppuntibicoccaappuntibicoccaappunt
AppuntiBicoccaAppuntiBicoccaAppu ntibicoccaappuntibicoccaappuntibic occaappuntibicoccaappuntibicoccaa ppuntibicoccaappuntibicoccaappunt Struttura delle parole ibicoccaappuntibicoccaappuntibicoc Riassunto
DettagliCorso di Linguaggi di Programmazione + Laboratorio Docente: Marco de Gemmis
Corso di Linguaggi di Programmazione + Laboratorio Docente: Marco de Gemmis Capitolo 2 Grammatiche e Linguaggi Si ringraziano il Prof. Giovanni Semeraro e il Dott. Pasquale Lops per la concessione del
DettagliLe basi del linguaggio Java
Corso di Laurea Ingegneria Civile Fondamenti di Informatica Dispensa 10 Le basi del linguaggio Java Aprile 2010 Le basi del linguaggio Java 1 Prerequisiti Nozioni generali sulla sintassi e semantica del
DettagliAnalisi sintattica. Syntax Analysis. albero. sintattico. parser. scanner. Errori sintattici
Analisi sintattica Syntax Analysis albero programma scanner tokens parser sintattico rrori sintattici Un parser deve riconoscere la struttura di una stringa di ingresso, la cui struttura è fornita in termini
DettagliQUADRO DI RIFERIMENTO DI ITALIANO PROVE INVALSI 2009
QUADRO DI RIFERIMENTO DI ITALIANO PROVE INVALSI 2009 RIFERIMENTI NORMATIVI INDICAZIONI NAZIONALI 2003 (OSA) L. n 53/2003 e D. Lgs 59/2004 INDICAZIONI NAZIONALI PER IL CURRICULO 2007 QUADRO DI RIFERIMENTO
Dettaglicontrollo stringa a a b a b b c c b a b x y z pila di memoria
Gli automi a pila Dagli automi finiti iti agli automi a pila Possiamo ottenere un automa a pila a partire da un automa finito (così come l abbiamo definito in precedenza), attraverso l introduzione di
DettagliEducazione linguistica. SILSIS Scienze Naturali e FIM a.a
Educazione linguistica SILSIS Scienze Naturali e FIM a.a. 2007-08 Linguaggio scientifico Il tema del linguaggio scientifico offre ampia materia di lavoro non solo al linguista, ma anche allo studioso di
DettagliAnalisi lessicale (scanner)
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2013-2014 Linguaggi Formali e Compilatori Analisi lessicale (scanner) Giacomo PISCITELLI Distinzione terminologica stringa lessicale o lessema
DettagliInformatica Teorica. linguaggi non contestuali
Informatica Teorica linguaggi non contestuali di tipo 2 context free (CF) 1 linguaggi non contestuali molte frasi in linguaggio naturale hanno una struttura sintattica non contestuale esempio: soggetto
DettagliProposte di approfondimenti
Linguaggi formali Proposte di approfondimenti 1. Forme normali di Greibach, trasformazione di una grammatica in forma normale di Greibach Automi a stati finiti 2. Automi di Büchi: particolari automi a
DettagliLogica proposizionale
Logica proposizionale Proposizione: frase compiuta che è sempre o vera o falsa. Connettivi Posti in ordine di precedenza: not, and, or, implica, doppia implicazione Sintassi Le proposizioni sono costituite
Dettagliinformatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia ottava lezione: la dinamica del testo vito
DettagliLinguistica computazionale: come accedere allʼinformazione codificata nel linguaggio naturale
Linguistica computazionale: come accedere allʼinformazione codificata nel linguaggio naturale Cristina Bosco 2013 Informatica applicata alla comunicazione multimediale Alcune domande - Che cosa è il NLP?
DettagliLa piattaforma T2K: dal testo alla conoscenza
La piattaforma T2K: dal testo alla conoscenza Felice Dell Orletta ItaliaNLP Lab www.italianlp.it Istituto di Linguistica Computazionale «A. Zampolli» 16 ottobre 2014 Italian Natural Language Processing
DettagliLinguaggi, grammatiche, espressioni regolari
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2013-2014 Linguaggi Formali e Compilatori Linguaggi, grammatiche, espressioni regolari Giacomo PISCITELLI Modello formale di un linguaggio Un linguaggio
DettagliLezione 1. Problemi Algoritmi Programmi
Lezione 1 Problemi Algoritmi Programmi Programmazione I Paolo Valente - 2016/2017 Il problema... della tigella emiliana Avete invitato a cena degli amici stranieri e volete fare provare loro le tigelle
DettagliIntroduzione. TALN Corpus-based computational linguistics. Rapporto tra forme, classificazioni e lemmi. Liste e classi di frequenza del lessico
TALN Stu Statistici TALN Corpus-based computational linguistics Seminario del corso Trattamento Automatico del Linguaggio Naturale (a. a. 01 02) 2 Introduzione Gli strumenti informatici ed i meto statistici
DettagliSCUOLA PRIMARIA ITALIANO (Classe 1ª)
SCUOLA PRIMARIA ITALIANO (Classe 1ª) Leggere testi brevi e rispondere a semplici domande di comprensione. Ricostruire cronologicamente un semplice testo ascoltato. Eseguire semplici istruzioni, consegne
DettagliVincenzo Lombardo. Informatica e studio del linguaggio
Vincenzo Lombardo Informatica e studio del linguaggio L accesso elettronico alla conoscenza vincenzo@mfn.unipmn.it Il linguaggio naturale E il principale veicolo della comunicazione Esistono grandi moli
DettagliLinguaggi e Grammatiche Liberi da Contesto
N.Fanizzi-V.Carofiglio Dipartimento di Informatica Università degli Studi di Bari 22 aprile 2016 1 Linguaggi Liberi da Contesto 2 Grammatiche e Linguaggi Liberi da Contesto G = (X, V, S, P) è una grammatica
Dettagliinformatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia sesta lezione: la dinamica del testo vito
DettagliSTRUMENTI FORMALI PER L ANALISI LESSICALE SINTATTICA
Universtità degli Studi G. D Annunzio Chieti Pescara Facoltà di Economia Corso di Laurea in Economia Informatica Pescara TESINA DI LAUREA STRUMENTI FORMALI PER L ANALISI LESSICALE SINTATTICA DEI COMPILATORI
Dettagli