Corso di Linguaggi e Traduttori 1 AA 2004-05 GRAMMATICHE 1 Definizione di Grammatica Formalmente definiamo un grammatica G mediante una quadrupla ( VN, VT, P, S ) dove: V N e l insieme dei simboli non terminali V T e l insieme dei simboli terminali P e l insieme delle regole di produzione o riscrittura S e il simbolo iniziale (radice) vincoli: V N V T = 2
Regole di Produzione Per comodità si definisce anche il vocabolario V definito come l'unione di simboli terminali e non terminali, ovvero: V = V T V N Sono importanti per la definizione delle varie classi di grammatiche gli insiemi di stringhe che si possono formare a partire da V, ovvero V + e V* V + rappresenta l'insieme delle stringhe che si possono formare a partire da V, esclusa la stringa vuota ε V* rappresenta l'insieme delle stringhe che si possono formare a partire da V, compresa la stringa vuota ε 3 Le grammatiche possono essere classificate in base alla loro capacità generativa Nel 1957 Chomsky descrive 4 classi di formalismi grammaticali che differiscono soltanto nella forma delle regole di riscrittura 4
TIPO 0 - Ricorsivamente Enumerabili Le regole di riscrittura non hanno alcuna restrizione, e sono del tipo: α β α V +, β V * : TIPO 0 equivalente a quella delle macchine di Turing 5 : TIPO 1 TIPO 1 - Sensibili al Contesto Rispetto alle grammatiche ricorsivamente enumerabili viene introdotto il vincolo addizionale che la parte destra deve contenere almeno tanti simboli quanto la parte sinistra, ovvero: α β Sono anche dette grammatiche sensibili al contesto (context-sensitive) poiché storicamente il vincolo addizionale che le caratterizzava è il seguente: * + γχδ γρδ γ, δ, ρ V, χ V equivalente a quella degli automi limitati lineari 6
TIPO 2 - Non Contestuali : TIPO 2 Rispetto alle grammatiche sensibili al contesto viene introdotto il vincolo addizionale che la parte sinistra di una regola sia costituita da un simbolo non terminale; in simboli: α V N L introduzione di tale vincolo impedisce che ci sia un contesto che può influenzare l attivazione di una regola equivalente a quella degli automi a pila. 7 TIPO 3 - Regolari : TIPO 3 Rispetto alle grammatiche di tipo 2 viene introdotto il vincolo addizionale che la parte destra di una regola sia costituita da un simbolo terminale, opzionalmente seguito da un simbolo non terminale Formalmente: β V T oppure β V T V N equivalente a quella degli automi a stati finiti 8
Tabella Riassuntiva sulle Grammatiche TIPO 0 - ric. enumerabili α β α V, V TIPO 1 - contestuali α β o, in alternativa: * γχδ γρδ γ, δ, ρ V, χ V TIPO 2 - libere da contesto α V N TIPO 3 - regolari β V T oppure + β * β V T V N + Macchine di Turing Automi Limitati Lineari Automi a Pila Automi a Stati Finiti 9 Linguaggio Generato da una Grammatica Il linguaggio L(G) generato da una grammatica G è definito come l insieme delle stringhe di soli simboli terminali che soddisfano la grammatica, ovvero derivabili dalla radice tramite l applicazione delle regole di riscrittura Per formalizzare L(G) abbiamo bisogno di definizioni preliminari (derivazione semplice e derivazione multipla) 10
Definizioni Preliminari Derivazione semplice γ γ se esiste una regola applicabile capace di trasformare γ' in γ'' Derivazione multipla * γ 1 * γ m se esiste una sequenza di regole applicabili capaci di trasformare γ 1 in γ m 11 Linguaggio Generato da una Grammatica A questo punto siamo in grado di dare una definizione formale che definisce l'insieme di tutte le stringhe riconosciute da una grammatica G (ovvero il linguaggio L associato a G): + L( G) = { w w VT, S * w } NB Nella definizione abbiamo escluso dal linguaggio la stringa nulla, imponendo che w V T +. Questa limitazione può essere agevolmente rimossa accettando che w V T. Ricordiamo che il simbolo V T + (V T ) denota l'insieme di tutte le stringhe che si possono formare a partire dai simboli di V T, ad eccezione della (compresa la) stringa nulla. 12
Equivalenza tra Grammatiche Due grammatiche G1 e G2 sono equivalenti se L(G1) = L(G2) In generale, dato un linguaggio L, ci saranno infinite grammatiche in grado di generarlo 13