2. Eliminazione delle produzioni unitarie Forma Normale di Chomsky Una produzione si dice unitaria se è della forma A! B. Le produzioni unitarie in pratica consistono in una ridenominazione di variabili, talvolta necessaria, al momento della creazione della grammatica. La rimozione di queste regole implica la definizione di altre regole che producano le stesse stringhe. Es1 A! aa a B B! bb b C è evidente la catena di regole che da A porta al simbolo C via il simbolo B Algoritmo Sia P1 l insieme delle produzioni della grammatica di partenza G1 (senza #-produzioni). 1. Per ogni simbolo X " V N della grammatica G1 si individuano tutti i simboli non terminali ad esso collegati raggiungibili da produzioni unitarie, chiamo questa lista CHAIN(X). 2. Le produzioni P2 della grammatica trasformata G2 sono costruite a partire dalle produzioni P1 considerato che la regola X! w è collocata in P2 se esiste un simbolo Y e una stringa w tale che: a) Y " CHAIN(X) b) Y! w " P1 c) w $ V N X Y w
Eliminazione delle produzioni unitarie cont. Es2 S! ACA AC CA AA A C " A! aaa aa B C B! bb b C! cc c Determinazione dei simboli unitari CHAIN(S) = {S,A,C,B} CHAIN(A) = {A,B,C} CHAIN(B) = {B} CHAIN(C) = {C} Forma Normale di Chomsky S! ACA AC CA AA A C " S! ACA AC CA AA aaa aa bb b cc c " A! aaa aa B C A! aaa aa bb b cc c B! bb b B! bb b C! cc c C! cc c Esercizio- Scrivere la grammatica equivalente della grammatica G13 E! E+T E- T T T! T *F T/F F F! (E) id id! a b c
3. Eliminazione dei simboli inutili Forma Normale di Chomsky Def. In una Grammatica contex-free, un simbolo x! (V N " V T ) è detto simbolo utile se esiste una derivazione Un simbolo che non è utile è detto inutile. S #* u x v #* w con u, v! (V N " V T )* e w! V T * Affinché una variabile sia considerata utile occorre che si verifichino le seguenti due condizioni: Generabilità - cioé tramite il simbolo si deve poter pervenire ad una stringa di caratteri terminali (compresa eventualmente la stringa vuota $) Raggiungibilità - che il simbolo deve far parte di una forma sentenziale, ovvero è raggiungibile a partire dal simbolo distinto S S % AC BS B A % aa af B % CF b C % cc D D % ad BD C E % aa BSA F % bb b Qual è il linguaggio generato da questa grammatica?
3. Eliminazione dei simboli inutili (cont.) Forma Normale di Chomsky Algoritmo (individuazione dei simboli generatori) - Si collocano nella lista GEN tutti simboli A tali che esiste una regola A! w in P con w " V T * repeat PREV := GEN Per ogni variabile A " V N se c é una regola A! w con w " (PREV # V T )* allora GEN = GEN # { A} until GEN= PREV P S! AC BS B S! BS B GEN PREV A! aa af A! aa af { B,F} B! CF b B! b { B,F, A, S} { B,F} C! cc D D! ad BD C { B,F, A, S,E} { B,F, A, S} E! aa BSA E! aa BSA { B,F, A, S,E} { B,F, A, S,E} F! bb b F! bb b La grammatica risultante G avrà come V N i simboli in GEN, come produzioni P le produzioni A!w di P tali che A " GEN e w " (GEN # V T )*, come V T i simboli terminali che occorrono nelle parti destre di P, ovvero V N = { B,F, A, S,E}, V T = { a,b} e P come sopra indicato.
3. Eliminazione dei simboli inutili (cont.) Forma Normale di Chomsky Algoritmo (individuazione dei simboli raggiungibili) RAGG = simbolo distinto di G PREV :=! repeat NEW := RAGG-PREV PREV:= RAGG per ogni variabile A # NEW per ogni regola A " w addiziona tutte le variabili in w a RAGG until RAGG=PREV RAGG PREV { S} {!} NEW { S, B} { S} { S} { S, B} { S, B} { B} S " BS B A " aa af B " b E " aa BSA F " bb b La grammatica risultante G avrà come V N i simboli in RAGG, come produzioni P le produzioni A "w di P tali che A # RAGG e w # (RAGG $ V T )*, come V T i simboli terminali che occorrono nelle parti destre di P, ovvero V N = { S,B}, V T = {b} e P come sopra indicato. P S " BS B B " b
Forma Normale di Chomsky Una grammatica G si dice in forma normale (di Chomsky) se ciascuna regola è della forma: 1. A! BC con B, C! V N - { S} 2. A! a 3. S! " Data una grammatica di tipo 2, G = < VN,VT,P, S > è possibile costruire per via algoritmica una grammatica G = < V N,VT,P, S > in forma normale (di Chomsky). Si assume che la grammatica abbia la seguente struttura: Il simbolo distinto S non è ricorsivo G è privo di!-produzioni ad esclusione di S!! G non contiene produzioni unitarie G non contiene simboli inutili Una produzione di una tale grammatica può avere solo una delle seguenti forme: S!! A! a a! VT A! w w!( ( VN # VT ) - { S})* e w > 1 Si osservi come avendo eliminato le produzioni unitarie la parte destra di una regola non potrà essere formata dal un solo simbolo non terminale, pertanto le regole A! w avranno come parte destra più simboli terminali e non terminali.
Forma Normale di Chomsky Si tratta in definitiva di vedere come si trattano le produzioni A! w in cui w > 1. S! aabc a A! aa a B! bcb bc C! cc c produzioni già in forma normale Il primo passo sarà quello di sostituire i terminali presenti in w con opportuni simboli non terminali. S! A ABC a A! A A a B! B C B B C C! C C c A! a B!b C!c produzioni ancora non in forma normale A questo punto dobbiamo gestire le regole con parti destre costituite da più di due simboli non terminali, in quanto tutte le altre soddisfano già le condizioni della forma normale. Ciò viene fatto introducendo delle ulteriori variabili.
Forma Normale di Chomsky S! A ABC a A! A A a B! B C B B C C! C C c A! a B!b C!c Si introducono altre opportune variabili S! A ABC B! B C B S! A T1 T1! ABC B! B T4 T4! C B non in forma normale non in forma normale S! A T1 T1! A T2 T2! BC Si ha pertanto che la grammatica di partenza S! aabc a A! aa a B! bcb bc C! cc c viene trasformata in S! A T1 a A! a T1! A T2 T 2! BC A! A A a B! B T4 B C T4! C B C! C C c B!b C!c
Forma Normale di Chomsky Esercizio Trasformare in forma normale di Chomsky la grammatica: E $ E+T E- T T T $ T *F T/F F F $ (E) id id $ a b c
Automi Pushdown Rappresentano una modificazione degli automi a stati finiti in quanto introducono il concetto di memoria, tale memoria è rappresentata sotto forma di stack La grammatica G 14 con regole S $ a S a b S b " riconosce stringhe palindrome input S%aSa % aa S%aSa % absba %abba S%aSa % absba %abbasabba%abbaabba... a b b a a b b a testina di lettura Controllo b b a stack
Automi Pushdown Un automa pushdown è definito dalla sestupla < K, ", &, ', s, Z > K - Insieme degli stati " - Alfabeto di Ingresso (Alfabeto terminale) & - Alfabeto dello stack s - Stato iniziale s! K Z - insieme degli stati finali Z ( K ' - relazione di transizione è un sottoinsieme finito di # ( K x (" # {"} ) x &*) x (K x&*) #
Transizioni negli automi pushdown Una quintupla (p, a, )), (q, *) rappresenta una transizione e viene interpretata nel seguente modo : # se l automa si trova in uno stato p, sta leggendo il simbolo a dal nastro, mentre ) si trova sul top dello stack, l automa passa allo stato q e rimpiazza ) con * sul top dello stack Ex: la transizione (p, ", )), (q, *) non legge alcun simbolo dal nastro di input passa dallo stato p allo stato q mette * al posto di ) nello stack la transizione (p, u, "), (q, a) legge il carattere u ## # passa dallo stato p allo stato q ## # effettua il push di a nello stack" " la transizione (p, u, a), (q, ") legge il carattere u ## # passa dallo stato p allo stato q "" " effettua il pop di a dallo stack
Configurazioni negli automi pushdown Si definisce una configurazione dell automa un elemento di ## # # ## # # K x "* x &* in cui la prima componente è lo stato corrente della macchina, la seconda componente è la porzione di input che deve essere ancora letta, la terza componente è il contenuto dello stack Ex: ( q, bba, bba) è una configurazione in cui il contenuto corrente dello stack è bba (b è al top) e la parte di stringa ancora da leggere è bba Date le due configurazioni c 1 = (p, x, +) e c 2 = (q, y,,) si dirà che c 1 si trasforma in c 2 in un singolo passo e si scrive (p, x, +) - (q, y,,) se esiste una transizione (p, s, )), (q, *)! ' tale che: x = sy, + = ). e, = *. Ex: (q, bba, bba) - (q, ba, ba) in virtù di una transizione in ' avente la struttura (q, b, b), (q, ") per cui x= bba y=ba + = bba, = ba.=ba )=b *= " input a b b a a b b a Controllo testina di lettura b b a stack
Computazioni di un automa pushdown Una sequenza di configurazioni C 0, C 1,..., C n con n > 0 tale che C 0 = ( s, w,!) " C 1 " C 2 "... " C n = (p,!,!) per qualche p # Z, viene chiamata una computazione accettante di! lunghezza n. Dato un automa pushdown A, il linguaggio accettato da A e denotato da L(A) è l insieme delle stringhe accettate da A
Esempio stringhe palindrome 1 Automa per il riconoscimento del linguaggio L = {w c w R } A = < {s,f}, {a,b,c}, {a,b},!, s, { f } > con! che contiene le transizioni: 1. (( s, a, " ), (s, a)! [ push a] 2. (( s b, " ), (s, b) [ push b] 3. (( s, c, " ), (f, ")!! 4. (( f a, a ), (f, ")! [ pop a ] 5. (( f, b, b ), (f, ")! [ pob b ] Si osservi come nell alfabeto di stack non è compreso il simbolo c che denota la demarcazione tra le due parti della stringa esecuzione per abbcbba Stato Stringa di input stack transizione s abbcbba " s bbcbba a 1 s bcbba ba 2 s cbba bba 2 f bba bba 3 f ba ba 5 f a a 5 f " " 4
Esempio stringhe palindrome 2 Automa per il riconoscimento del linguaggio L = {w w R } A = < {{s,f}, {a,b}, {a,b},!, s, { f } > con! che contiene le transizioni: 1. (( s, a, " ), (s, a)! [ push a] 2. (( s b, " ), (s, b) [ push b] 3. (( s, ", " ), (f, ")!! 4. (( f a, a ), (f, ")! [ pop a ] 5. (( f, b, b ), (f, ")! [ pob b ] Nell applicazione della regola 3 la macchina puo scegliere non deterministicamente di andare nello stato f senza consumare input o fare un push del prossimo simbolo nello stack. Si osservi come questa sia l unica regola variata rispetto all automa precedente. Esecuzione per abbbba Stato Stringa di input stack transizione s abbbba " " s bbbba a 1 s bbba ba 2 s bba bba 2 f bba bba 3 f ba ba 5 f a a 5 f " " 4