MODULO 07 LA MACCHINA DI TURING Nel 1936 Alan Turing presenta una definizione di computabilità basata sull osservazione del comportamento di un agente umano che sta eseguendo un calcolo (algoritmo) con carta e penna, nota come macchina di Turing (MdT). Turing nota che: 1. Per effettuare una computazione è necessario che esista un input e, dopo una quantità finita di calcoli scritti, viene prodotto un output; 2. Anche se di norma la lettura e la scrittura su un foglio di carta si effettuano in linee orizzontali o verticali, è possibile semplificare la situazione e immaginare che la macchina legga o scriva su un nastro lineare; 3. Visto che a priori non poniamo limite alla quantità di carta necessaria per scrivere i calcoli, anche il nastro è potenzialmente infinito in entrambe le direzioni e inoltre, dal momento che scriviamo i simboli uno alla volta, lo consideriamo suddiviso in celle ciascuna contenente un singolo simbolo; 4. Anche se è teoricamente necessario poter disporre di simboli distinti da associare a infinite entità (ad esempio un simbolo per ogni numero), in genere usiamo simboli complessi (come le parole) costruiti a partire da un insieme finito di simboli atomici (come le lettere). La macchina, dunque, è in grado di leggere e stampare simboli che appartengono a un alfabeto finito; 5. La macchina è dotata di due direzioni di movimento (che corrispondono all azione di spostare l attenzione da una parte all altra del foglio) lungo il nastro, di una cella per volta: questa ipotesi è necessaria, sia perché la macchina deve scrivere simboli in celle differenti, sia perché, in questo modo, resta traccia della storia del lavoro già svolto sino a un dato istante. Le due direzioni di spostamento consentono alla macchina di tornare, all indietro, su una cella che già contiene un simbolo e di cancellarlo scrivendovi internamente un nuovo simbolo; 6. Ciascun passo dell algoritmo determina l azione successiva da compiere (basta pensare all algoritmo per effettuare una addizione ), che a sua volta dipende dal simbolo analizzato in un certo istante e dallo stato (della mente) dell agente. Ma lo stato della mente coincide col lavoro già fatto sino a un dato istante: in realtà non è del tutto vero che un agente umano ricorda tutto il lavoro già fatto nel portare avanti un algoritmo; ricorda al più pochi passi precedenti e sa che ogni passo è stato determinato dall algoritmo stesso. Insomma, lo stato della mente dipende dall algoritmo e dalle operazioni già fatte (probabilmente solo dall ultima operazione ).Siccome il numero di stati diversi di un agente umano è finito anche quello della macchina è finito. 1
7. La macchina lavora automaticamente obbedendo a precise istruzioni, in numero finito, che la informano su che cosa debba fare quando, trovandosi in uno specifico stato, analizza (legge) un simbolo del nastro. I simboli provengono dall esterno e sono scritti sul nastro al quale la macchina è collegata mediante un dispositivo (testina) di lettura/scrittura. A questo punto possiamo illustrare il modello fisico della macchina q i Finestra stato corrente Programma s 0 s 1 s 2 s j s k s 0 s 0 s 0 nel quale vediamo Il nastro, suddiviso in caselle, infinito a destra e a sinistra. Ogni cella contiene un simbolo appartenente a un insieme finito S = {s 0, s 1,,s n }. Uno di questi, s 0, è usato per indicare che la cella è priva di simbolo (blank) : lo chiameremo bianco. Si suppone che il nastro sia tutto bianco tranne che per una parte di lunghezza finita; Un organo di controllo a stati finiti che contiene il programma per la macchina; Una testina di lettura/scrittura che permette al controllo di leggere o scrivere un simbolo per volta; In ciascun istante, il simbolo che si trova nella casella corrente esaminata costituisce lo stimolo di ingresso per il controllo. La macchina reagisce allo stimolo scrivendo nella casella un nuovo simbolo (che può anche coincidere col precedente), portandosi in nuovo stato e spostandosi sul nastro di una casella a destra o a sinistra. In questo modo lo stimolo per il passo (o ciclo operativo) successivo verrà da una casella differente e potrà essere letto un simbolo scritto in precedenza. Questo significa che la macchina, oltre alla memoria interna che contiene il programma, possiede una memoria esterna non indirizzabile. 2
Il comportamento della MdT si può descrivere con una tabella detta matrice funzionale, s j q i s k q r x t con tante righe quanti sono gli stati q 0, q 1,...,q m e tante colonne quanti sono i simboli dell alfabeto. Una qualunque cella della matrice descrive l azione della macchina corrispondente allo stato q i indicato sulla riga e al simbolo s j della colonna corrispondente. L azione, specificata da una terna come s k q r x t, consiste nelle tre seguenti operazioni: 1. scrivere sulla cella del nastro il simbolo s k ; 2. transire nello stato q r ; 3. spostarsi sul nastro di una casella verso destra o verso sinistra a seconda che x t = D o x t = S. In particolare s k può essere uguale a s j e q r uguale a q i : significa che la macchina può lasciare inalterato il simbolo sul nastro e/o restare nello stesso stato. Una generica casella della matrice di transizione, corrispondente a una coppia q i s j, può essere bianca: significa che in quella condizione, cioè quando nello stato q i viene letto il simbolo s j, la macchina non intraprende alcuna azione ma si ferma arrestando il calcolo. Per specificare che cosa sia una computazione di una MdT, dobbiamo introdurre la nozione di descrizione istantanea iniziale, che precisa la situazione iniziale, di partenza, della macchina. Una descrizione istantanea iniziale si specifica fornendo: 1. un ingresso finito, cioè un nastro con un numero finito di simboli diversi dal bianco; 2. la posizione della testina di lettura/scrittura rispetto al nastro; 3. lo stato iniziale del controllo. Dopo ciascun passo, la configurazione del nastro, la posizione della testina e lo stato del controllo saranno cambiati e, presi insieme, costituiscono la descrizione istantanea (DI) della macchina. La descrizione istantanea finale è la descrizione istantanea per quale non esiste, nella matrice funzionale, una configurazione successiva: nella matrice funzionale, la casella corrispondente allo stato e al simbolo sotto la testina è vuota. 3
Per computazione di una MdT si intende una sequenza finita di descrizioni istantanee, di cui la prima iniziale e l ultima finale, e ognuna ottenuta dalla precedente in un passo. Descrizione matematica Siano S = {s 0, s 1,...,s n } un alfabeto finito di simboli, con s 0 simbolo distinto per indicare il bianco, Q = {q 0, q 1,...,q m } un insieme finito di stati e M = {L, R} quello dei simboli per rappresentare gli spostamenti (Left, Rigth). In ogni istante, la configurazione della macchina ovvero la stringa di simboli sul nastro, la posizione della testina e lo stato, può essererappresentata come una sequenza infinita di simboli:... s 0, s 0, σ 1, σ 2,..., σ j, q i, s j, σ j + 1,..., s 0, s 0,... (1) di cui solo un numero finito è diverso da s 0 ; il simbolo q i indica lo stato della macchina e s j, alla sua destra, il simbolo in lettura (implicitamente la testina è su questo simbolo). La sequenza (1) corrisponde pertanto a questa situazione: q i... s 0 s 0 σ 1 σ 2... σ j s j σ j + 1. s 0 s 0... Se S * è l insieme di tutte le sequenze finite di simboli che appartengono a S, sequenze come quella indicata in (1) si possono denotare sinteticamente con α q s β, dove α, β S *, q Q e s S; s è il simbolo in lettura. Una stringa come α q s β fornisce una DI della macchina. Il funzionamento della MdT è descritto con un insieme di quintuple che specificano il passaggio da una DI alla successiva determinato da una passo della computazione. Ciascuna quintupla si presenta come q i s j s k q r x t (2) con q i, q r Q; s j, s k S e x t M, e si interpreta dicendo che se la macchina è nello stato q i e legge il simbolo s j, allora scrive s k sul nastro, passa nello stato q r e si sposta di una casella a destra o a sinistra come indicato da x t : notare che k, r e t dipendono da i e j: questa dipendenza si esprime scrivendo le quintuple anche come q i s j s ij q ij x ij. Non possono esistere due quintuple con in primi due simboli uguali perché la macchina opera in modo deterministico. 4
Se in corrispondenza di una coppia q i s j non esiste alcuna quintupla con i primi due simboli uguali a quelli della coppia, la macchina arresta la computazione e la configurazione della sequenza (1) assume il significato di DI finale. Definizione: Macchina di Turing Una Macchina di Turing Z è una terna (Q, S, P) nella quale: Q = {q 0, q 1,...,q m } è un insieme finito di stati; S = {s 0, s 1,...,s n } è un insieme finito di simboli con s 0 detto bianco; P è un sottoinsieme di Q x S x S X S X {L, R}, l insieme delle quintuple di Z, privo di due quintuple con le prime due componenti uguali. Ora vediamo come si possa descrivere un passo di computazione attraverso una relazione che lega due descrizioni istantanee. Se indichiamo con z tale relazione, allora z IDI x IDI dove IDI indica l insieme delle descrizioni istantanee e IDI = S Q S S* ( indica concatenazione) o più semplicemente IDI = { α q i s j β }. La relazione z è definita nel modo che segue: a) α q i s j β z α q ij s L s ij β se q i s j s ij q ij L P (s L è il simbolo alla sinistra di s j prima del passo di calcolo, mentre s ij è quello scritto al posto di s j durante il passo) b) α q i s j β z α s ij q ij s R β se q i s j s ij q ij R P (s R indica il simbolo alla destra di s j prima del passo di calcolo, mentre s ij è quello scritto al posto di s j durante il passo). Definizione: Computazione Una computazione di una MdT Z è una sequenza finita d 0, d 1,, d i, d i + 1,, d n di descrizioni istantanee con (d i, d i + 1 ) z, i = 0,, n-1. Una computazione è terminale se esiste un intero n, tale che d n è terminale e d n =α n q in s jn β n ; in corrispondenza a d n la macchina si ferma e il valore finale della computazione è y = f z (x) = α n s jn β n. 5
Se facciamo partire Z da una configurazione iniziale d 0, allora o Z si fermerà, nel qual caso d 0 definisce univocamente la computazione della quale è primo elemento, o Z non si fermerà mai, nel qual caso Z non ha alcuna computazione della quale d 0 è primo elemento. La macchina di Turing soddisfa le condizioni richieste da una ragionevole definizione di algoritmo. Infatti: a) L insieme delle quintuple, o la matrice funzionale, della macchina costituisce un insieme finito di istruzioni; b) La MdT è l agente di calcolo che esegue le istruzioni citate in a); c) La macchina può utilizzare il nastro per memorizzare i risultati intermedi; d) La macchina opera in modo discreto; e) Opera in modo deterministico; f) Non esiste alcuna limitazione sulla lunghezza delle stringhe di ingresso in quanto il nastro è illimitato; g) Il nastro costituisce una memoria di capacità illimitata; h) Le operazioni che la macchina può eseguire sono semplici, di complessità limitata; i) Non esiste limite al numero di operazioni che vengono eseguite durante una computazione in quanto non esiste limite al numero di volte che una quintupla può essere usata; l) Esistono descrizioni istantanee iniziali che provocano computazioni che non si arrestano mai (calcolo di funzioni parziali). Esempi di MdT a) Calcolo del successivo di un numero Si tratta di definire la MdT che legge un numero in base 10 e calcola il suo successivo. Le operazioni da fare si possono schematizzare come segue: esaminare l ultima cifra del numero, se e` minore di 9 sommarle 1 e stop; altrimenti (cifra = 9) sostituirla con 0 e passare all analisi della cifra adiacente a sinistra. L alfabeto è S = {b, 0, 1,..., 9} (b denota blank); la DI iniziale è data dal numero che si vuole incrementare scritto sul nastro, dalla testina posizionata sull ultima cifra a destra e dal controllo nello stato iniziale q 0 :... b b 1 4 2 8 b b... q 0 6
Una matrice funzionale potrebbe essere q 0 0 1 2... 7 8 9 b 1q 1 D 2q 1 D 3q 1 D..... 8q 1 D 9q 1 D 0q 1 S 1q 1 D q 1 con due stati q 0 e q 1 necessari per distinguere due situazioni i) 1 deve ancora essere sommato (q 0 ) ii) 1 è già stato sommato (q 1 ). Se in q 0 viene letta un cifra minore di 9, questa viene incrementata di 1 e il nuovo stato diventa q 1 ; altrimenti, se in q 0 viene letto un 9, lo si pone a 0 e si passa a incrementare di 1 la cifra di sinistra restando in stato q 0. Nello stato q 0 può essere letto il simbolo bianco e ciò accade quando si deve calcolare il successore di un numero con tutte le cifre uguali a 9: in questo caso, dopo che tutti i 9 sono stati messi a 0 sarà letto un bianco, il primo alla sinistra del 9 più significativo, nello stato q 0 ; a quel punto la macchina scriverà 1 e passerà in q 1 arrestandosi. Dalla matrice funzionale ricaviamo facilmente l insieme delle quintuple Eercizio P1 q 0 0 1 q 1 D P2 q 0 1 2 q 1 D P5 q 0 4 5 q 1 D.................. P9 q 0 8 9 q 1 D P10 q 0 9 0 q 0 S P11 q 0 b 1 q 1 D A partire dalla descrizione istantanea iniziale che segue: 142q 0 8 proseguire nella computazione sino all arresto della macchina. 7
Funzione calcolata da una MdT A ogni MdT Z puo` essere associata la funzione calcolata da Z, una volta che si siano fissate delle convenzioni per la codifica dei dati iniziali e del risultato finale. Ad esempio se si vuole calcolare una funzione f: N n --> N una codifica degli argomenti potrebbe essere: 0 --> 1 1 --> 11... n --> 1 n+1 e il nastro potrebbe presentarsi come:...b b β 1 0 β 2 0...0 β n 0 b b... dove β i rappresenta la codifica binaria dell argomento i-esimo. In queste ipotesi diremo che una funzione f: N n --> N e` Turing-calcolabile, se esiste una macchina di Turing, M f, di alfabeto {0, 1, b}, tale che ricevendo in ingresso una n-upla α in N n, produce in uscita f(α) : M f : 1 n1 +1 0 1 n2 +1 0... 0 1 nn +1 0 1 m + 1 f(n1, n2,..., nn) = m. Ecco il programma per una MdT che calcola la somma di due naturali rappresentati secondo la codifica indicata: 1. (q 0, 1, 1, q 0,R) 2. (q 0, 0, 1, q 1,R) 3. (q 1, 1, 1, q 1,R) 4. (q 1, 0, 0, q 2,L) 5. (q 2, 1, 0, q 3,L) 6. (q 3, 1, 0, q 4,L). Questa macchina calcola la funzione f(m, n) = m+n ; la parte di nastro diversa dal bianco (b) contiene una sequenza di m+1 1 seguita da 0 seguita da una sequenza di n+ 1 1. 8
La macchina esegue nell ordine m+1 volte la prima istruzione scorrendo la prima di 1 e restando nello stato iniziale; 1 volta la seconda istruzione con la quale scrive 1 al posto dello 0 che separa le due sequenze; la sequenza iniziale viene modificata in una che contiene m+n+3 simboli 1 e lo stato diventa q 1 ; n+1 volte la terza istruzione scorrendo in tal modo la seconda sequenza di 1 presente sul nastro; 1 volta la quarta istruzione con la quale passa nello stato q 2 e posiziona la testina di lettura sull ultimo 1 presente sul nastro; 1 volta la quinta istruzione, con la quale cancella l ultimo 1 sulla destra sostituendolo con 0 e transisce nello stato q 3 ; una volta la sesta con la quale cancella l ultimo 1 corrente sulla destra, lo sostituisce con 0 e passa nello stato q 4. Non essendoci istruzioni applicabili in corrispondenza dello stato q 4, la computazione termina e la sequenza di m+n+1 1 presente sul nastro rappresenta l output della macchina: questa sequenza rappresenta in numero m+n secondo la codifica adoperata. Esercizio Data una sequenza di 0 e di1 scritta sul nastro, progettare una MdT che senza distruggere la sequenza conti il numero di occorrenze di 1 presenti e lo scriva in decimale alla sua sinistra. In letteratura, le MdT vengono presentate talvolta con qualche variante rispetto a queste note. Si dimostra anche che modifiche nella struttura di una MdT : variazione del numero degli stati, del numero dei simboli dell alfabeto, aumento del numero delle testine, del numero dei nastri o uso di nastri multidimensionali, non modificano l insieme delle funzioni Turing-calcolabili. La tesi di Church La nozione di calcolabilità effettiva sugli interi positivi si basa sul concetto di macchina di calcolo e si collega alla possibilità di realizzare un sistema fisico che rappresenti adeguatamente i dati e il cui funzionamento sia una simulazione fisica dei passi di calcolo. Una questione fondamentale riguarda la possibilità di determinare una macchina (una classe di macchine) in grado di calcolare qualsiasi funzione calcolabile nel senso indicato; ovvero una classe di macchine computazionalmente universali. La proposta di Turing assume un rilievo enorme poiché si è rivelata come risposta costruttiva alla questione precedente. Dopo poco tempo dalla pubblicazione dell articolo di Turing nel 1936, Alonzo Church propose di considerare le macchine di Turing come una classe di macchine computazionalmente universali formulando una proposta nota, oggi, come tesi 9
Tesi di Church Le macchine di Turing sono una classe di automi computazionalmente Universali. L enunciato di Church non è dimostrato. Potrebbe essere scoperta una macchina che calcola una funzione non Turingcomputabile. L impossibilità di un tale evento non può essere dimostrata matematicamente per il fatto che nessuna teoria matematica può dimostrare la non-esistenza di un oggetto che non è matematicamente definito. Nuove leggi fisiche e nuovi fenomeni, oggi ignoti, potrebbero in futuro ampliare la nozione di calcolo cosi come è, oggi, concepito. La tesi viene sorretta solo da argomenti informali e non può essere dedotta all interno di una teoria formale. A tutt oggi non si conoscono smentite alla tesi di Church. Inoltre tutti i modelli calcolo che sono stati via via proposti : Funzioni Ricorsive, Macchine a Registri, Funzioni Lambda-definibili,., si sono dimostrati equivalenti, quanto a potenza di calcolo, alle macchine di Turing. 10