Fasi di un Compilatore
|
|
|
- Alessandra Lentini
- 9 anni fa
- Просмотров:
Транскрипт
1 Dipartimento di Matematica e Informatica Università di Camerino
2 Un implementazione compilativa di un linguaggio di programmazione viene realizzata tramite un programma che prende il nome di compilatore Un compilatore è un programmazione che prende in input un altro programma P scritto nel linguaggio sorgente e restituisce in output un programma P funzionalmente equivalente a P, ma scritto nel linguaggio target (linguaggio della macchina scelta per l implementazione) sorgente Compilatore target errori
3 La scrittura di un compilatore è un compito abbastanza complesso Ad esempio, la scrittura del primo compilatore Fortran (fine anni 50) ha richiesto 18 anni di lavoro da parte di uno staff Fortunatamente, nel corso degli anni, sono state sviluppate delle tecniche sistematiche per lo sviluppo delle più importanti fasi del processo di compilazione Oggi, la conoscienza di tecniche efficaci per la scrittura di un compilatore è molto vasta e strutturata Esistono linguaggi di programmazione (es. C), ambienti di programmazione e tools che facilitano tale compito (generazione automatica a partire dalle specifiche delle varie parti del linguaggio sorgente)
4 Processo di compilazione È concettualmente suddiviso in due fasi: una fase di analisi (front-end) ed una fase di sintesi sintesi (back-end) La fase di analisi si occupa di dare una struttura al codice e creare una sua rappresentazione intermedia: le operazioni indicate nel programma sorgente vengono identificate e raggruppate in una struttura ad albero (syntax tree) La fase di sintesi genera il codice nel linguaggio target a partire dalla rappresentazione intermedia costruita nella fase procedente
5 Analisi lineare (analisi lessicale, scanning) Lo stream (sequenza) di caratteri che costituisce il programma in input viene letto e raggruppato in sequenze di caratteri con significato comune detti lessemi; per ognuno di questi l analizzatore lessicale produce in output un token identificatori, parole chiave (if, while, int), operatori, simboli di punteggiatura cerchiamo le parole del nostro linguaggio Analisi gerarchica (analisi sintattica, parsing) I token identificati nella fase precedente vengono raggruppati gerarchicamente tramite delle strutture ad albero che specificano la struttura sintattica delle frasi del programma cerchiamo di mettere insieme le parole identificate in fase di analisi lineare per formare parole sintatticamente corrette Analisi semantica Verifichiamo che le varie parti del programma siano consistenti l una con l altra, a seconda del loro significato
6 Analisi lineare (analisi lessicale, scanning) Lo stream (sequenza) di caratteri che costituisce il programma in input viene letto e raggruppato in sequenze di caratteri con significato comune detti lessemi; per ognuno di questi l analizzatore lessicale produce in output un token identificatori, parole chiave (if, while, int), operatori, simboli di punteggiatura cerchiamo le parole del nostro linguaggio Analisi gerarchica (analisi sintattica, parsing) I token identificati nella fase precedente vengono raggruppati gerarchicamente tramite delle strutture ad albero che specificano la struttura sintattica delle frasi del programma cerchiamo di mettere insieme le parole identificate in fase di analisi lineare per formare parole sintatticamente corrette Analisi semantica Verifichiamo che le varie parti del programma siano consistenti l una con l altra, a seconda del loro significato
7 Analisi lineare (analisi lessicale, scanning) Lo stream (sequenza) di caratteri che costituisce il programma in input viene letto e raggruppato in sequenze di caratteri con significato comune detti lessemi; per ognuno di questi l analizzatore lessicale produce in output un token identificatori, parole chiave (if, while, int), operatori, simboli di punteggiatura cerchiamo le parole del nostro linguaggio Analisi gerarchica (analisi sintattica, parsing) I token identificati nella fase precedente vengono raggruppati gerarchicamente tramite delle strutture ad albero che specificano la struttura sintattica delle frasi del programma cerchiamo di mettere insieme le parole identificate in fase di analisi lineare per formare parole sintatticamente corrette Analisi semantica Verifichiamo che le varie parti del programma siano consistenti l una con l altra, a seconda del loro significato
8 Analisi Lessicale Consideriamo, la sequenza di caratteri pos := init + rate 60 Lo scanning di questa sequenza identifica i seguenti lessemi: 1 l identificatore pos 2 l operatore di assegnamento := 3 l identificatore init 4 l operatore + 5 l identificatore rate 6 l operatore 7 il numero 60 La sequenza di tokens prodotti in output è : id, 1 := id, 2 + id, 3 60 Blank, tabulazioni, newline, e commenti (utili al programmatore ma ignorati dal compilatore) vengono eliminati durante la fase di analisi lessicale
9 Analisi Sintattica I token individuati durante la fase di analisi lessicale vengono raggruppati in frasi grammaticali Le frasi grammaticali sono rappresentate mediante syntax-tree (una variante degli alberi di derivazione): sulle foglie troviamo gli operandi, sui nodi interni le operazioni Figura: Syntax tree per la stringa id 1 := id 2 + id 3 60
10 Analisi Lessicale vs Analisi Sintattica La divisione tra le fasi di analisi lessicale e analisi sintattica è in qualche modo arbitraria e dipende, essenzialmente, dalle scelte del progettista L obiettivo è quello di semplificare per quanto possibile l analisi sintattica Un fattore discriminante è, in genere, la ricorsione Per riconoscere i token di un dato linguaggio è, in generale, sufficiente una scansione lineare del programma in input es: per riconoscere identificatori (stringhe che cominciano con una lettere e continuano con lettere e/o numeri) basta riconocere la prima lettera e continuare a leggere finchè non si incontra un carattere che non è una lettera oppure un numero La scansione lineare non è, invece, abbastanza potente per poter identificare espressioni e statements (costrutti tipicamente ricorsivi) es: non si possono associare in maniera corretta i begin e gli end dei costrutti se non si da una struttura gerarchica o annidata all input
11 Analisi Semantica Controlla che non ci siano errori semantici e acquisisce informazioni sui tipi che verranno usate nella fase di generazione del codice La rappresentazione intermedia (generata dalla fase di analisi sintattica) viene usata per identificare operatori ed operandi di espressioni e statements Un componente importante è la fase di type checking: il compilatore verifica che ogni operatore sia applicato ad operandi consentiti dalla specifica del linguaggio Può dar luogo ad: errori, es: uso di numeri reali per indicizzare array conversioni di tipo: se, nell espressione id 1 := id 2 + id 3 60, il valore di id 3 è un numero reale, l intero 60 viene automaticamente convertito in un reale in questo caso un nuovo nodo viene aggiunto al syntax tree
12 Analisi Semantica Figura: Conversione automatiche di tipo
13 Processo di compilazione programma sorgente Analizzatore lessicale Analizzatore sintattico Gestore Tabella dei simboli Analizzatore semantico Generatore del codice intermedio Gestore degli errori Ottimizzatore del codice Generatore del codice target programma target
14 Tabella dei simboli Uno dei ruoli fondamentali di un compilatore è quello di memorizzare tutti gli identificatori usati nel programma ed i relativi attributi tipo, valore, scope,... per nomi di procedure: il numero e il tipo dei parametri, la modalità di passaggio dei parametri, il tipo di ritorno (se esiste),... La tabella dei simboli è una struttura dati che contiene un record per ogni identificatore; i campi di questo vengono usati per memorizzare i diversi attributi di ciascun identificatore Scopo: reperire tutte le informazioni relative ad un identificatore Ogni nuovo identificatore identificato durante la fase di analisi lessicale viene aggiunto alla tabella dei simboli non tutti gli attributi possono essere identificati in fase di scanning informazioni relative ai tipi: analisi semantica informazioni relative al numero di byte allocati: generazione del codice
15 Gestione degli errori Altro ruolo fondamentale è il riconoscimento e la segnalazione degli errori Ogni fase è in grado di rilevare solo una particolare classe di errori errori lessicali: la sequenza di caratteri esaminata non fa match con nessun token errori sintattici: uno stream di tokens viola le regole sintattiche del linguaggio errori semantici: costrutti sintatticamente corretti richiedono operazioni non consentite dagli operandi in gioco, es. somma tra un intero ed un array Le fasi di analisi lessicale e sintattica sono quelle che devono fronteggiare il maggior numero di errori Gli errori devono essere gestiti in modo da consentire il proseguimento del processo di compilazione: immaginate un compilatore che si blocca ogni volta che omettete un ;
16 Generazione del codice intermedio Terminata la fase di analisi, alcuni compilatori generano una rappresentazione intermedia esplicita del programma sorgente Possiamo pensare a questa rappresentazione come ad un programma scritto nel linguaggio di una macchina astratta poco distante dalla macchina ospite verso cui stiamo compilando Le principali proprietà di questo linguaggio sono le seguenti: semplice da produrre semplice da tradurre nel linguaggio della macchina ospite Esistono diverse rappresentazioni intermedie, una di queste è il codice a tre indirizzi (three-address-code)
17 Generazione del codice intermedio Figura: Generazione codice intermedio un esempio
18 Generazione del codice intermedio Generatore prende in input l albero di derivazione generato durante la fase di analisi semantica e restituisce il seguente three-address code temp 1 := inttoreal(60) temp 2 := id 3 * temp 1 temp 3 := id 2 + temp 2 id 1 := temp 3 Caratteristiche del three-address code: 1 ogni istruzione ha al più un operatore oltre all operatore di assegnamento 2 viene generato un nome temporaneo per denotare il valore calcolato da ogni istruzione 3 alcune istruzioni possono avere un solo operando
19 Ottimizzazione del codice Ottimizzare il codice prodotto in maniera da renderlo più efficiente quando sarà eseguito sulla macchina ospite (1) e (2) temp 1 := id 3 * 60.0 (3) e (4) id 1 := id 2 + temp 1 (1) temp 1 := inttoreal(60) (2) temp 2 := id 3 * temp 1 (3) temp 3 := id 2 + temp 2 (4) id 1 := temp 3 Queste semplici ottimizzazioni del codice prodotto non rallentano il processo di compilazione riescono a migliorare sensibilmente il tempo di esecuzione del programma
20 Generatore del codice target Genera il codice target a partire dal codice intermedio ottimizzato Asumendo che il linguaggio target sia il codice assembly temp 1 := id 3 * 60.0 id 1 := id 2 + temp 1 MOV id 3, R2 MUL i#60.0, R2 MOV id 2, R1 ADD R2, R1 MOV R1, id 1
Linguaggi e Ambienti di Programmazione
Linguaggi e Ambienti di Programmazione Principi e tecniche diffuse che si incontrano spesso nelle applicazioni dell informatica. Compilatori Editor di struttura: riceve in input una sequenza di comandi
Automi e Linguaggi Formali
E-mail: [email protected] rario e ricevimento Orario: Lunedi, Martedi, Mercoledi, Giovedi 13:30-15:30 LUM250 Crediti: 8 crediti formativi, circa 64 ore di lezione Ricevimento: Martedi 11:00-13:00, studio
I Linguaggi di Programmazione
I Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche del Linguaggio
Il Modello di un Compilatore. La costruzione di un compilatore per un particolare linguaggio di programmazione e' abbastanza complessa.
Il Modello di un Compilatore La costruzione di un compilatore per un particolare linguaggio di programmazione e' abbastanza complessa. La complessità dipende dal linguaggio sorgente. Compilatore: traduce
Lezione 6 Introduzione al C++ Mauro Piccolo
Lezione 6 Introduzione al C++ Mauro Piccolo [email protected] Linguaggi di programmazione Un linguaggio formale disegnato per descrivere la computazione Linguaggi ad alto livello C, C++, Pascal, Java,
Fondamenti d Informatica: linguaggi formali. Barbara Re, Phd
Fondamenti d Informatica: linguaggi formali Barbara Re, Phd Agenda } Introdurremo } La nozione di linguaggio } Strumenti per definire un linguaggio } Espressioni Regolari 2 Linguaggio } Da un punto di
Analizzatori Lessicali con JLex. Giuseppe Morelli
Analizzatori Lessicali con JLex Giuseppe Morelli Terminologia Tre concetti sono necessari per comprendere la fase di analisi lessicale: TOKEN: rappresenta un oggetto in grado di rappresentare una specifica
Programma del corso. Elementi di Programmazione. Introduzione agli algoritmi. Rappresentazione delle Informazioni. Architettura del calcolatore
Programma del corso Introduzione agli algoritmi Rappresentazione delle Informazioni Architettura del calcolatore Reti di Calcolatori Elementi di Programmazione Algoritmi e programmi Algoritmo Sequenza
Analizzatore lessicale o scanner. Lo scanner rappresenta un'interfaccia fra il programma sorgente e l'analizzatore sintattico o parser.
Analizzatore lessicale o scanner Dispensa del corso di Linguaggi e Traduttori A.A. 2005-2006 Lo scanner rappresenta un'interfaccia fra il programma sorgente e l'analizzatore sintattico o parser. Lo scanner,
Traduzione guidata dalla sintassi
Traduzione guidata dalla sintassi Attributi e definizioni guidate dalla sintassi Dipartimento di Matematica e Informatica [email protected] Analisi Semantica Analisi sintattica - output:
Strutture dati e loro organizzazione. Gabriella Trucco
Strutture dati e loro organizzazione Gabriella Trucco Introduzione I linguaggi di programmazione di alto livello consentono di far riferimento a posizioni nella memoria principale tramite nomi descrittivi
Linguaggi di Programmazione
Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche del Linguaggio
LINGUAGGI DI ALTO LIVELLO. Si basano su una macchina virtuale le cui mosse non sono quelle della macchina hardware
LINGUAGGI DI ALTO LIVELLO Si basano su una macchina virtuale le cui mosse non sono quelle della macchina hardware 1 LINGUAGGI DI ALTO LIVELLO Barriera di astrazione Fortran Cobol Basic Pascal Python C
Funzioni, Stack e Visibilità delle Variabili in C
Funzioni, Stack e Visibilità delle Variabili in C Programmazione I e Laboratorio Corso di Laurea in Informatica A.A. 2016/2017 Calendario delle lezioni Lez. 1 Lez. 2 Lez. 3 Lez. 4 Lez. 5 Lez. 6 Lez. 7
Elementi di programmazione
Fondamenti di Informatica per la Sicurezza a.a. 2003/04 Elementi di programmazione Stefano Ferrari Università degli Studi di Milano Dipartimento di Tecnologie dell Informazione Stefano Ferrari Università
Semantica statica e dinamica
Semantica statica e dinamica 1 Fasi di compilazione Programma sorgente Analisi lessicale front end Analisi sintattica Tabella dei simboli Analisi semantica Generatore di codice intermedio error handler
Linguaggi e Traduttori: Analisi lessicale
Linguaggi e Traduttori: Analisi lessicale Armando Tacchella Sistemi e Tecnologie per il Ragionamento Automatico (STAR-La) Dipartimento di Informatica Sistemistica e Telematica (DIST) Università di Genova
Linguaggi di Programmazione
Linguaggi di Programmazione E una notazione con cui e possibile descrivere gli algoritmi. Programma: e la rappresentazione di un algoritmo in un particolare linguaggio di programmazione. In generale, ogni
Analizzatore Lessicale Parte I Scanner
Analizzatore Lessicale Parte I Scanner Sommario Dispensa di Linguaggi di Programmazione Corrado Mencar, Pasquale Lops In questa dispensa si descrive un approccio alla costruzione di un analizzatore lessicale
Corso di Laurea Magistrale in Ingegneria Informatica A.A Linguaggi Formali e Compilatori. Introduzione. Giacomo PISCITELLI
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2011-2012 Linguaggi Formali e Compilatori Introduzione Giacomo PISCITELLI Scheduling Orario delle lezioni Lunedi ore 15.50-17.30 aula 10 Giovedi
LINGUAGGI DI ALTO LIVELLO
LINGUAGGI DI ALTO LIVELLO Si basano su una macchina virtuale le cui mosse non sono quelle della macchina hardware Linguaggi di alto livello Barriera di astrazione C Fortran Modula-2 Cobol Algol Basic Ada
DAGLI ALGORITMI AI LINGUAGGI. Linguaggi di Programmazione
DAGLI ALGORITMI AI LINGUAGGI Linguaggi di Programmazione E` una notazione con cui e` possibile descrivere gli algoritmi. Programma: e` la rappresentazione di un algoritmo in un particolare linguaggio di
Programmazione C Massimo Callisto De Donato
Università degli studi di Camerino Scuola di scienze e tecnologia - Sezione Informatica Programmazione C Massimo Callisto De Donato [email protected] www.cs.unicam.it/massimo.callisto LEZIONE
Prof. Pagani Corrado INTRODUZIONE AL LINGUAGGIO C
Prof. Pagani Corrado INTRODUZIONE AL LINGUAGGIO C IL LINGUAGGIO C Nel 1972 Dennis Ritchie nei Bell Laboratories progettò il linguaggio C Il linguaggio possiede tutti i costrutti di controllo dei linguaggi
Analisi lessicale (scanner)
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2011-2012 Linguaggi Formali e Compilatori Analisi lessicale (scanner) Giacomo PISCITELLI Ruolo dell Analizzatore lessicale Compito di un analizzatore
Dispensa 1. Da un punto di vista logico l architettura di un compilatore si può suddividere in due parti: Analisi e Sintesi.
Dispensa 1 1. Introduzione ai compilatori Compilatore Un compilatore è un programma che legge un programma scritto in un linguaggio (sorgente) e lo traduce in un programma equivalente in un altro linguaggio
Introduzione. Informatica B. Daniele Loiacono
Introduzione Informatica B Cos è l informatica? q È la scienza che si occupa della rappresentazione dell informazione e della sua elaborazione e gestione " Si occupa dell informazione, che fa parte di
Introduzione alla programmazione in C++
Introduzione alla programmazione in C++ Fondamenti di Informatica Roberto BASILI Marzo, 2007 La Programmazione Programmare significa: Determinare la natura del problema (analisi) Definire una decomposizione
Descrizione delle operazioni di calcolo. Espressioni costanti semplici
Descrizione delle operazioni di calcolo Come abbiamo detto l interprete è in grado di generare nuovi valori a partire da valori precedentemente acquisiti o generati. Il linguaggio di programmazione permette
Traduzione guidata dalla sintassi. Attributi e Definizioni guidate dalla sintassi
Traduzione guidata dalla sintassi Attributi e Definizioni guidate dalla sintassi Intro In questa ultima parte del corso vediamo, in breve, una tecnica che permette di effettuare analisi semantiche e traduzione
File binari e file di testo
I file File binari e file di testo distinzione tra file binari file di testo si possono usare funzioni diverse per la gestione di tipi di file diversi Programmazione Gestione dei file 2 File binari e file
PROBLEMI ALGORITMI E PROGRAMMAZIONE
PROBLEMI ALGORITMI E PROGRAMMAZIONE SCIENZE E TECNOLOGIE APPLICATE CLASSE SECONDA D PROGRAMMARE = SPECIFICARE UN PROCEDIMENTO CAPACE DI FAR SVOLGERE AD UNA MACCHINA UNA SERIE ORDINATA DI OPERAZIONI AL
Unità Didattica 2 I Linguaggi di Programmazione
Unità Didattica 2 I Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche
Struttura dei programmi C
Programmi C Struttura dei Programmi C Dichiarazione delle variabili Operazioni di Ingresso/Uscita Fondamenti di Informatica 1 Struttura dei programmi C Un programma C deve contenere, nell'ordine: una parte
STORIA E CARATTERISTICHE
IL LINGUAGGIO C STORIA E CARATTERISTICHE STORIA E VERSIONI Sviluppato da Dennis Ritchie ai Bell Labs nel 1972 per realizzare il sistema operativo UNIX K&R C: 1978 (prima versione, K&R dal nome degli autori
Le basi del linguaggio Java
Le basi del linguaggio Java Compilazione e interpretazione Quando si compila il codice sorgente scritto in Java, il compilatore genera il codice compilato, chiamato bytecode. È un codice generato per una
Grammatiche Parse trees Lezione del 17/10/2012
Fondamenti di Programmazione A.A. 2012-2013 Grammatiche Parse trees Lezione del 17/10/2012 AUTILI MARCO http://www.di.univaq.it/marco.autili/ Riassunto lezione precedente Sintassi vs Semantica Stringhe,
Yet Another Compiler-Compiler. Generazione automatica di analizzatori sintattici
Yet Another Compiler-Compiler Generazione automatica di analizzatori sintattici 2 YACC Yet Another Compiler-Compiler YACC (Bison) è un generatore di analizzatori sintattici a partire dalla descrizione
Indice PARTE A. Prefazione Gli Autori Ringraziamenti dell Editore La storia del C. Capitolo 1 Computer 1. Capitolo 2 Sistemi operativi 21 XVII XXIX
Indice Prefazione Gli Autori Ringraziamenti dell Editore La storia del C XVII XXIX XXXI XXXIII PARTE A Capitolo 1 Computer 1 1.1 Hardware e software 2 1.2 Processore 3 1.3 Memorie 5 1.4 Periferiche di
6 - Blocchi e cicli. Programmazione e analisi di dati Modulo A: Programmazione in Java. Paolo Milazzo
6 - Blocchi e cicli Programmazione e analisi di dati Modulo A: Programmazione in Java Paolo Milazzo Dipartimento di Informatica, Università di Pisa http://pages.di.unipi.it/milazzo milazzo di.unipi.it
Programmazione. Dipartimento di Matematica. Ing. Cristiano Gregnanin. 29 febbraio Corso di laurea in Matematica
Programmazione Dipartimento di Matematica Ing. Cristiano Gregnanin Corso di laurea in Matematica 29 febbraio 2016 1 / 28 Linguaggi 2 / 28 Linguaggi 3 / 28 Linguaggi di alto livello Si basano su una macchina
Linguaggi di programmazione
Linguaggi di programmazione Fondamenti di Informatica Daniele Loiacono Ho definito un algoritmo e adesso? Daniele Loiacono Dall algoritmo all esecuzione q Come deve essere formalizzato un algoritmo affinché
Cos è un algoritmo. Si dice algoritmo la descrizione di un metodo di soluzione di un problema che sia
Programmazione Un programma descrive al computer, in estremo dettaglio, la sequenza di passi necessari a svolgere un particolare compito L attività di progettare e realizzare un programma è detta programmazione
Primi passi col linguaggio C
Andrea Marin Università Ca Foscari Venezia Laurea in Informatica Corso di Programmazione part-time a.a. 2011/2012 Come introdurre un linguaggio di programmazione? Obiettivi: Introduciamo una macchina astratta
Implementazione di DFA in C
Implementazione di DFA in C Dispensa di Laboratorio di Linguaggi di Programmazione Sommario Corrado Mencar, Pasquale Lops, Stefano Ferilli Questa dispensa fornisce le linee guida per l implementazione,
Semantica e traduzione guidata dalla sintassi (cenni)
Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2013-2014 Linguaggi Formali e Compilatori Semantica e traduzione guidata dalla sintassi (cenni) Giacomo PISCITELLI Compile-time semantic evaluation
Introduzione alla programmazione. Alice Pavarani
Introduzione alla programmazione Alice Pavarani Il linguaggio C Creato da Dennis Ritchie nel 1972 presso i Bell Laboratories Linguaggio di programmazione procedurale, strutturato Linguaggio ad alto livello
