informatica di base per le discipline umanistiche

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "informatica di base per le discipline umanistiche"

Transcript

1 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia

2 sesta lezione: la codifica del testo vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia

3 La codifica digitale del testo che tipo di rappresentazione digitale del testo?

4 Il testo e la sua organizzazione intestazione capitolo titolo testo

5 Il testo e la sua struttura linguistica sintagma nominale V andare pass. rem. 3 sing. frase relativa articolo indefinito femminile singolare stanza come luogo stanze = oggetto di riscaldare tutti = soggetto

6 il testo come sequenza di caratteri Le avventure di Pinocchio Capitolo I Come andò che Maestro Ciliegia, falegname, trovò un pezzo di legno, che piangeva e rideva come un bambino. C'era una volta... - Un re! - diranno subito i miei piccoli lettori. - No, ragazzi, avete sbagliato. C'era una volta un pezzo di legno. Non era un legno di lusso, ma un semplice pezzo da catasta, di quelli che d'inverno si mettono nelle stufe e nei caminetti per accendere il fuoco e per riscaldare le stanze. Non so come andasse, ma il fatto gli è che un bel giorno questo pezzo di legno capitò nella bottega di un vecchio falegname, il quale aveva nome mastr'antonio, se non che tutti lo chiamavano maestro Ciliegia, per via della punta del suo naso, che era sempre lustra e paonazza, come una ciliegia matura.

7 Il testo come sequenza di caratteri surrogato parziale del testo originario completa equivalenza solo dal punto di vista dei caratteri che lo compongono perdita di informazione l informazione implicitamente veicolata dalla formattazione del testo relativa a: le coordinate meta-testuali il nome dell autore, il titolo, ecc. la struttura e organizzazione testuale la suddivisione logica in sezioni, capitoli, paragrafi, ecc. nessun guadagno di informazione l informazione sulla struttura linguistica rimane implicita e nascosta (come nel testo originale)

8 livelli di codifica del testo codifica di basso livello (codifica di livello 0) riguarda la rappresentazione binaria della sequenza ordinata dei caratteri codifica di alto livello arricchisce il testo codificato al livello zero con informazione relativa a dimensioni strutturali organizzazione del testo in strutture macrotestuali articolazione del testo in strutture linguistiche La codifica di alto livello permette di rendere esplicita qualsiasi interpretazione, anche di tipo linguistico, si voglia associare al testo

9 il primo passo: il livello 0 Il testo come sequenza di caratteri dietro le quinte

10 la codifica di alto livello Il testo codificato al livello zero si presenta come un manoscritto in scriptio continua

11 dietro all analogia Trascrizione di un testo a partire da un manoscritto in scriptio continua Codifica digitale di alto livello del testo entrambe rendono esplicito ciò che è congetturale e implicito con lo scopo di guidare il lettore (umano vs computer) nell interpretazione del testo

12 La codifica di alto livello compito della codifica di alto livello: dare forma alla sequenza dei caratteri del testo rendendo esplicita l informazione che è veicolata attraverso convenzioni tipografiche, testuali e linguistiche: informazioni sull organizzazione del testo (parti, titoli, paragrafi) la conoscenza linguistica necessaria per la comprensione del testo (per es. la categoria grammaticale di ciascuna parola, o i costituenti sintattici in cui si articolano le frasi del testo) più in generale ogni interpretazione che si voglia affiancare al dato testuale tracciare sentieri di lettura all interno del testo rendere machine readable informazioni sul testo e tratti del testo che altrimenti non sarebbero elaborabili dal computer

13 i caratteri nel computer MAESTRO CILIEGIA A carattere 65 codice (decimale) del carattere codifica binaria del codice del carattere I computer elaborano internamente solo sequenze di bits (0,1)

14 i caratteri nel computer Repertorio di caratteri un insieme di caratteri (es. A, a,!, à, P, ecc.) i caratteri sono entità astratte, da non confondersi con il modo in cui sono realizzati graficamente (gliphs) a, a, a, a sono tutti lo stesso carattere a la stessa realizzazione grafica può corrispondere a caratteri diversi (es. A latino e A cirillico e A greco) Set di caratteri (codice) una tabella che definisce una corrispondenza biunivoca (1-a-1) tra un repertorio di caratteri e un insieme di numeri interi non negativi a ogni carattere è assegnato un codice numerico (punto di codice o code position) Codifica di caratteri algoritmo che determina come i codici dei caratteri sono rappresentati in sequenze di bits (bytes)

15 (torna alla lezione 3) Il codice ASCII Primo standard per l assegnazione di codici a caratteri (dal 1963) set di caratteri riconosciuto da tutti i computer conosciuto come ASCII Standard o ISO-646 Codifica 7 bits ciascun punto di codice è rappresentato con il numero binario corrispondente di 7 bits in realtà 1 byte = 8 bits di cui un bit non è usato per la codifica (bit di parità) 7 bits = 2 7 punti di codice = 128 caratteri rappresentati Sufficiente per rappresentare l inglese mancano i caratteri accentati, umlaut, ecc. per rappresentare altri alfabeti occidentali

16 ASCII standard

17 Il set di caratteri ISO-Latin-1 ISO-Latin-1 (ISO o ASCII esteso) unica estensione standard di ASCII 1 byte = 8 bits = 2 8 punti di codice = 256 caratteri rappresentati sufficiente per lingue europee occidentali (italiano, francese, ecc.) ASCII Standard Caratteri di controllo

18 La famiglia di caratteri ISO set di caratteri standardizzati da ISO (International Standard Organization) Codifica 1 byte = 256 caratteri rappresentati da ciascun set Soprainsiemi dei caratteri ASCII Standard punti di codice (parte comune) ASCII punti di codice codici di controllo (non corrispondono a caratteri grafici) punti di codice (parte variabile) caratteri aggiuntivi per greco, cirillico, lingue slave, arabo, ebraico, ecc. I set di ISO-8859 sono tutti reciprocamente incompatibili Punto di codice 232 ISO (Latin-1) = è ISO (greco moderno) = θ ISO-8859 non copre lingue come giapponese, cinese, ecc.

19 The Universal Character Set UNICODE (ISO-10646) Standard internazionale che permette di rappresentare qualsiasi tipo di carattere appartenente ai sistemi grafici esistenti lingue europee, asiatiche, arabo, ebraico, cirillico, ugaritico, ecc. basato su principi di composizione dinamica dei caratteri ç = c + Assegna un numero di codice univoco ad ogni carattere è = 232 θ = 952 Risolve i problemi di incompatibilità dei sistemi ISO-8859 estende l insieme dei caratteri supportati permette la realizzazione di documenti multilingui Unicode è un soprainsieme di ASCII

20 UNICODE Circa caratteri grafici rappresentati (Unicode v. 4.0) ma i punti di codice disponibili sono più di 1 milione!! Molteplici tipi di codifica: UCS-2, UCS-4, UTF-8, UTF-16, ecc. Codifica comune UTF-8 codifica di Unicode a lunghezza variabile che usa da 1 a 4 bytes per ogni carattere UTF-8 usa 1 byte per la codifica dei caratteri corrispondenti al set ASCII totale compatibilità con la codifica ASCII ( ma non con ISO-latin 1!!!)

21 (torna alla lezione 3) UNICODE

22 la struttura di una parola a d r i a t i c o codice ASCII

23 ordinamento alfabetico ionio adriatico tirreno mediterraneo adriatico ionio mediterraneo tirreno

24 ordinamento alfabetico (II) a <? i a d <? o d r i a <? n i o min r i a t t i i c c o o la stringa che precede alfabeticamente è il risultato di una funzione di minino

25 diagramma di ordinamento inizializzazione lista non ordinata di N stringhe i = 0; NO i = N-1? SI lista ordinata test metti all i-esimo posto la stringa più piccola tra le ultime N-i stringhe istruzione i = i+1; (fai click per continuare)

26 passo di ordinamento k = i; inizializzazione incremento k = k+1; NO k = N? SI lista nuova test 1 istruzioni stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa temp; SI test 2 (fai click per continuare)

27 esempio ionio adriatico adriatico adriatico adriatico ionio tirreno tirreno tirreno mediterraneo mediterraneo mediterraneo i = 0 k = 1 stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa temp; temp = ionio stringa i-esima = stringa k-esima stringa k-esima = temp (fai click per continuare)

28 esempio ionio adriatico adriatico adriatico adriatico ionio tirreno tirreno tirreno mediterraneo mediterraneo mediterraneo i = 0 k = 2 stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa i-esima; SI NO temp ionio k = k+1 k = N? (fai click per continuare)

29 esempio ionio adriatico adriatico adriatico adriatico ionio tirreno tirreno tirreno mediterraneo mediterraneo mediterraneo i = 0 k = 3 stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa i-esima; SI NO esci temp ionio k = k+1 k = N? SI (fai click per continuare)

30 corpus, testo e unità testuali

31 definizioni corpus: collezione di testi tra loro collegati da alcune caratteristiche rilevanti rispetto a un obiettivo di studio o ricerca testo: elemento di base, tra le tanti possibili ripartizioni di un corpus, dotato di una sua omogeneità interna di contenuto o di stile unità testuale: frammento di testo individuato sulla base di unità macro-strutturali e linguistiche quali, ad esempio, il capitolo, il paragrafo o la frase

32 dati linguistici controllati fonte di dati primaria per la linguistica formale razionalista di derivazione chomskiana obiettivo dell indagine linguistica è ricostruire le conoscenze che i parlanti hanno della lingua indipendentemente dal modo in cui la usano i fenomeni tipici dell uso linguistico sono considerati rumore da cui è necessario fare astrazione limiti e problemi dei dati controllati le intuizioni dei parlanti non sono sempre chiare e distinte la ragazza che ci sono uscito ieri (???) la maggior parte di noi non leggono abbastanza (???) esperimenti in vitro eccessivo grado di idealizzazione e astrazione rispetto all uso effettivo del linguaggio

33 dati linguistici ecologici I corpora rappresentano fonti di dati linguistici ecologici, ovvero raccolti nei loro habitat naturali lingua scritta libri (saggistica, narrativa, poesia, ecc.), giornali, riviste, pagine Web, produzioni effimere ( , pubblicità, chat, volantini, ecc. lingua parlata (trascritta) notiziari radio-televisivi, conversazioni telefoniche, conversazioni facciaa-faccia, ecc.

34 tipologia ed uso principali usi dei corpora applicativo tipico dell ingegneria del linguaggio, per progettare strumenti: dotati di conoscenze linguistiche direttamente ricavate da dati rappresentativi di un certo dominio o varietà di linguaggio robusti e ben adattati al linguaggio reale analitico per fondare analisi e descrizioni linguistiche sull effettiva distribuzione delle costruzioni e fenomeni all interno di un linguaggio, al fine di valutare ipotesi teoriche sulla sua forma ed organizzazione

35 tipi di corpora corpus specialistico orientato alla descrizione di una particolare varietà del linguaggio (sublanguage) o ad un ristretto dominio applicativo analisi della terminologia biomedica, ecc. linguaggio infantile linguaggio sportivo, economico, ecc. linguaggio patologico corpus generale o di riferimento (reference corpus) trasversale rispetto alle diverse varietà di un linguaggio L plurifunzionale orientato a rappresentare tutti gli aspetti caratteristici di L, proponendosi come risorsa di riferimento per la descrizione di L può essere organizzato in vari sottocorpora specializzati per varietà di L

36 tipi di corpora corpus sincronico descrive un particolare stadio del linguaggio (i testi appartengono tutti ad una stessa finestra temporale) corpus diacronico descrive il mutamento linguistico (i testi appartengono a diverse finestre temporali) corpus monolingue contiene testi di una sola lingua corpus bi/plurilingue corpus parallelo lo stesso testo è rappresentato (in traduzione) in più di una lingua corpus allineato ciascuna frase (parola) della lingua L1 è esplicitamente collegata col suo traducente nella lingua L2 corpus comparabile testi in più lingue (non in traduzione) appartenenti alle stesse tipologie (ciascuna lingua è rappresentata da testi diversi)

37 tipi di corpora corpus di scritto solo testi di linguaggio scritto corpus di parlato solo trascrizioni di linguaggio parlato corpus misto testi scritti e trascrizioni di parlato (in proporzioni variabili) speech database campioni di linguaggio parlato in forma di segnale acustico (più eventualmente la trascrizione ortografica) corpus multimediale testi scritti, video, parlato in forma di segnato acustico, ecc.

38 dimensione del corpus corpus chiuso corpus standard tradizionale la quantità di testi e di parole è prefissata all inizio del progetto corpus statico : fotografa un particolare stadio linguistico corpus aperto (monitor corpus, Sinclair 1991) nuovi testi sono continuamente aggiunti alla collezione, secondo le proporzioni decise in fase progettuale corpus dinamico, ideale per studiare l evoluzione del linguaggio

39 british national corpus (BNC) Corpus del British English ( ) creato da un consorzio accademico (Oxford, Lancaster, ecc.) ed editoriale (Oxford University Press, Longman, ecc.) Dimensione: 100 milioni di parole Tratti caratteristici generale monolingue sincronico misto 90% testi scritti di vari generi 10% testi di parlato trascritto (conversazioni spontanee)

40 parole corpora multilingue comparabili per 14 lingue europee catalano, danese, finlandese, francese, francese belga, greco, inglese, irlandese, italiano, norvegese olandese, portoghese, svedese, tedesco tutti i corpora sono stati costruiti secondo criteri e specifiche uniformi PAROLE-Italiano ( ) realizzato presso l ILC-CNR (Pisa) Dimensione: 21 milioni di parole tratte da testi scritti di vari generi (libri, giornali periodici, miscellanee) attualmente portate a oltre 70 milioni tratti caratteristici generale sincronico (internamente) monolingue dex.htm

41 parole

42 corpora paralleli Canadian Hansard Corpus (2001) 1,3 milioni di frasi francesi-inglesi allineate a livello di frase, tratte dagli atti del Parlamento Canadese

43 corpora paralleli MULTEXT (1996) 5 milioni di parole dal Journal of European Community (francese, italiano, spagnolo, tedesco, inglese) parole allineate a livello di frase (inglese come lingua pivot )

44 sesta lezione la codifica del testo fine sesta lezione (lezione 7)

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica digitale del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento di Linguistica

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia quinta lezione: la matematica delle parole

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Codifica del testo digitale 30 settembre 2014 Strumenti e risorse per la linguistica computazionale Tre requisiti per la linguistica computazionale e NLP dati linguistici corpora

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento

Dettagli

Rappresentazione di dati: caratteri di testo. Appunti a cura del prof. Ing. Mario Catalano

Rappresentazione di dati: caratteri di testo. Appunti a cura del prof. Ing. Mario Catalano Rappresentazione di dati: caratteri di testo Appunti a cura del prof. Ing. Mario Catalano Come si presenta un testo di un documento da un programma di videoscrittura Testo formattato Per migliorare la

Dettagli

Analogico VS Digitale. Numeri e Testi

Analogico VS Digitale. Numeri e Testi Analogico VS Digitale Numeri e Testi Il calcolatore: modello architetturale 1. Elaborazione Unità Centrale di Elaborazione Interconnessione 2. Memorizzazione Memoria RAM Hard Disk Collegamenti (BUS/Cavi)

Dettagli

IDUL Informazione su computer. Informazione su computer CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE.

IDUL Informazione su computer. Informazione su computer CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE. IDUL 2011 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)

Dettagli

La codifica digitale dei testi. Daniela Trotta

La codifica digitale dei testi. Daniela Trotta La codifica digitale dei testi Daniela Trotta dtrotta@unisa.it The lexicographic data that are available in computer form as of today are the following: published dictionaries [ ], electronic dictionaries

Dettagli

1.2d: La codifica Digitale dei caratteri

1.2d: La codifica Digitale dei caratteri 1.2d: La codifica Digitale dei caratteri 2 12 ott 2011 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 12 ott 2011 La codifica dei caratteri Un testo

Dettagli

1.2d: La codifica Digitale dei caratteri

1.2d: La codifica Digitale dei caratteri 1.2d: La codifica Digitale dei caratteri 2 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 La codifica dei caratteri Un testo è rappresentato attraverso

Dettagli

Linguistica Computazionale Corpora

Linguistica Computazionale Corpora Linguistica Computazionale Corpora Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Ludici Adattati da Alessandro Lenci Dipartimento di Linguistica T. Bolelli Dati

Dettagli

Linguistica Computazionale Corpora

Linguistica Computazionale Corpora Linguistica Computazionale Corpora Salvatore Sorce Dipartimento dell Innovazione Industriale e Digitale Ingegneria Chimica Gestionale Informatica Meccanica Ludici Adattati da Alessandro Lenci Dipartimento

Dettagli

La rappresentazione delle informazioni

La rappresentazione delle informazioni Procedimento di codifica La rappresentazione delle informazioni Come il computer rappresenta le informazioni Il computer per lavorare sui dati, ha bisogno che questi siano espressi come sequenze di 1 e

Dettagli

Modulo 1: Le I.C.T. UD 1.2d: La codifica Digitale dei caratteri

Modulo 1: Le I.C.T. UD 1.2d: La codifica Digitale dei caratteri Modulo 1: Le I.C.T. : La codifica Digitale dei caratteri Prof. Alberto Postiglione Corso di Informatica Generale (AA 07-08) Corso di Laurea in Scienze della Comunicazione Università degli Studi di Salerno

Dettagli

IDUL 2011 CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE

IDUL 2011 CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE IDUL 2011 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)

Dettagli

La rappresentazione dei caratteri

La rappresentazione dei caratteri Università degli Studi dell Insubria Dipartimento di Scienze Teoriche e Applicate La rappresentazione dei caratteri Necessità della rappresentazione dei caratteri Un calcolatore che fosse unicamente in

Dettagli

La codifica digitale del testo

La codifica digitale del testo La codifica digitale del testo Codifica digitale La codifica Il computer elabora esclusivamente numeri binari. Le informazioni per essere trattate ed elaborate dal computer devono essere prima trasformate

Dettagli

I set di caratteri WWW. Fabio Vitali 5 novembre 1999

I set di caratteri WWW. Fabio Vitali 5 novembre 1999 I set di caratteri Fabio Vitali 5 novembre 1999 Introduzione Qui esaminiamo in breve: Il problema della codifica dei caratteri ASCII (7 bit ed esteso) ISO/IEC 10646 e UNICODE UCS e UTF 2 I set di caratteri

Dettagli

CODIFICA DI CARATTERI

CODIFICA DI CARATTERI CODIFICA DI CARATTERI Associando un simbolo dell alfabeto ad ogni numero possiamo codificare tutte le lettere Codifica ASCII (American Standard Code for Information Interchange): Caratteri speciali, punteggiatura,

Dettagli

La linguistica dei corpora

La linguistica dei corpora La linguistica dei corpora 1 Argomenti trattati nella lezione: DEFINIZIONE ESEMPIO DI UTILIZZO COSTRUZIONE CODIFICA E ANNOTAZIONE STANDARD DI CODIFICA E ANNOTAZIONE ANALISI DI UN CORPUS LE APPLICAZIONI

Dettagli

La rappresentazione delle informazioni

La rappresentazione delle informazioni La rappresentazione delle informazioni In queste pagine cercheremo di capire come sia possibile rappresentare mediante numeri e memorizzare in un file testi, immagini, video, suoni... Il computer per lavorare

Dettagli

Calcolatori Elettronici I

Calcolatori Elettronici I Calcolatori Elettronici I Prof. Roberto Canonico Dipartimento di Ingegneria Elettrica e delle Tecnologie dell Informazione A.A. 2018-2019 1 Codice ASCII ASCII (American Standard Code for Information Interchange)

Dettagli

La rappresentazione dell informazione. Capitolo 5 Fluency Conoscere e usare l informatica

La rappresentazione dell informazione. Capitolo 5 Fluency Conoscere e usare l informatica La rappresentazione dell informazione Capitolo 5 Fluency Conoscere e usare l informatica Quanti sono? Nel mondo ci sono 10 tipi di persone quelli che capiscono il codice binario e quelli che non lo capiscono.

Dettagli

Tabella dei codici ASCII standard

Tabella dei codici ASCII standard Tabella dei codici standard 0 00000000 0 nul 43 00101011 2B + 86 01010110 56 V 1 00000001 1 soh 44 00101100 2C, 87 01010111 57 W 2 00000010 2 stx 45 00101101 2D - 88 01011000 58 X 3 00000011 3 etx 46 00101110

Dettagli

IDUL /05/2013. Informazione su computer. Informazione su computer CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE

IDUL /05/2013. Informazione su computer. Informazione su computer CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE IDUL 2011 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)

Dettagli

CODIFICA DI CARATTERI

CODIFICA DI CARATTERI CODIFICA DI CARATTERI Associando un simbolo dell alfabeto ad ogni numero possiamo codificare tutte le lettere Codifica ASCII (American Standard Code for Information Interchange): Caratteri speciali, punteggiatura,

Dettagli

19/09/14. Il codice ASCII. Altri codici importanti. Extended ASCII. Tabella del codice ASCII a 7 bit. Prof. Daniele Gorla

19/09/14. Il codice ASCII. Altri codici importanti. Extended ASCII. Tabella del codice ASCII a 7 bit. Prof. Daniele Gorla Il codice ASCII ASCII è un acronimo per American Standard Code for Information Interchange Nato nell IBM nel 1961, diventa standard ISO (International Organization for Standardization) nel 1968. Codifica

Dettagli

LE AREE TRATTEGGIATE SONO I MARGINI DI UNA TABELLA WORD E SONO PURAMENTE INDICATIVI: CANCELLARE LE SCRITTE ED INSERIRE I CONTENUTI.

LE AREE TRATTEGGIATE SONO I MARGINI DI UNA TABELLA WORD E SONO PURAMENTE INDICATIVI: CANCELLARE LE SCRITTE ED INSERIRE I CONTENUTI. NOME: COGNOME: CLASSE: DATA: _ LE AREE TRATTEGGIATE SONO I MARGINI DI UNA TABELLA WORD E SONO PURAMENTE INDICATIVI: CANCELLARE LE SCRITTE ED INSERIRE I CONTENUTI. NOME: COGNOME: CLASSE: DATA: N O M

Dettagli

Informatica per le discipline umanistiche 2

Informatica per le discipline umanistiche 2 Informatica per le discipline umanistiche 2 Rappresentazione dell informazione Rappresentazione dell informazione Informatica: studio sistematico degli algoritmi che descrivono e trasformano l informazione:

Dettagli

Annotazione del testo

Annotazione del testo Università Ca Foscari di Venezia Linguistica Informatica Mod. 1 Anno Accademico 2010-2011 Annotazione del testo Rocco Tripodi rocco@unive.it Ricostruzione Filologia Ricostruire la forma originaria dei

Dettagli

IDUL 2010. Decidere orario per esercitazioni (con Doodle) Informazione su computer. Informazione su computer

IDUL 2010. Decidere orario per esercitazioni (con Doodle) Informazione su computer. Informazione su computer Decidere orario per esercitazioni (con Doodle) IDUL 2010 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE Inizio: settimana del 12 per Bucchiarone; del 19 per Cavulli Esercitazione per i filosofi

Dettagli

LABORATORIO DI INFORMATICA

LABORATORIO DI INFORMATICA LABORATORIO DI INFORMATICA Corso di laurea in Scienze della Formazione Primaria a.a.2014/2015 A cura del Prof. Sergio Miranda 2 LEZIONE N.5 Codifica delle Informazioni LA CODIFICA DEI NUMERI Obiettivo:

Dettagli

Codifica dell Informazione

Codifica dell Informazione Francesco Folino CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati e istruzioni in un formato tale che l esecutore automatico

Dettagli

Codifica dei caratteri

Codifica dei caratteri Codifica dei caratteri Argomenti Codifica ASCII a 7-bit ( US-ASCII ) Codifiche ASCII estese ISO 8859-1 (Latin 1) Standard Unicode Codifica UTF-8 Codifica UTF-16 Codifica UTF-32 Prof. Marco Camurri 98 ASCII

Dettagli

Rappresentazione dell informazione

Rappresentazione dell informazione Rappresentazione dell informazione Informatica@Matematica Simone Martini a.a. 2015-2016 1/21 Parte I Rappresentare l informazione 2/21 Omnia in... numero Unico tipo disponibile alla macchina fisica: parole

Dettagli

La rappresentazione dell informazione

La rappresentazione dell informazione Fluency La rappresentazione dell informazione Capitolo 5 Quanti sono? Nel mondo ci sono 10 tipi di persone quelli che capiscono il codice binario e quelli che non lo capiscono. Simboli tasti del telefonino

Dettagli

Un quadro della situazione. Lezione 6 Aritmetica in virgola mobile (2) e Codifica dei caratteri. Dove siamo nel corso. Organizzazione della lezione

Un quadro della situazione. Lezione 6 Aritmetica in virgola mobile (2) e Codifica dei caratteri. Dove siamo nel corso. Organizzazione della lezione Un quadro della situazione Lezione 6 Aritmetica in virgola mobile (2) e Codifica dei caratteri Vittorio Scarano Architettura Corso di Laurea in Informatica Università degli Studi di Salerno Input/Output

Dettagli

Codifica dell Informazione

Codifica dell Informazione Introduzione all Informatica Fabrizio Angiulli Codifica dell Informazione CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati

Dettagli

Simboli, abbreviazioni e notazioni convenzionali... 21

Simboli, abbreviazioni e notazioni convenzionali... 21 Indice Premessa... 15 1. Per uno studio della sintassi marcata dell italiano dell uso medio... 15 2. Obiettivi della ricerca e contenuti del volume... 16 3. Nota sugli autori e ringraziamenti... 19 Simboli,

Dettagli

Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale

Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale Paolo Mereghetti DISCo Dipartimento di Informatica, Sistemistica e Comunicazione Rappresentazione dell Informazione Prima

Dettagli

Argomenti trattati. Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni

Argomenti trattati. Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni Argomenti trattati Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni Informazione mi dai il numero di Andrea? 0817651831 Il numero

Dettagli

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2)

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2) Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,

Dettagli

Concetti di base dell ICT

Concetti di base dell ICT Informatica Linguaggio di programmazione Computer Bit Algoritmo Linguaggio macchina Informatica: Informazione automatica Gli anglosassoni usano il termine Computer Science = Scienza dei Calcolatori Computer:

Dettagli

Pag. 1. La Rappresentazione e la Codifica delle informazioni (parte 2) Tipi di dati. Informatica Facoltà di Medicina Veterinaria

Pag. 1. La Rappresentazione e la Codifica delle informazioni (parte 2) Tipi di dati. Informatica Facoltà di Medicina Veterinaria 1 Università degli studi di Parma Dipartimento di Ingegneria dell Informazione Informatica a.a. 2012/13 Tipi di dati Informatica Facoltà di Medicina Veterinaria La Rappresentazione e la Codifica delle

Dettagli

Prof. Maristella Agosti, Ing. Marco Dussin

Prof. Maristella Agosti, Ing. Marco Dussin Università degli Studi di Padova Facoltà di Lettere e Filosofia Progettazione di siti web (ING-INF/05) LMSGC, mutuato da LMLIN e Sc. Stat. a.a. 2010-11 Indice: Prof. Maristella Agosti, Ing. Marco Dussin

Dettagli

Tecnologie per il web e lo sviluppo multimediale. Rappresentazione delle informazioni

Tecnologie per il web e lo sviluppo multimediale. Rappresentazione delle informazioni Tecnologie per il web e lo sviluppo multimediale Rappresentazione delle informazioni Luca Pulina Corso di Laurea in Scienze della Comunicazione Università degli Studi di Sassari A.A. 2015/2016 Luca Pulina

Dettagli

Rappresentazione e Codifica dell Informazione

Rappresentazione e Codifica dell Informazione Rappresentazione e Codifica dell Informazione Capitolo 1 Chianese, Moscato, Picariello, Alla scoperta dei fondamenti dell informatica un viaggio nel mondo dei BIT, Liguori editore. ***disclaimer *** Quest

Dettagli

Linguaggi, Traduttori e le Basi della Programmazione

Linguaggi, Traduttori e le Basi della Programmazione Corso di Laurea in Ingegneria Civile Politecnico di Bari Sede di Foggia Fondamenti di Informatica Anno Accademico 2011/2012 docente: Prof. Ing. Michele Salvemini Sommario Il Linguaggio I Linguaggi di Linguaggi

Dettagli

Gestione dei caratteri

Gestione dei caratteri AA 2012-2013 Tipi di variabili Caratteri 26 lettere maiuscole (A - Z) 26 lettere minuscole (a - z) 10 cifre (0-9) vari simboli: ( )!? \ & * % # $ lettere e simboli speciali, ad esempio á é ç Numeri naturali

Dettagli

Hardware, software, codifica informazioni

Hardware, software, codifica informazioni 1 LEZIONE 2 Hardware, software, codifica informazioni I DUE LIVELLI DELLE TECNOLOGIE INFORMATICHE (1/2) L hardware è la parte del computer che puoi prendere a calci; il software quella contro cui puoi

Dettagli

Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione

Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,

Dettagli

Analogico vs digitale

Analogico vs digitale Analogico vs digitale Informazione classificatoria e più che classificatoria Informazione classificatoria: è questo, ma avrebbe potuto essere quest altro altro. Informazione più che classificatoria: riconoscere

Dettagli

Sistemi di elaborazione delle informazioni. Palmino Sacco

Sistemi di elaborazione delle informazioni. Palmino Sacco Sistemi di elaborazione delle informazioni Palmino Sacco www.radiologiasiena.it sacco@unisi.it LEZIONE 2 Il trattamento delle informazioni www.radiologiasiena.it sacco@unisi.it Nel 1833 un professore di

Dettagli

Lez. 8 La Programmazione. Prof. Pasquale De Michele (Gruppo 2) e Raffaele Farina (Gruppo 1) 1

Lez. 8 La Programmazione. Prof. Pasquale De Michele (Gruppo 2) e Raffaele Farina (Gruppo 1) 1 Lez. 8 La Programmazione Prof. Pasquale De Michele (Gruppo 2) e Raffaele Farina (Gruppo 1) 1 Dott. Pasquale De Michele Dott. Raffaele Farina Dipartimento di Matematica e Applicazioni Università di Napoli

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia (per iniziare ) prima lezione introduzione:

Dettagli

La rappresentazione dell informazione

La rappresentazione dell informazione La rappresentazione dell informazione Parte I Su questa parte vi fornirò dispense Sui testi di approfondimento: leggere dal Cap. del testo C (Console, Ribaudo):.,. fino a pg.6 La rappresentazione delle

Dettagli

La Rappresentazione dell Informazione

La Rappresentazione dell Informazione La Rappresentazione dell Informazione Parte III I codici Codici a.a. 27-28 Un codice è una funzione che associa ad una sequenza di simboli un significato Codice : {entità} {sequenze di simboli} Un codice

Dettagli

Il concetto di informazione

Il concetto di informazione Il concetto di informazione Qualunque informazione è definita tramite tre caratteristiche fondamentali: 1. Valore indica il particolare elemento assunto dall informazione 2. Tipo indica l insieme degli

Dettagli

Il quadro di riferimento delle prove di italiano del Servizio Nazionale di Valutazione

Il quadro di riferimento delle prove di italiano del Servizio Nazionale di Valutazione Mimma Siniscalco Il quadro di riferimento delle prove di italiano del Servizio Nazionale di Valutazione Palermo, 25 ottobre 2011 Senso Per chi costruisce la prova: permette di pianificare e guidare il

Dettagli

Codifica informazione testuale

Codifica informazione testuale Rappresentazione del: Codifica informazione testuale contenuto : successione di parole che costituiscono il documento Formato: modo in cui le parole sono organizzate e rappresentate graficamente. Può migliorare

Dettagli

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno. Trasferimento Ambiente esterno Controllo Informatica Mario Pavone - Dept. Mathematics & Computer Science - University of Catania mpavone@dmi.unict.it Rappresentazione dell Informazione L informazione viene

Dettagli

Informatica e Bioinformatica: Rappresentazione dell Informazione

Informatica e Bioinformatica: Rappresentazione dell Informazione Informatica e Bioinformatica: Rappresentazione dell Informazione Date TBD Sommario Il calcolatore è in grado di elaborare differenti tipi di informazione numeri, caratteri, immagini, suoni, video Informazione

Dettagli

Informazione e sua rappresentazione: codifica

Informazione e sua rappresentazione: codifica Corso di Calcolatori Elettronici I Informazione e sua rappresentazione: codifica ing. Alessandro Cilardo Corso di Laurea in Ingegneria Biomedica Il concetto di informazione Qualunque informazione è definita

Dettagli

La codifica binaria: concetti fondamentali

La codifica binaria: concetti fondamentali La codifica binaria: concetti fondamentali Ingegneria Meccanica e dei Materiali Università degli Studi di Brescia Prof. Massimiliano Giacomin ... Algoritmi, dati e risultati sono informazioni Informatica

Dettagli

I.4 Rappresentazione dell informazione

I.4 Rappresentazione dell informazione I.4 Rappresentazione dell informazione Università di Ferrara Dipartimento di Economia e Management Insegnamento di Informatica Ottobre 13, 2015 Argomenti Introduzione 1 Introduzione 2 3 L elaboratore Introduzione

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia (per iniziare ) seconda lezione informazioni

Dettagli

Sistemi di Elaborazione delle Informazioni 6 CFU

Sistemi di Elaborazione delle Informazioni 6 CFU Università degli Studi di Palermo Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica Sistemi di Elaborazione delle Informazioni 6 CFU Anno Accademico 2015/2016 Docente: ing. Salvatore

Dettagli

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio Messaggio Insieme di sequenze di simboli, le parole,

Dettagli

Corso di Informatica

Corso di Informatica CdLS in Odontoiatria e Protesi Dentarie Corso di Informatica Prof. Crescenzio Gallo crescenzio.gallo@unifg.it La Codifica 2 Informazioni Numeri Naturali Relativi Reali Testi Informazioni tradizionali Immagini

Dettagli

Teoria dell Informazione

Teoria dell Informazione Corso di Laurea Magistrale in Scienze dell Informazione Editoriale, Pubblica e Sociale Teoria dell Informazione Cosa è l informazione L informazione è qualcosa che si possiede e si può dare ad un altro

Dettagli

Programmi e Oggetti Software

Programmi e Oggetti Software Corso di Laurea Ingegneria Civile Fondamenti di Informatica Dispensa 06 Programmi e Oggetti Software Marzo 2010 Programmi e Oggetti Software 1 Contenuti Cosa è un programma Cosa significa programmare Il

Dettagli

Definizioni. Esempi di alfabeti

Definizioni. Esempi di alfabeti Definizioni SIMBOLO: entità minima significativa STRINGA: sequenza finita di simboli giustapposti (lunghezza della stringa, stringa vuota) ALFABETO: insieme finito di simboli LINGUAGGIO: insieme di stringhe

Dettagli

Caratteristiche di un linguaggio ad alto livello

Caratteristiche di un linguaggio ad alto livello Caratteristiche di un linguaggio ad alto livello Un linguaggio ad alto livello deve offrire degli strumenti per: rappresentare le informazioni di interesse dell algoritmo definire le istruzioni che costituiscono

Dettagli

La codifica dell informazione

La codifica dell informazione La codifica dell informazione Ci sono tipi di persone in questo mondo, quelli che capiscono il binario e quelli che non lo capiscono. Michael Gittelsohn (?!) Parte I Sui testi di approfondimento: leggere

Dettagli

Rappresentazione della informazione

Rappresentazione della informazione Rappresentazione della informazione Rappresentazione digitale dei dati Numeri interi Numeri reali Caratteri (C++: int) (C++ float e double) (C++ char) Memoria del calcolatore è finita L insieme dei numeri

Dettagli

LA CODIFICA DELL INFORMAZIONE. Prof. Enrico Terrone A. S: 2014/15

LA CODIFICA DELL INFORMAZIONE. Prof. Enrico Terrone A. S: 2014/15 LA CODIFICA DELL INFORMAZIONE Prof. Enrico Terrone A. S: 2014/15 Lo schema di Tanenbaum Il livello al quale ci interessiamo in questa lezione è il linguaggio macchina, l unico dove le informazioni e istruzioni

Dettagli

La rappresentazione delle Informazioni

La rappresentazione delle Informazioni La rappresentazione delle Informazioni Nella vita di tutti i giorni siamo abituati ad avere a che fare con vari tipi di informazioni, di natura e forma diversa, così come siamo abituati a diverse rappresentazioni

Dettagli

Linguistica dei corpora. Daniela Trotta

Linguistica dei corpora. Daniela Trotta Linguistica dei corpora Daniela Trotta dtrotta@unisa.it Competenze del linguista computazionale 1. capacità di selezionare e raccogliere i dati linguistici 2. conoscenza di metodi formali 3. padronanza

Dettagli

Rappresentazione digitale delle informazioni

Rappresentazione digitale delle informazioni Rappresentazione digitale delle informazioni Informazione oggi Informatica: disciplina che studia l elaborazione automatica di informazioni. Elaboratore: sistema per l elaborazione automatica delle informazioni.

Dettagli

LA CODIFICA DELL INFORMAZIONE

LA CODIFICA DELL INFORMAZIONE LA CODIFICA DELL INFORMAZIONE Prof. Enrico Terrone A. S: 20/2 Lo schema di Tanenbaum Il livello al quale ci interessiamo in questa lezione è il linguaggio macchina, l unico dove le informazioni e istruzioni

Dettagli

Sistema di numerazione binario

Sistema di numerazione binario Sistema di numerazione binario Liberamente tratto da: Wikipedia, l'enciclopedia libera http://www.lezionidimatematica.net/ Il sistema numerico binario è un sistema numerico posizionale in base 2. Posizionale

Dettagli

Codifica dell'informazione

Codifica dell'informazione Codifica dell'informazione Codifica di grandezze numeriche Sono stati i primi ad avere una rappresentazione in informatica Digitale contrapposto ad analogico Digitale = rappresentato con numeri o che opera

Dettagli

Lez. 5 La Programmazione. Prof. Salvatore CUOMO

Lez. 5 La Programmazione. Prof. Salvatore CUOMO Lez. 5 La Programmazione Prof. Salvatore CUOMO 1 2 Programma di utilità: Bootstrap All accensione dell elaboratore (Bootsrap), parte l esecuzione del BIOS (Basic Input Output System), un programma residente

Dettagli

ALGORITMI: PROPRIETÀ FONDAMENTALI

ALGORITMI: PROPRIETÀ FONDAMENTALI ALGORITMI: PROPRIETÀ FONDAMENTALI Non si può risolvere un problema senza prima fissare un insieme di azioni, i di mosse elementari possibili per l'esecutore. Bisogna conoscerne le caratteristiche, le mosse

Dettagli

Architettura di un elaboratore. Rappresentazione dell informazione digitale

Architettura di un elaboratore. Rappresentazione dell informazione digitale Architettura di un elaboratore Rappresentazione dell informazione digitale Rappresentazione dell informazione digitale L informatica è la scienza della rappresentazione e dell elaborazione dell informazione.

Dettagli

Fondamenti di Informatica

Fondamenti di Informatica Fondamenti di Informatica Introduzione al Digitale [Sez: 2.3, 2.4, 2.5] Prof. De Maio Carmen cdemaio@unisa.it Analogico/Digitale Segnale analogico - come un onda (es. sonora, luminosa) che trasporta informazioni,

Dettagli

Programmi e Oggetti Software

Programmi e Oggetti Software Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1 Dispensa 2 Programmi e Oggetti Software Alfonso Miola Settembre 2007 http://www.dia.uniroma3.it/~java/fondinf1/ Programmi e Oggetti Software

Dettagli

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno. Trasferimento Ambiente esterno Controllo Informatica Mario Pavone - Dept. Mathematics & Computer Science - University of Catania mpavone@dmi.unict.it Cos è l Informatica La scienza della rappresentazione

Dettagli

La rappresentazione delle Informazioni

La rappresentazione delle Informazioni La rappresentazione delle Informazioni Nella vita di tutti i giorni siamo abituati ad avere a che fare con vari tipi di informazioni, di natura e forma diversa, così come siamo abituati a diverse rappresentazioni

Dettagli

Laboratorio di Informatica per chimica industriale e chimica applicata e ambientale

Laboratorio di Informatica per chimica industriale e chimica applicata e ambientale Laboratorio di Informatica per chimica industriale e chimica applicata e ambientale LEZIONE 10 Rappresentazione delle informazioni non numeriche 1 Rappresentazione delle informazioni Nella memoria del

Dettagli

Cominciamo ad analizzare la rappresentazione delle informazioni... di Cassino. C. De Stefano Corso di Fondamenti di Informatica Università degli Studi

Cominciamo ad analizzare la rappresentazione delle informazioni... di Cassino. C. De Stefano Corso di Fondamenti di Informatica Università degli Studi Un linguaggio ad alto livello deve offrire degli strumenti per: rappresentare le informazioni di interesse dell algoritmo definire le istruzioni che costituiscono l algoritmo Cominciamo ad analizzare la

Dettagli

Il concetto di calcolatore e di algoritmo

Il concetto di calcolatore e di algoritmo Il concetto di calcolatore e di algoritmo Elementi di Informatica e Programmazione Percorso di Preparazione agli Studi di Ingegneria Università degli Studi di Brescia Docente: Massimiliano Giacomin Informatica

Dettagli