1.2d: La codifica Digitale dei caratteri

Documenti analoghi
Modulo 1: Le I.C.T. UD 1.2d: La codifica Digitale dei caratteri

1.2d: La codifica Digitale dei caratteri

Prof. Alberto Postiglione Scienze della Comunicazione. Università degli Studi di Salerno

La rappresentazione delle informazioni

Rappresentazione di dati: caratteri. Appunti a cura del prof. Ing. Mario Catalano

La rappresentazione delle Informazioni

La codifica dei caratteri di un testo

Pag. 1. La Rappresentazione e la Codifica delle informazioni (parte 2) Tipi di dati. Informatica Facoltà di Medicina Veterinaria

Argomenti trattati. Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni

Un quadro della situazione. Lezione 6 Aritmetica in virgola mobile (2) e Codifica dei caratteri. Dove siamo nel corso. Organizzazione della lezione

Esame di Informatica. Facoltà di Scienze Motorie LE UNITA DI MISURA (1/4) LE UNITA DI MISURA (3/4) LE UNITA DI MISURA (2/4) Lezione 2

Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale

Codifica informazione testuale

Informatica di Base 1 Linea 1

Rappresentazione dei numeri naturali. La codifica associa alle informazioni dell alfabeto sorgente uno o più simboli dell alfabeto codice:

Rappresentazione di dati: caratteri di testo. Appunti a cura del prof. Ing. Mario Catalano

Tecnologie per il web e lo sviluppo multimediale. Rappresentazione delle informazioni

La Rappresentazione dell Informazione

Rappresentazione di dati: numerazione binaria. Appunti per la cl. 3 Di A cura del prof. Ing. Mario Catalano

Codifica dell Informazione

La codifica del testo

Codifica dell Informazione

Corso di Informatica A (A-L) Corso di Laurea in Scienze e Tecniche Psicologiche a.a 2005/06. Obiettivi del corso. Prof. ssa Maria Luisa Sapino

Rappresentazione delle Informazioni. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San Giovanni

Rappresentazione dell informazione

Numeri e caratteri in binario. Prof.ssa Antonella Serra

La codifica digitale del testo

Rappresentazione digitale delle informazioni

CODIFICA DI CARATTERI

Linguistica Computazionale

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Informatica. Informatica. Grandezze digitali. Grandezze analogiche

Tabella dei codici ASCII standard

19/09/14. Il codice ASCII. Altri codici importanti. Extended ASCII. Tabella del codice ASCII a 7 bit. Prof. Daniele Gorla

Somma di numeri binari

La rappresentazione dell informazione

Informazione e sua rappresentazione: codifica

Sistemi di Elaborazione delle Informazioni 6 CFU

Codici binari decimali

LA CODIFICA DELL INFORMAZIONE. Introduzione ai sistemi informatici D. Sciuto, G. Buonanno, L. Mari, McGraw-Hill Cap.2

La codifica. dell informazione

I set di caratteri WWW. Fabio Vitali 5 novembre 1999

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.

modificato da andynaz Cambiamenti di base Tecniche Informatiche di Base

Prof. Maristella Agosti, Ing. Marco Dussin

La "macchina" da calcolo

Aspetti dell informazione

Rapida Nota sulla Rappresentazione dei Caratteri

Rappresentazione dell Informazione

Tipi di elaboratori Rappresentazione della informazione Codifica della informazione

Quante informazioni posso rappresentare con n bit?

La codifica dell informazione

I sistemi di numerazione. Informatica - Classe 3ª, Modulo 1

La codifica binaria. Fondamenti di Informatica. Daniele Loiacono

Il Modello di von Neumann (2) Prevede 3 entità logiche:

La Rappresentazione Dell Informazione

La codifica digitale

Codici. Introduzione. Sia A un insieme finito di simboli e C=A n l insieme di tutte le parole composte da n simboli di A

Calcolatore e unità di misura

Laboratorio di Architettura lezione 11. La scorsa lezione. Motivi? Word e bytes

Esame di Informatica A.A. 2012/13

La codifica. dell informazione

La Rappresentazione dell Informazione. Prof.Ing.S.Cavalieri

Corso di Informatica

Concetti di base dell ICT

Sistemi di Elaborazione delle Informazioni

Modulo 1. Concetti base della Tecnologia dell informazione. Prof. Nicolello Cristiano. Modulo 1

Informatica di Base - 6 c.f.u.

Insegnamento Informatica CdS Scienze Giuridiche

RAPPRESENTAZIONE DELLE INFORMAZIONI

Programma del corso. Rappresentazione delle Informazioni. Introduzione agli algoritmi. Architettura del calcolatore

CODIFICA DEL TESTO 0???????

Differenza tra Hardware e Software del Computer. Cos'è un Software. Software di Base

Il sistema binario: bit e Byte Codifica del testo Il Byte come U.d.M. dell'informazione Multipli del Byte

La codifica binaria. Informatica B. Daniele Loiacono

Calcolatori: Rappresentazione dei Dati e Aritmetica binaria

Elaborazione dell informazione. Elaborazione dell informazione. Rappresentazione dei numeri INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042)

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Sistemi di numerazione. Sistema binario, o1ale, esadecimale Rappresentazione delle informazioni

I.4 Rappresentazione dell informazione

Rappresentazione binaria. Laboratorio di Informatica. Calcolatori digitali. N: numeri naturali. La codifica binaria. I primi 16 numeri binari

Concetti di base. Riferimenti

Definizione ACM (Association for Computing Machinery)

Porte Input/Output (I/O Connectors)

Informazione e sua rappresentazione: codifica

Grammatiche Parse trees Lezione del 17/10/2012

Dispensa di Informatica I.2

Rappresentazione dell Informazione. Sistemi di Elaborazione delle Informazioni Rappresentazione Informazione 1

Introduzione e Nozioni di Base. Prof. Thomas Casali

Codifica binaria dell informazione

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

Corso di Laurea Ingegneria Civile Fondamenti di Informatica

La codifica binaria. Informatica B. Daniele Loiacono

Informatica per la Storia dell Arte

Rappresentazione informazione ed elementi di aritmetica dei computer

Bit, Byte, Word e Codifica Dati

Codifica dell'informazione

Esercitazione 1 Codifica e Rappresentazione dell Informazione Istruzioni Assembly MIPS

Descrizione delle operazioni di calcolo. Espressioni costanti semplici

Lena Cota Guido Corso di Informatica - II livello. Tastiera. Conoscenza e utilizzo della periferica

Transcript:

1.2d: La codifica Digitale dei caratteri

2 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi

3 La codifica dei caratteri Un testo è rappresentato attraverso una successione di caratteri Ogni carattere viene scelto all interno di un insieme finito e piuttosto ristretto (almeno per le lingue basate sull'alfabeto latino) di simboli dell alfabeto della lingua Riapplichiamo il metodo di codifica generale (ad ogni oggetto da codificare corrisponde una successione di bit) Nel caso del semaforo, facevamo corrispondere Una combinazione diversa di 2 bit a ogni stato del semaforo Nel caso del testo, faremo corrispondere Una combinazione diversa di 8 bit a ogni simbolo da rappresentare

La codifica dei caratteri Costruiremo cioè una TABELLA DI CODIFICA DEI CARATTERI che associ caratteri alfanumerici a gruppi di 8 bit 4 Ad esempio: e così via 01000001 A 01000010 B 01000011 C 01000100 D

5 Perché 8 bit? La codifica dei caratteri Un testo è composto da 26 caratteri alfabetici 10 Simboli numerici Alcuni simboli di interpunzione Altri simboli (+ - & ^ ecc ) 26 caratteri alfabetici in maiuscolo (retaggio di quando non esistevano i word processor e veniva utilizzato un unico font) Alcuni segnali di comando ( Vai a capo, squilla il campanello, Ritorno di carrello, TAB, ecc.. anche questi ricordo di quando l unica unità di output era la telescrivente che bisognava comandare in alcune operazioni)

6 La codifica dei caratteri Con parole binarie lunghe 8 bit, è possibile rappresentare 256 alternative diverse (2 8 =256) da 00000000 a 11111111 passando per tutte le combinazioni intermedie (00000001, 00000010, ) 256 alternative sono sufficienti per codificare i simboli coinvolti in un testo.

Tavola ASCII La codifica di riferimento, utilizzata dalla maggior parte dei computer, è detta ASCII (si legge 'aski, American Standard Code for Information Interchange) Il codice ASCII era stato sviluppato originariamente per l'uso delle macchine telescriventi, e alcuni dei 32 caratteri di controllo risentono ancora di questa eredità. 7 I primi 32 numeri sono associati, anziché a caratteri alfanumerici, ai cosiddetti 'caratteri di controllo' (control characters), corrispondenti a istruzioni quali 'a capo', 'ritorno indietro' e simili

8 Tavola ASCII CODICE ASCII: Ad ogni lettera corrisponde un numero, dato dalla posizione della lettera nella tabella. Ad esempio: P corrisponde al numero 01010000. Quando viene ordinato alfabeticamente un testo, il computer segue l ordine dato dalla posizione dei caratteri nella tavola ASCII, per cui 1P precede P1 1P è dato dal numero 00110001 01010000, mentre P1 dal numero 01010000 00110001 e il primo è più piccolo del secondo).

9 Tavola ASCII

Esempio Il risultato? Una stringa di caratteri sarà rappresentata dal computer come una successione di gruppi di 8 bit O G G I P I O V E 01001111 01000111 01000111 01001001 00100000 01010000 01001001 01001111 01010110 01000101 Consideriamo il problema inverso: data una sequenza di bit, il testo che essa codifica può essere così ottenuto: Si divide la sequenza in gruppi di 8 bit 10 Si determina il carattere corrispondente ad ogni byte Esempio: 01101001 01101100 00100000 01010000 01101111 00101110 i l P o.

Una codifica per i numeri Il Codice ASCII presenta un valore per ognuno dei 10 simboli che corrispondono alle cifre decimali. Esercizio: 0 48 10 ; 2 50 10 ; 3 51 10 ; 4 52 10 ; Il numero 324 viene così rappresentato dalla sequenza di 3 bytes: 00110011 00110010 00110100 51 10 50 10 52 10 Questa rappresentazione non è efficiente (Utilizza molti più bits di quanto sia necessario) Non è adatta per eseguire le operazioni aritmetiche sui numeri 11 Per i numeri si utilizza una codifica diversa dalla ASCII.

12 Tavola ASCII estesa (ISO Latin1 a 8 bit) La codifica ASCII originaria faceva corrispondere ad ogni carattere una parola binaria di 7 bits (ciò permetteva di codificare 128 caratteri diversi) La codifica attualmente usata fa corrispondere ad ogni carattere una parola binaria di 8 bits (ciò permette di codificare 256 caratteri diversi) ed è denominata ISO Latin 1. ISO indica l'approvazione da parte dell'international Standardization Organization e 'Latin 1' indica che si tratta della tabella di riferimento per gli alfabeti di tipo latino.

13 Tavola ASCII estesa (ISO Latin1 a 8 bit)

14 ASCII Estesa (usata da Windows)

15 Esercizi Scrivete le seguenti frasi usando solo i codici ASCII e ISO Latin 1. ç è un simbolo sulla tastiera. Erdös è stato un importante matematico. 5+9=14. a b

Tavola UNICODE a 16 bits 16 Pur avendo a disposizione 256 caratteri, il codice ISO Latin 1 non può essere veramente 'universale Proprio per questo motivo, è stato avviato un progetto estremamente ambizioso: definire una tavola di codifica basata su 16 bit, che consentono 65.536 diverse combinazioni di '0' e '1 lunghe 16, e permettono dunque di codificare oltre 65.000 caratteri. Questa tavola si chiama Unicode, comprende finora (versione 2.0) 38.885 caratteri, e rappresenta uno sforzo di sistematizzazione non solo dal punto di vista informatico, ma anche da quello linguistico.

17 Testi non formattati Un testo non formattato è memorizzato come sequenza di caratteri (spazi e ritorni a capo compresi) Ogni carattere è rappresentato con un codice numerico Il codice più diffuso è il codice ASCII, in cui ad ogni carattere è associato un numero compreso tra 0 e 255 Un codice emergente è l UNICODE che consente di rappresentare testi scritti in altri alfabeti (quello arabo) o in ideogrammi (ad esempio il cinese)

18 Testi formattati Un testo formattato viene invece memorizzato in modo non standard, a seconda del programma con cui è stato scritto (ad esempio Word) Esistono dei formati standard di diffusione dei testi (i più usati sono PostScript e PDF) utilizzati per la pubblicazione di articoli su Internet Un altro formato per testi e ipertesti è HTML, usato per scrivere le pagine web

19 Word Processor Un word processor è un programma per la composizione, la gestione e l impaginazione dei testi Il testo viene trattato a livello di parola (da cui il termine word processor), ma anche a livello superiore (paragrafo, sezione, ecc.) ed inferiore (singolo carattere)