Il CODICE UNICODE (Prof. M. NASO)
|
|
|
- Battistina Gioia
- 9 anni fa
- Visualizzazioni
Transcript
1 ITIS Euganeo Este (PD) Via Borgofuro, 6 Corso Istruzione e Formazione di INFORMATICA per gli adulti MODULO 2 SISTEMI Il CODICE UNICODE (Prof. M. NASO) Commissione Educazione degli Adulti Offerta Formativa 2008/2009 [email protected]
2 IANA, Internet Assigned Numbers Authority, ente di standardizzazione internazionale ha standardizzato i formati numerici per rappresentare i numeri, code point, che referenziano i caratteri del codice Unicode. I formati intitolati UTF, Unicode Transformation Format, sono espressi con sequenze utilizzando una delle seguenti forme: 1. U+ ee per UTF-8 2. U+eeee per UTF U+eeeeeeee per UTF-32 e: cifra esadecimale. Si definisce code point un punto nello spazio dei caratteri Charset: insieme dei caratteri utilizzao dall alfabeto Coding l associazione di un carattere ad un punto Encoding: modalità con la quale è espresso il numero. In Unicode qualsiasi carattere che abbia una realtà fisica indipendente è un carattere. Esempio: a à sono entità indipendenti. UTF-8 In questo formato l insieme dei code point è stato predisposto nei seguenti quattro gruppi: Gruppo Da A Sequenza di ottetti F 0xxxxxxx FF 110xxxxx 10xxxxxx FFFF 1110xxxx 10xxxxxx 10xxxxxx FFFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx I valori contenuti nelle colonne Da e A sono in base esadecimale mentre le x delle colonne contenute in Sequenza di ottetti rappresentano posizioni di bit. Come si può rilevare dalla tabella un code point può essere rappresentato da uno a quattro ottetti a seconda del gruppo di appartenenza. Il numero di bit di valore 1 contenuti nel primo ottetto indica il numero di ottetti della sequenza. I primi 128 code point codificano i caratteri del codice ASCII Standard a 7 bit con un solo ottetto. La codifica UTF-8 è efficiente dal punto di vista dell occupazione di memoria potendo associare sequenze più corte per i caratteri più utilizzati mentre risulta poco efficiente in fase di elaborazione. Questo formato è utilizzato nelle pagine HTML e più generalmente nel WEB. L algoritmo di codifica è il seguente: 1. Noto il code point con un operazione di look up, ricerca, si ricava dalla tabella il gruppo di appartenenza e per induzione la lunghezza della sequenza. 2. Si divide il numero da destra verso sinistra in sequenze di sei bit. 3. Con i bit di ogni gruppo si riempiono le x della sequenza associata. 4. Si rappresentano i gruppi in esadecimale prefissandoli con U+. Esempio: Rappresentare in Unicode il carattere che ha il seguente code point espresso in esadecimale: AA 1. Il code point appartiene al gruppo 2 per cui sarà formato da una sequenza di due ottetti. 2. Trasformiamo, in binario, AA: Dividiamo il numero, da destra verso sinistra, in sequenze di sei bit ed otteniamo:
3 4. Dalla tabella ricaviamo che per l ottetto più significativo abbiamo 5 posizioni di bit disponibili e poiché la sequenza più significativa ha due bit dobbiamo aggiungere 3 bit, di valore 0, non significativi per cui le sequenze diventano Adesso generiamo i due ottetti sostituendo le x del formato con i corrispondenti valori Trasformiamo in esadecimale: C2 AA 7. La rappresentazione risultante è la seguente: U+C2, U+AA UTF-16 In questo formato l insieme dei code point è rappresentato da una o due sequenze di 4 cifre esadecimale. L insieme dei code point è stato partizionati in gruppi, da elementi, denominati piani. Attualmente vi sono 17 piani che vanno da 0FFFF a 10FFFF. I primi elementi appartenenti al piano 0 sono il nucleo originario di UNICODE indicato come BMP, Basic Multilingual Plane. Questa rappresentazione è un giusto compromesso tra l occupazione di memoria e l efficienza di elaborazione. È utilizzata dal linguaggio Java e dai sistemi Windows. Il formato UTF-16 riserva i code point da D800 a DBFF, 1024 posizioni detti surrogati alti, e i code point da DC00 a DFFF, detti surrogati bassi, per codificare i code point che appartengono a piani diversi dal piano 0. Il processo di codifica segue il seguente algoritmo: 1. Se il code point è minore o uguale a FFFF la rappresentazione è su una sequenza di 16 bit espressi in esadecimale prefissata da U+ 2. Se il code point è maggiore di si utilizza una sequenza di due coppie di 16 bit espressi in esadecimale utilizzando un surrogato alto e un surrogato basso. Per esempio D800 e DC Si sottrae al code point il seguente numero esadecimale in modo che tutti i piani compreso il 17 stiano su 20 bit. 4. Il numero così ottenuto si suddivide in due coppie da 10 bit. 5. La coppia che ha i 10 bit più significativi si mette in OR logico con D800, surrogato alto, e l altra coppia con DC00, surrogato basso: supponiamo di aver scelto la suddetta coppia surrogato. 6. Le coppie da 16 bit trasformate in esadecimale prefissate da U+ codificano il code point. Esempio: il carattere A che ha code point 41 e rappresentato come U+0041 mentre per il code point 7AAAA, essendo superiore a FFFF, bisogna eseguire l algoritmo. 1. 7AAAA = 6AAAA 2. Trasformiamo in binario Le coppie da 10 bit sono: Facciamo l OR logico tra D800 che in binario fa con la coppia otteniamo: Trasformato in esadecimale abbiamo D9AA che è rappresentato come U+D9AA 3
4 5. Facciamo lo stesso con i 10 bit meno significativi con il surrogato basso DC Trasformato in esadecimale abbiamo: DEAA che è rappresentato come. U+DEAA In conclusione il code point è rappresentato dalla seguente coppia U+D9AA, U+DEAA UTF-32 In questo formato tutti i code point che referenziano i caratteri hanno la stessa lunghezza formata da 8 cifre esadecimale nel formato U+eeeeeeee. La rappresentazione UFT-32 è poco efficiente per quanto riguarda l occupazione di memoria ma molto efficiente nelle fasi di elaborazione perché i caratteri hanno tutti lo stesso numero di bit e non si perde tempo a ad individuare la lunghezza della sequenza ed estrarre da questa il code point. La rappresentazione UTF-32 è utilizzati nei sistemi Unix. 4
5 POF 2008/2009 Biennio tecnologico Elettrotecnica e Automazione Elettronica e Telecomunicazioni Informatica Abacus Meccanica Scientifico Tecnologico Scientifico Tecnologico progetto Sportivo 2008 Patente ECDL Eucip IT ADMINISTRATOR Corsi EDA Corso Serale progetto Sirio ITIS Euganeo Este (PD) Via Borgofuro, 6 5
Elementi di informatica
Elementi di informatica Sistemi di numerazione posizionali Rappresentazione dei numeri Sistemi di numerazione posizionali La rappresentazione dei numeri richiede ovviamente una codifica, ovvero la definizione
SCHEMA ORARIO SETTIMANALE. IT Indirizzo Informatica e Telecomunicazioni
ISTITUTO TECNICO INDUSTRIALE STATALE Albert Einstein Vimercate (MB) QUADRI ORARIO SCHEMA ORARIO SETTIMANALE IT Indirizzo Elettronica ed Elettrotecnica MATERIA Classe 1 a Classe 2 a Classe 3 a Classe 4
1.2d: La codifica Digitale dei caratteri
1.2d: La codifica Digitale dei caratteri 2 12 ott 2011 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 12 ott 2011 La codifica dei caratteri Un testo
Pag. 1. La Rappresentazione e la Codifica delle informazioni (parte 2) Tipi di dati. Informatica Facoltà di Medicina Veterinaria
1 Università degli studi di Parma Dipartimento di Ingegneria dell Informazione Informatica a.a. 2012/13 Tipi di dati Informatica Facoltà di Medicina Veterinaria La Rappresentazione e la Codifica delle
1.2d: La codifica Digitale dei caratteri
1.2d: La codifica Digitale dei caratteri 2 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 La codifica dei caratteri Un testo è rappresentato attraverso
La Rappresentazione dell Informazione
La Rappresentazione dell Informazione Parte III I codici Codici a.a. 27-28 Un codice è una funzione che associa ad una sequenza di simboli un significato Codice : {entità} {sequenze di simboli} Un codice
Un ripasso di aritmetica: Conversione dalla base 10 alla base 2
Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base due sarà del tipo: c m c m-1... c 1 c 0 (le c i sono cifre
La codifica dei caratteri di un testo
La codifica dei caratteri di un testo L obiettivo è quello di comunicare con il calcolatore usando il nostro linguaggio. Dobbiamo rappresentare le lettere dell alfabeto L insieme di simboli comunemente
CODIFICA DEI CARATTERI
CODIFICA DEI CARATTERI A lunghezza fissa: 7 bit (ASCII) 8 bit (ISO 8859: Latin-1, Latin-2 Latin-15) A lunghezza fissa: 16, 32 bit (UCS-2, UCS-4) A lunghezza variabile: da 1 a 4 byte (UTF-8 e UTF-16) Si
La codifica digitale
La codifica digitale Codifica digitale Il computer e il sistema binario Il computer elabora esclusivamente numeri. Ogni immagine, ogni suono, ogni informazione per essere compresa e rielaborata dal calcolatore
La codifica. dell informazione
00010010101001110101010100010110101000011100010111 00010010101001110101010100010110101000011100010111 La codifica 00010010101001110101010100010110101000011100010111 dell informazione 00010010101001110101010100010110101000011100010111
Rappresentazione dell Informazione
5 Giorgio Porcu - Aggiornamennto 5 Giorgio Porcu - Aggiornamennto ISTITUTO TECNICO SECONDO BIENNIO Rappresentazione dell Informazione GIORGIO PORCU www.thegiorgio.it Sommario Sistemi posizionali Sistema
Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012
Fondamenti di Informatica - 1 Prof. B.Buttarazzi A.A. 2011/2012 Sommario I sistemi di numerazione Il sistema binario Altri sistemi di numerazione Algoritmi di conversione Esercizi 07/03/2012 2 Sistemi
Lezione 3. I numeri relativi
Lezione 3 L artimetcia binaria: i numeri relativi i numeri frazionari I numeri relativi Si possono rappresentare i numeri negativi in due modi con modulo e segno in complemento a 2 1 Modulo e segno Si
Rappresentazione dei Dati
Parte II I computer hanno una memoria finita. Quindi, l insieme dei numeri interi e reali che si possono rappresentare in un computer è necessariamente finito 2 Codifica Binaria Tutti i dati usati dagli
Rappresentazione dei Numeri
Rappresentazione dei Numeri Rappresentazione dei Numeri Il sistema numerico binario è quello che meglio si adatta alle caratteristiche del calcolatore Il problema della rappresentazione consiste nel trovare
I.4 Rappresentazione dell informazione
I.4 Rappresentazione dell informazione Università di Ferrara Dipartimento di Economia e Management Insegnamento di Informatica Ottobre 13, 2015 Argomenti Introduzione 1 Introduzione 2 3 L elaboratore Introduzione
Cap. 2 - Rappresentazione in base 2 dei numeri interi
Cap. 2 - Rappresentazione in base 2 dei numeri interi 2.1 I NUMERI INTERI RELATIVI I numeri relativi sono numeri con il segno: essi possono essere quindi positivi e negativi. Si dividono in due categorie:
Rappresentazione di Numeri Reali. Rappresentazione in virgola fissa (fixed-point) Rappresentazione in virgola fissa (fixed-point)
Rappresentazione di Numeri Reali Un numero reale è una grandezza continua Può assumere infiniti valori In una rappresentazione di lunghezza limitata, deve di solito essere approssimato. Esistono due forme
Soluzioni Esercizi su rappresentazione binaria dell informazione
Soluzioni Esercizi su rappresentazione binaria dell informazione Mauro Bianco 1 Numeri naturali Esercizi: 1. Si calcoli 323 4 + 102 4. Partendo da destra a sinistra 2 4 + 3 4 5 10 4 + 1 10 11 4. La cifra
L'Informazione e la sua Codifica. Maurizio Palesi
L'Informazione e la sua Codifica Maurizio Palesi 1 Obiettivo Il calcolatore è una macchina digitale Il suo linguaggio è composto da due soli simboli Gli esseri umani sono abituati a comunicare utlizzando
Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012
Fondamenti di Informatica - 1 Prof. B.Buttarazzi A.A. 2011/2012 Sommario Rappresentazione dei numeri naturali (N) Rappresentazione dei numeri interi (Z) Modulo e segno In complemento a 2 Operazioni aritmetiche
La codifica. dell informazione
La codifica dell informazione (continua) Codifica dei numeri Il codice ASCII consente di codificare le cifre decimali da 0 a 9 fornendo in questo modo un metodo per la rappresentazione dei numeri Il numero
Codifica binaria. Rappresentazioni medianti basi diverse
Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla
Sistemi di numerazione
Andrea Passerini [email protected] Informatica Sistema binario Sommario informatica rappresentare informazioni la differenza Analogico/Digitale i sistemi di numerazione posizionali il sistema binario
Codifica dell Informazione
Francesco Folino CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati e istruzioni in un formato tale che l esecutore automatico
Numeri e caratteri in binario. Prof.ssa Antonella Serra
Numeri e caratteri in binario SISTEMI DI NUMERAZIONE Viene definito sistema di numerazione o numerazione l'insieme delle regole e dei simboli per rappresentare i numeri. Assumono particolare caratteristica
LA CODIFICA DELL INFORMAZIONE. Introduzione ai sistemi informatici D. Sciuto, G. Buonanno, L. Mari, McGraw-Hill Cap.2
LA CODIFICA DELL INFORMAZIONE Introduzione ai sistemi informatici D. Sciuto, G. Buonanno, L. Mari, McGraw-Hill Cap.2 Codifica dati e istruzioni Per scrivere un programma è necessario rappresentare istruzioni
Rappresentazione dei dati in memoria
Rappresentazione dei dati in memoria La memoria Una memoria deve essere un insieme di oggetti a più stati. Questi oggetti devono essere tali che: le dimensioni siano limitate il tempo necessario per registrare
La rappresentazione delle informazioni
La rappresentazione delle informazioni In queste pagine cercheremo di capire come sia possibile rappresentare mediante numeri e memorizzare in un file testi, immagini, video, suoni... Il computer per lavorare
Codifica dell Informazione
Introduzione all Informatica Fabrizio Angiulli Codifica dell Informazione CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati
Prof. Maristella Agosti, Ing. Marco Dussin
Università degli Studi di Padova Facoltà di Lettere e Filosofia Progettazione di siti web (ING-INF/05) LMSGC, mutuato da LMLIN e Sc. Stat. a.a. 2010-11 Indice: Prof. Maristella Agosti, Ing. Marco Dussin
Quante informazioni posso rappresentare con n bit?
Codifica dell informazione: A causa delle caratteristiche del computer, per comunicare con esso disponiamo di due soli simboli: lo zero e l uno. La codifica è la tecnica che permette di rappresentare i
Algebra di Boole e porte logiche
Algebra di Boole e porte logiche Dott.ssa Isabella D'Alba Corso PENTEST MIND PROJECT 2016 Algebra di Boole e porte logiche (I parte) Algebra di Boole I Sistemi di Numerazione (Posizionali, Non posizionali)
Aritmetica dei Calcolatori
Aritmetica dei Calcolatori Luca Abeni March 5, 2014 Codifica dei Numeri Interi k bit codificano 2 k simboli/valori/numeri... Si usa la base 2 per codificare i numeri Numeri naturali n N: valori da 0 a
La codifica del testo
La codifica delle informazioni Informatica e sistemi di elaborazione delle informazioni La codifica delle informazioni Informatica e sistemi di elaborazione delle informazioni I slide Informatica e sistemi
Codice binario. Codice. Codifica - numeri naturali. Codifica - numeri naturali. Alfabeto binario: costituito da due simboli
Codice La relazione che associa ad ogni successione ben formata di simboli di un alfabeto il dato corrispondente è detta codice. Un codice mette quindi in relazione le successioni di simboli con il significato
Conversione di base. Conversione decimale binario. Si calcolano i resti delle divisioni per due
Conversione di base Dato N>0 intero convertirlo in base b dividiamo N per b, otteniamo un quoto Q 0 ed un resto R 0 dividiamo Q 0 per b, otteniamo un quoto Q 1 ed un resto R 1 ripetiamo finché Q n < b
Un ripasso di aritmetica: Conversione dalla base 10 alla base 2
Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base due sarà del tipo: c m c m-1... c 1 c 0 (le c i sono cifre
La codifica binaria. Informatica B. Daniele Loiacono
La codifica binaria Informatica B Introduzione Il calcolatore usa internamente una codifica binaria ( e ) per rappresentare: i dati da elaborare le istruzioni dei programmi eseguibili Fondamenti di codifica
I sistemi di numerazione. Informatica - Classe 3ª, Modulo 1
I sistemi di numerazione Informatica - Classe 3ª, Modulo 1 1 La rappresentazione interna delle informazioni ELABORATORE = macchina binaria Informazione esterna Sequenza di bit Spett. Ditta Rossi Via Roma
Corso di Sistemi di Elaborazione delle informazioni
Corso di Sistemi di Elaborazione delle informazioni I sistemi di numerazione Francesco Fontanella La Rappresentazione dell'informazione La prima necessità che si ha quando si vuole elaborare dell informazione
La codifica binaria. Fondamenti di Informatica. Daniele Loiacono
La codifica binaria Fondamenti di Informatica Introduzione q Il calcolatore usa internamente una codifica binaria (0 e 1) per rappresentare: i dati da elaborare (numeri, testi, immagini, suoni, ) le istruzioni
RAPPRESENTAZIONE DELLE INFORMAZIONI
RAPPRESENTAZIONE DELLE INFORMAZIONI 1 RAPPRESENTAZIONE DELLE INFORMAZIONI Le informazioni gestite dai sistemi di elaborazione devono essere codificate per poter essere memorizzate, elaborate, scambiate,
Conversioni di base: riassunto
Conversioni di base: riassunto Parte intera: divisioni per la nuova base, ogni resto rappresenta una cifra a par7re dalla meno significa7va Parte frazionaria: mol7plicazioni per la base, la parte intera
Sistemi di numerazione
Sistemi di numerazione Introduzione Un sistema di numerazione è un sistema utilizzato per esprimere i numeri e possibilmente alcune operazioni che si possono effettuare su di essi. Storicamente i sistemi
Analogico vs. Digitale. LEZIONE II La codifica binaria. Analogico vs digitale. Analogico. Digitale
Analogico vs. Digitale LEZIONE II La codifica binaria Analogico Segnale che può assumere infiniti valori con continuità Digitale Segnale che può assumere solo valori discreti Analogico vs digitale Il computer
Sistemi di Elaborazione delle Informazioni 6 CFU
Università degli Studi di Palermo Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica Sistemi di Elaborazione delle Informazioni 6 CFU Anno Accademico 2015/2016 Docente: ing. Salvatore
Rappresentazione e Codifica dell Informazione
Rappresentazione e Codifica dell Informazione Capitolo 1 Chianese, Moscato, Picariello, Alla scoperta dei fondamenti dell informatica un viaggio nel mondo dei BIT, Liguori editore. Sistema di numerazione
Dispensa di Informatica I.2
CENNI Una variabile il cui valore appartenga ad un insieme di simboli può indicare un numero di informazioni pari al numero di elementi di cui è composto l insieme. Ad esempio se a può assumere i valori
Rappresentazione dell informazione
Rappresentazione dell informazione Problema che coinvolge aspetti filosofici Interessa soprattutto distinguere informazioni diverse Con un solo simbolo è impossibile Pertanto l insieme minimo è costituito
Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi
Codice BCD Prima di passare alla rappresentazione dei numeri relativi in binario vediamo un tipo di codifica che ha una certa rilevanza in alcune applicazioni: il codice BCD (Binary Coded Decimal). È un
Linguistica Computazionale
Linguistica Computazionale La codifica digitale del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento di Linguistica
modificato da andynaz Cambiamenti di base Tecniche Informatiche di Base
Cambiamenti di base Tecniche Informatiche di Base TIB 1 Il sistema posizionale decimale L idea del sistema posizionale: ogni cifra ha un peso Esempio: 132 = 100 + 30 + 2 = 1 10 2 + 3 10 1 + 2 10 0 Un numero
R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010
1 11. Data link layer: codici di rilevazione di errore, gestione degli errori La rilevazione di errore Un codice a rilevazione di errore ha lo scopo di permettere al ricevente di determinare se vi sono
Somma di numeri binari
Fondamenti di Informatica: Codifica Binaria dell Informazione 1 Somma di numeri binari 0 + 0 = 0 0 + 1 = 1 1 + 0 = 1 1 + 1 = 10 Esempio: 10011011 + 00101011 = 11000110 in base e una base Fondamenti di
Rappresentazioni numeriche
Rappresentazioni numeriche Un numero è dotato di un valore una rappresentazione La rappresentazione di un numero è il sistema che utilizziamo per indicarne il valore. Normalmente è una sequenza (stringa)
Modulo 1. Concetti base della Tecnologia dell informazione. Prof. Nicolello Cristiano. Modulo 1
Concetti base della Tecnologia dell informazione Algoritmi Come interpreta un computer un problema? Algoritmi Algoritmo: sequenza ordinata di istruzioni per risolvere un problema (tradotto: sequenza di
Lezione 4. Sommario. L artimetica binaria: I numeri relativi e frazionari. I numeri relativi I numeri frazionari
Lezione 4 L artimetica binaria: I numeri relativi e frazionari Sommario I numeri relativi I numeri frazionari I numeri in virgola fissa I numeri in virgola mobile 1 Cosa sono inumeri relativi? I numeri
Lez. 5 La Programmazione. Prof. Salvatore CUOMO
Lez. 5 La Programmazione Prof. Salvatore CUOMO 1 2 Programma di utilità: Bootstrap All accensione dell elaboratore (Bootsrap), parte l esecuzione del BIOS (Basic Input Output System), un programma residente
Elementi di informatica
Elementi di informatica problema della rappresentazione dei valori delle informazioni la rappresentazione deve essere effettuata attraverso un insieme finito di simboli disponibili il numero di simboli
Programmazione I Paolo Valente /2017. Lezione 6. Notazione posizionale
Lezione 6 Notazione posizionale Ci sono solo 10 tipi di persone al mondo: quelle che conoscono la rappresentazione dei numeri in base 2, e quelle che non la conoscono... Programmazione I Paolo Valente
La codifica dell informazione
La codifica dell informazione Rappresentazione binaria Tutta l informazione interna ad un computer è codificata con sequenze di due soli simboli : 0 e 1 L unità elementare di informazione si chiama bit
L'Informazione e la sua Codifica. Maurizio Palesi
L'Informazione e la sua Codifica Maurizio Palesi 1 L Informatica Cos è l Informatica? Studio sistematico degli algoritmi che descrivono e trasformano l informazione: la loro teoria, analisi, progetto,
