Codifica dell'informazione

Documenti analoghi
La rappresentazione delle informazioni

Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale

Pag. 1. La Rappresentazione e la Codifica delle informazioni (parte 2) Tipi di dati. Informatica Facoltà di Medicina Veterinaria

Hardware, software e periferiche. Facoltà di Lettere e Filosofia anno accademico 2008/2009 secondo semestre

1.2d: La codifica Digitale dei caratteri

Somma di numeri binari

Modulo 1: Le I.C.T. UD 1.2d: La codifica Digitale dei caratteri

Codifica dell Informazione

1.2d: La codifica Digitale dei caratteri

La codifica dei caratteri di un testo

Codifica dell Informazione

Argomenti trattati. Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni

La "macchina" da calcolo

Rapida Nota sulla Rappresentazione dei Caratteri

Modulo 1. Concetti base della Tecnologia dell informazione. Prof. Nicolello Cristiano. Modulo 1

LA CODIFICA DELL INFORMAZIONE. Introduzione ai sistemi informatici D. Sciuto, G. Buonanno, L. Mari, McGraw-Hill Cap.2

Codice binario. Codice. Codifica - numeri naturali. Codifica - numeri naturali. Alfabeto binario: costituito da due simboli

Calcolatore e unità di misura

CODIFICA DI CARATTERI

Il sistema binario: bit e Byte Codifica del testo Il Byte come U.d.M. dell'informazione Multipli del Byte

Introduzione e Nozioni di Base. Prof. Thomas Casali

RAPPRESENTAZIONE DELLE INFORMAZIONI

Informatica. 80 ore divise in 4 UFC. Docente: Michela Bacchin. Contatti: Tramite Ermes Studenti

La codifica. dell informazione

La codifica digitale

La Rappresentazione dell Informazione

Esame di Informatica. Facoltà di Scienze Motorie LE UNITA DI MISURA (1/4) LE UNITA DI MISURA (3/4) LE UNITA DI MISURA (2/4) Lezione 2

Rappresentazione di dati: caratteri. Appunti a cura del prof. Ing. Mario Catalano

Informatica di Base - 6 c.f.u.

Tipi di elaboratori Rappresentazione della informazione Codifica della informazione

Informazione e sua rappresentazione: codifica

Programma del corso. Rappresentazione delle Informazioni. Introduzione agli algoritmi. Architettura del calcolatore

Sistemi di Elaborazione delle Informazioni 6 CFU

Corso di Informatica

Aritmetica dei Calcolatori Elettronici

Concetti di base dell ICT

Programma del corso. Rappresentazione delle Informazioni. Introduzione agli algoritmi. Architettura del calcolatore. Elementi di Programmazione

La codifica dell informazione

Caratteristiche di un linguaggio ad alto livello

Bit, Byte, Word e Codifica Dati

Rappresentazione di dati: numerazione binaria. Appunti per la cl. 3 Di A cura del prof. Ing. Mario Catalano

I sistemi di numerazione. Informatica - Classe 3ª, Modulo 1

Tecnologie per il web e lo sviluppo multimediale. Rappresentazione delle informazioni

19/09/14. Il codice ASCII. Altri codici importanti. Extended ASCII. Tabella del codice ASCII a 7 bit. Prof. Daniele Gorla

Codifica binaria. Rappresentazioni medianti basi diverse

3. Indicare cosa sta a significare la figura geometrica del rombo in un diagramma a blocchi

La codifica digitale del testo

Il Modello di von Neumann (2) Prevede 3 entità logiche:

Prof. Maristella Agosti, Ing. Marco Dussin

La rappresentazione dell informazione

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

La codifica dell informazione

Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012

Esame di Informatica A.A. 2012/13

CONOSCERE IL LINGUAGGIO DEL COMPUTER

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Differenza tra Hardware e Software del Computer. Cos'è un Software. Software di Base

Rappresentazione dell Informazione

Programmazione T.I.C Classe 1 A.S. 2016/17

I.4 Rappresentazione dell informazione

Insegnamento Informatica CdS Scienze Giuridiche

Rappresentazione e Codifica dell Informazione

Introduzione. Elementi di Informatica. Sistemi di Numerazione Addizionali. Sistemi di Numerazione. Sistemi di Numerazione Romano

Corso di Informatica A (A-L) Corso di Laurea in Scienze e Tecniche Psicologiche a.a 2005/06. Obiettivi del corso. Prof. ssa Maria Luisa Sapino

La codifica binaria. Informatica B. Daniele Loiacono

Rappresentazione dell Informazione

Sistemi di numerazioni e metodi di trasformazione

Calcolatori: Rappresentazione dei Dati e Aritmetica binaria

Porte Input/Output (I/O Connectors)

Le rappresentazioni e le proprietà dei numeri reali

Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012

Rappresentazione binaria

Appunti di informatica: la codifica dell'informazione

Calcolo numerico e programmazione Rappresentazione dei numeri

Elaborazione dell informazione. Elaborazione dell informazione. Rappresentazione dei numeri INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042)

Aspetti dell informazione

La codifica del testo

Linguaggio C - sezione dichiarativa: costanti e variabili

Codifica binaria dell informazione

Moltiplicazione. Divisione. Multipli e divisori

Rappresentazione di Numeri Reali. Rappresentazione in virgola fissa (fixed-point) Rappresentazione in virgola fissa (fixed-point)

Informatica Generale

1.2 Concetti base dell Informatica: Informazione

Rappresentazione dei Dati

Cap. 2 - Rappresentazione in base 2 dei numeri interi

Abilità Informatiche e Telematiche

Informatica/ Ing. Meccanica/ Edile/ Prof. Verdicchio/ 30/06/2016/ Foglio delle domande / VERSIONE 1

Corso di Architettura degli Elaboratori

Sistemi di numerazione

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione dei numeri relativi

Lo schema seguente presenta le principali informazioni che devono essere rappresentate mediante codici binari.

Corso di Laurea Ingegneria Civile Fondamenti di Informatica

La digitalizzazione delle informazioni (come e perché trasformare le informazioni in numeri) A cura di Saverio Cantone

Modulo: Elementi di Informatica

APPUNTI DI INFORMATICA

Sistemi di numerazione

1.2f: Operazioni Binarie

I sistemi di numerazione e la numerazione binaria

L'Informazione e la sua Codifica. Maurizio Palesi

Conversione di base. Conversione decimale binario. Si calcolano i resti delle divisioni per due

Transcript:

Codifica dell'informazione Informazione analogica o digitale Informazione simbolica o non simbolica Codifica dei numeri Codifica del testo FdI 2013/2014 GMDN 2014 1 Codifica dell'informazione Nel mondo reale, l informazione può presentarsi in forme molto diverse tra loro Il valore numerico di una grandezza fisica Il testo di un articolo di giornale Il suono prodotto da uno strumento musicale L immagine di una fotografia Le sequenze video di una ripresa televisiva Per tutte queste forme è possibile trovare una rappresentazione adeguata, così che l informazione possa essere elaborata. La rappresentazione viene normalmente definita codifica. In informatica la codifica viene effettuata in maniera unitaria e coerente, ovvero applicando lo stesso principio alle diverse forme. FdI 2013/2014 GMDN 2014 2

Tipologie di informazione Informazione analogica Ogni singola informazione viene rappresentata da grandezze continue. Che è riferito a ciò che non è numerabile, non è analizzabile entro un insieme discreto di elementi. Digitale Ogni informazione viene rappresentata sfruttando solamente simboli o segnali ben definiti e discontinui, ovvero che non mutano con continuità. Che lavora con un insieme finito di elementi. FdI 2013/2014 GMDN 2014 3 Tipologie di informazione Informazione non-simbolica (o continua) l informazione è imprescindibilmente legata alla percezione di tutte le infinite qualità fisiche di un oggetto L oggetto può essere solamente rappresentato, o copiato, ma non replicato perfettamente L informazione non simbolica deve essere trasformata FdI 2013/2014 GMDN 2014 4

Tipologie di informazione Informazione simbolica un simbolo viene associato ad un concetto astratto, ad un idea, ed è slegato dalla percezione di singoli oggetti Il simbolo porta tutta l informazione necessaria, ed è perfettamente replicabile senza che venga persa informazione FdI 2013/2014 GMDN 2014 5 Richiami sulle unità di misura dell informazione Definizione di bit Il bit, da binary digit, è l unità di informazione Come indicato dall etimologia del termine, un bit può assumere solamente due valori, tipicamente 0 e 1 Il bit è anche la minima informazione che può essere rappresentata ed elaborata da un calcolatore elettronico Definizione di byte Un byte è una sequenza di 8 bit Come è già visto, un byte consente di rappresentare 256 valori diversi Il byte è l unità di misura più frequentemente utilizzata in informatica FdI 2013/2014 GMDN 2014 6

Codifica di grandezze numeriche I numeri sono stati i primi ad essere codificati, perché le prime applicazioni dei calcolatori elettronici riguardavano il calcolo L importanza della codifica di valori numerici è testimoniata dalla diffusione del termine digitale (da digit = cifra) I numeri si dividono in: Interi: 0 1 2 3... Razionali aperiodici: 3/4 = 0,75 6/5 = 1,2 Razionali periodici: 1/6 = 0,1666... 50/7 = 7,14285714285714... Irrazionali: π = 3,141592654... e = 2,718281828459... I numeri razionali periodici e irrazionali devono essere approssimati Perché? Per semplicità verrà trattata la sola codifica dei numeri interi. FdI 2013/2014 GMDN 2014 7 Codifica numeri interi Richiami di notazione posizionale Un esempio di notazione posizionale è la notazione decimale, detta anche notazione in base 10, nella quale Si utilizza un numero finito di simboli, le dieci cifre da 0 a 9 Ogni grandezza viene rappresentata con un opportuna combinazione di simboli Il significato di ogni cifra dipende dalla sua posizione Le cifre, partendo da destra, sono moltiplicate per una potenza crescente di 10 (1, 10, 100,...) e i prodotti sono sommati tra loro 351 = (3 * 10^2) + (50 * 10^1) + (1 * 10^0) = 300 + 50 + 1 FdI 2013/2014 GMDN 2014 8

Codifica numeri in notazione binaria Un bit può rappresentare solamente le due cifre 0 e 1 L unica notazione posizionale utilizzabile è quindi la notazione binaria, detta anche notazione in base 2 Le considerazioni svolte per la base 10, valgono per la notazione in base 2, considerando che in questo caso vengono usate Le sole due cifre 0 e 1, al posto delle dieci cifre da 0 a 9 Le potenze di 2, al posto delle potenze di 10 Solo moltiplicazioni per 0 e per 1, semplificando i calcoli dato che X * 0 = 0 e X * 1 = X, con X numero qualsiasi 101 = (1 * 2^2) + (0 * 2^1) + (1 * 2^0) = 4 + 0 + 1 = 5 FdI 2013/2014 GMDN 2014 9 Codifica numeri interi Utilizzare sequenze fisse di bit presenta due svantaggi Non è possibile rappresentare numeri di valore troppo elevato (limitato dal numero di bit) A molti numeri viene associato un numero di bit superiore al necessario, ovvero i bit più a sinistra sono uguali a zero Un buon compromesso, valido per molte applicazioni, utilizza 8 bit Un byte è una sequenza di 8 bit, in grado quindi di rappresentare numeri interi compresi tra 0 e 255 Per rappresentare numeri più grandi si utilizzano multipli interi di un byte, normalmente 2 o 4 byte (16 o 32 bit) sono sufficienti E ovviamente necessario conoscere a priori il numero di byte utilizzati se si vuole decodificare una serie di numeri binari FdI 2013/2014 GMDN 2014 10

Codifica numeri con la virgola? http://it.wikipedia.org/wiki/ieee_754 FdI 2013/2014 GMDN 2014 11 Cosa sono i dati? FdI 2013/2014 GMDN 2014 12

Un sistema informativo e' un insieme di elementi: hardware collegati da bus ordinato tramite regole e interrelazioni che interagendo tra loro emettono ed elaborano dati che producono algoritmi FdI 2013/2014 GMDN 2014 13 Cosa è un bit? FdI 2013/2014 GMDN 2014 14

Un Kilobyte e' uguale a circa un miliardo di bit 1024 byte 10 Megabyte 1024 Megabyte FdI 2013/2014 GMDN 2014 15 Quali sono gli input necessari per un calcolatore che deve risolvere un problema? FdI 2013/2014 GMDN 2014 16

differenze tra la memoria ROM e la memoria RAM FdI 2013/2014 GMDN 2014 17 La tastiera e lo scanner sono periferiche di output periferiche per l'accesso ai dati in memoria secondaria inviano al calcolatore dei dati di input trasformano l'informazione in sequenze di bit FdI 2013/2014 GMDN 2014 18

Alcune tra le funzioni elementari di una CPU sono: calcoli aritmetici cancellazione dati su disco confronto tra valori lettura dati memoria secondaria FdI 2013/2014 GMDN 2014 19 Del software applicativo fanno parte: Quei programmi dedicati ad uno specifico scopo I software di base La memoria di massa Il file system FdI 2013/2014 GMDN 2014 20

Da quali componenti e' formato un sistema operativo? FdI 2013/2014 GMDN 2014 21 Codifica di informazione testuale La codifica di informazione testuale ha seguito rapidamente la codifica dei numeri Il linguaggio testuale consente di interagire con i calcolatori in modo più naturale per l utente La gran parte dei documenti prodotti dalla società, attuale e del passato, sono in forma testuale La codifica dell informazione testuale distingue la rappresentazione del contenuto con quella del formato Il contenuto è dato dalla successione di parole che costituiscono il documento e che ne rappresentano la semantica Il formato è legato al modo in cui le parole sono organizzate e rappresentate, fornendo informazioni accessorie che evidenziano alcuni concetti senza alterarne la semantica FdI 2013/2014 GMDN 2014 22

Codifica di informazione testuale Il contenuto di un testo è formato da una successione di parole, delimitate da spazi e da segni di interpunzione Il testo scritto è organizzato in forma lineare Nelle lingue basate su di un alfabeto, le parole sono formate da sequenze di simboli presi da un insieme noto a priori I simboli sono normalmente le lettere dell alfabeto, i numeri e altri caratteri a stampa di uso comune Gli alfabeti delle diverse lingue presentano delle differenze L inglese non ha le vocali accentate L italiano e l inglese non hanno le lettere: ñ - ç - ß Altre lingue, ad esempio il russo e il greco hanno alfabeti totalmente diversi dall alfabeto latino FdI 2013/2014 GMDN 2014 23 Codifica di informazione testuale Le prime codifiche del testo sono state fatte negli Stati Uniti, per questo spesso si fa implicitamente riferimento all alfabeto inglese I possibili elementi di un testo vengono divisi in: Caratteri alfanumerici Lettere dell alfabeto inglese maiuscole (A-Z) e minuscole (a-z) Lo spazio che separa le parole, visto come carattere a se stante I numeri (0-9) e gli operatori aritmetici I segni di interpunzione e di delimitazione Alcuni altri segni grafici (&, $, @, #, ~) Caratteri speciali spaziatura e formattazione Tutti gli altri possibili simboli (ad esempio lettere di altri alfabeti) I caratteri alfanumerici sono quelli che garantiscono una corretta codifica in ogni paese e sono quindi i più utilizzati FdI 2013/2014 GMDN 2014 24

Codifica dei caratteri Poiché il contenuto di un testo può essere rappresentato da una sequenza di caratteri, per la sua rappresentazione è sufficiente codificare i caratteri con opportune sequenze di bit. Il concetto alla base della codifica di caratteri è che questi Appartengono ad un insieme predeterminato di simboli, denominato alfabeto L alfabeto ha dimensione finita Ad ogni carattere quindi può essere univocamente associato un numero intero, che ne rappresenta il codice L associazione deve essere fatta per tutti i possibili simboli I simboli che non vengono associati ad un numero (una sequenza di bit) non possono essere rappresentati E necessario porre particolare attenzione alla scelta dell alfabeto FdI 2013/2014 GMDN 2014 25 Codifica di caratteri Una volta fatta l associazione, arbitraria, tra simboli dell alfabeto e numeri è sufficiente utilizzare la codifica dei numeri interi Un testo, che è una sequenza di caratteri, può quindi venire rappresentato da una sequenza di numeri interi La codifica di sequenze di caratteri pone lo stesso problema della codifica di una serie di numeri Lo spazio tra le parole viene a sua volta considerato un carattere Non è possibile però, come visto in precedenza, rappresentare un separatore tra i diversi numeri Anche in questo caso si risolve il problema utilizzando un numero costante di bit per ogni carattere La scelta del numero di bit influenza la dimensione dell alfabeto Standard ASCII, 7bit = 128 simboli Extended ASCII, 8 bit = 256 simboli Unicode, 16 bit = 65.536 FdI 2013/2014 GMDN 2014 26

1963 Codifica ASCII Uno degli alfabeti di codifica di caratteri più diffusamente utilizzati è il sistema o schema di codifica denominato: ASCII - American Standard Code for Information Interchange ASCII è uno schema di codifica di caratteri introdotto nel 1963 (X3.41963 di American Standards Association (ASA)) e in grado di rappresentare 128 diversi caratteri utilizzando 7 bit per rappresentarli e memorizzarli (2^7= 128). Questo schema è poi stato recepito dall ISO (International Organization for Standardization) e identificato con la sigla ufficiale ISO 646-1973 o in breve ISO-7. Lo schema include alcune posizioni che erano state riservate per uso nazionale, cioè per permettere la rappresentazione di alcuni caratteri specifici di lingue naturali diverse dall inglese FdI 2013/2014 GMDN 2014 27

1987 ASCII esteso La codifica ASCII negli anni è stata estesa per incorporare anche altri simboli, quindi si è passati da una rappresentazione a 7 bit ad una a 8 bit, con la possibilità di rappresentare 256 diversi caratteri (2^8 = 256) I primi 128 caratteri rimangono immutati per consentire la compatibilità con la codifica ASCII a 7 bit. I restanti 128 caratteri permettono di rappresentare i caratteri particolari di altre lingue europee: ad esempio caratteri specifici dell italiano o del francese, del tedesco, e l alfabeto greco I diversi schemi estesi di codifica ASCII fanno parte della serie degli standard ISO/IEC 8859 del 1987 (IEC = International Electrotechnical Commission), chiamata anche Extended ASCII FdI 2013/2014 GMDN 2014 29 1991 - Unicode Lo schema di codifica Unicode utilizza 16 bit (216 = 65.536) per rappresentare ciascun carattere Questo schema è stato introdotto dal Consorzio Unicode a partire dal 1991 per superare le limitazioni dello schema ISO-7 e successivi Il sottoinsieme di caratteri Unicode rappresentati con 8 bit sono compatibili con le precedenti codifiche ISO Le versioni più recenti di Unicode estendono lo schema e fanno uso di 32 bit (232 = 4.294.967.296) per rappresentare ciascun carattere Al fine di risparmiare memoria, sono stati definiti diversi schemi di codifica, chiamati Unicode Transformation Format (UTF), per rappresentare i caratteri Unicode in modo compatto. Fra questi, il più utilizzato è UTF-8 (quando è possibile si utilizzano 8 bit per risparimare spazio). FdI 2013/2014 GMDN 2014 30

Struttura di un documento testuale Il significato semantico di un testo deriva dal suo contenuto, ovvero dalla successione di parole che lo compongono. La presentazione del contenuto, cioè il modo in cui questo viene strutturato e organizzato, sta assumendo un importanza crescente. Terminali e stampanti hanno crescenti capacità grafiche Una buona strutturazione rende il documento più leggibile La presentazione può rendere un documento più accattivante Una primo approccio verso la strutturazione del testo era presente già nella codifica ASCII, che comprende A capo, avanzamento di una riga o una pagina, tabulazioni Questi codici, nati per le stampanti che erano poco più complesse delle macchine da scrivere, sono chiaramente insufficienti FdI 2013/2014 GMDN 2014 31 Struttura di un documento testuale Tipi di strutturazione comuni Formato dei singoli caratteri Corsivo (italics), Grassetto (bold), Sottolineato (underlined) Dimensioni diverse, espresse in numero di punti Forme diverse dei caratteri, chiamate in inglese font Meno usati, ma spesso presenti, colori e sfondi diversi Formato dei paragrafi Allineamento a destra, sinistra, centrato giustificato Interlinea, ovvero spazio tra righe successive Margini delle righe, eventualmente con la prima riga diversa Possibilità di avere elenchi Formato delle pagine Dimensioni globali della pagina, con eventuali intestazioni Numero di colonne e orientamento della pagina FdI 2013/2014 GMDN 2014 32

Struttura di un documento testuale Non esiste una codifica standard per le informazioni di struttura Ogni programma per la creazione di documenti testuali può codificare questi dati in maniera diversa, con due approcci What You See Is What You Get Le istruzioni sono nascoste all utente, che ne vede direttamente a schermo l effetto così come questo sarà stampato E normalmente necessario utilizzare lo stesso programma per rileggere i dati in maniera corretta Linguaggi di markup Le istruzioni sono esplicitamente indicate da serie di caratteri speciali, il cui effetto non è visibile in fase di scrittura \textbf{esempio 1} esempio 1 <b>esempio 2</b> esempio 2 Crea minori problemi quando si riaccede all informazione FdI 2013/2014 GMDN 2014 33