La codifica di sorgente

Documenti analoghi
Codifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O /

CODIFICA DI SORGENTE. Schematizzazione generale sistema di comunicazione

Teoria dell informazione

Introduzione alla codifica entropica

Sorgenti discrete e informazione

L'Informazione e la sua Codifica. Maurizio Palesi

Compressione di dati: testi, immagini, suoni e video. B. Cipolla

Compressione dei dati. Appunti di Sistemi A cura del prof. Ing. Mario Catalano

Suono digitale. Ø Un secondo di musica stereo richiede 44'100 campioni di 16 bit (2 byte) ciascuno per due canali, quindi 176'400 byte.

UNIVERSITÀ DEGLI STUDI DI TRIESTE

Numeri interi. Laboratorio di Calcolo Paola Gallo

Sistemi di Elaborazione delle Informazioni 6 CFU

Sistemi di Elaborazione delle Informazioni 6 CFU

2) Codici univocamente decifrabili e codici a prefisso.

1.2d: La codifica Digitale dei caratteri

Indice. A Riassunto formule principali sulla Teoria dell Informazione per sorgenti135

Compressione di dati: testi, immagini, suoni e video. B. Cipolla

La codifica dell informazione

Analogico vs digitale

La codifica dell informazione. Rappresentazione binaria. Rappresentazione posizionale in base 10

Tecniche di compressione senza perdita

LE IMMAGINI DIGITALI 3 formati. Università IUAV di venezia

Elaborazione dell informazione. Elaborazione dell informazione. Rappresentazione dei numeri INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042)

Codici binari decimali

Roberto Maieli La trasmissione dell informazione

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.

L informazione e la sua codifica. Prof. Maurizio Naldi A.A. 2015/16

Comunicazioni Elettriche Esercizi

La Rappresentazione dell Informazione

Rappresentazione binaria. Laboratorio di Informatica. Calcolatori digitali. N: numeri naturali. La codifica binaria. I primi 16 numeri binari

La Rappresentazione Dell Informazione

Abbiamo visto nella lezione precedente che le immagini possono essere compresse in vari modi, per ridurne l'occupazione di memoria (su disco o rete)

Codifica CCITT Fax. Introduzione Codifica monodimensionale Codifica bidimensionale. Codifica CCITT Fax. Codifica JBIG2

Laboratorio di Informatica

Codifica dell Informazione

CODIFICA DI CARATTERI

Codifica di canale. (dalle dispense e dalle fotocopie) Trasmissione dell Informazione

Codifica dell Informazione

Codifiche a lunghezza variabile

La codifica binaria. Informatica B. Daniele Loiacono

Informazione e sua rappresentazione: codifica

L'Informazione e la sua Codifica. Maurizio Palesi

La codifica digitale

1 Esercizio - caso particolare di ottimalità

Informazione e sua rappresentazione: codifica

La compressione video. Analis i in multiris oluzione Wavelet La compres s ione di immag ini C ompres s ione JPEG S tandard MPEG

Segnale analogico. Analogico vs digitale. Segnale digitale. Trasformazione da analogico a digitale

La codifica. dell informazione

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Lezione 4. Sommario. L artimetica binaria: I numeri relativi e frazionari. I numeri relativi I numeri frazionari

..., x M. : codice o sequenza di bit che rappresentano il messaggio x i ; n i : lunghezza in bit del codice C X i

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

Codici. Introduzione. Sia A un insieme finito di simboli e C=A n l insieme di tutte le parole composte da n simboli di A

Sistemi di Elaborazione delle Informazioni 6 CFU

Soluzioni di Esercizi di Esame di Segnali Aleatori per Telecomunicazioni

La codifica binaria. Fondamenti di Informatica. Daniele Loiacono

INDICI PER FILE. Accesso secondario. Strutture ausiliarie di accesso

Sistemi di Elaborazione delle Informazioni

1) Probabilità di errore di trasmissione. 2) Capacità di canale. 3) Esempi di calcolo della capacità. 4) Disuguaglianza di Fano

Rappresentazione di immagini a colori. Rappresentazione dei colori. Rappresentazione dei colori LA RAPPRESENTAZIONE DELL INFORMAZIONE - II

Laboratorio di Informatica. delle informazioni. Pagina 1

QUANTIZZAZIONE E CONVERSIONE IN FORMA NUMERICA. 1 Fondamenti Segnali e Trasmissione

Corso di Sistemi di Elaborazione delle informazioni

Il sistema binario: bit e Byte Codifica del testo Il Byte come U.d.M. dell'informazione Multipli del Byte

R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010

RAPPRESENTAZIONE DELLE INFORMAZIONI

STII/Teoria dell Informazione

La rappresentazione delle informazioni

La codifica del testo

Lezione 3. I numeri relativi

La codifica. dell informazione

Tipi di Informazione

Corso di Fondamenti di Telecomunicazioni

E02 ESERCIZI SU MODI DI TRASFERIMENTO

Corso di Fondamenti di Telecomunicazioni 1 - INTRODUZIONE

Informatica. Caratterizzazione del canale I simboli emessi dalla sorgente passano attraverso un canale di trasmissione.

Corso di Informatica

TECNICHE DI COMPRESSIONE DATI

Cos è una wavelet? Applicazioni della trasformata wavelet. Analisi multirisoluzione

Steganografia in un. Corso di Sicurezza dei sistemi informatici Michelangelo Rinelli Anno Accademico 2005/06

Analogico vs. Digitale. LEZIONE II La codifica binaria. Analogico vs digitale. Analogico. Digitale

Fondamenti di Informatica - 1. Prof. B.Buttarazzi A.A. 2011/2012

INFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17)

Il suono digitale. Concetti di base

Informatica di Base - 6 c.f.u.

La codifica delle immagini

TRIE (albero digitale di ricerca)

Rappresentazione e Codifica dell Informazione

Codifica dell'informazione

Software di compressione

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Informatica grafica e Multimedialità. 4 Immagini grafiche

Bit, Byte, Word e Codifica Dati

Compressione delle immagini (codifica JPEG)

La codifica binaria. Informatica B. Daniele Loiacono

Lunghezza media. Teorema Codice D-ario prefisso per v.c. X soddisfa. L H D (X). Uguaglianza vale sse D l i. = p i. . p.1/27

Modulo 1. Concetti base della Tecnologia dell informazione. Prof. Nicolello Cristiano. Modulo 1

Rapida Nota sulla Rappresentazione dei Caratteri

Definizioni. Soluzione ottima: migliore soluzione possibile Soluzione ottima localmente: soluzione ottima in un dominio contiguo. Il paradigma greedy

Codifica binaria. Rappresentazioni medianti basi diverse

Transcript:

Tecn_prog_sist_inform Gerboni Roberta è la rappresentazione efficiente dei dati generati da una sorgente discreta al fine poi di trasmetterli su di un opportuno canale privo di rumore. La codifica di canale permette di trasmettere l informazione emessa dalla sorgente (opportunamente trattata mediante la codifica di sorgente) in maniera affidabile su un canale reale caratterizzato da limitazioni fisiche (es. rumore). 2

3 Il codice adottato da una sorgente deve essere tale da garantire che il ricevitore distingua senza ambiguità i messaggi inviati dal trasmettitore (a meno di eventuali errori introdotti dal canale di comunicazione) 4 2

Quindi la codifica di sorgente deve soddisfare le seguenti condizioni: Ogni simbolo deve essere riconoscibile (codici diversi) Es. A= B= C= D= non riconoscibile Ogni simbolo deve essere identificabile qualsiasi posizione occupi nella sequenza trasmessa Es. A= B= C= D= non identificabile? C C D? B A C B B?. e il codice è a lunghezza fissa le due condizioni sono facilmente realizzabili, perché è sufficiente che ogni simbolo codificato si differenzi dall altro almeno per un bit. 5 Per le sorgenti discrete, nel caso in cui si debbano trasmettere messaggi di tipo testo (alfanumerici) si usano spesso codici in cui ad ogni carattereo simbolo viene associata una sequenza di cifre binarie di lunghezza fissa. Esempi di codici di sorgenti: Codice ACII a 7 o 8 bit Codice BCD o EBCDIC a 4 o 8 bit (sistemi IB) Codice Baudot a 5 bit (codifica 32 caratteri tra simboli e di controllo ed era usato nelle telescriventi) 6 3

ia dato un file di 2 caratteri con frequenze: Usando un codice a lunghezza fissa occorrono 3 bit per rappresentare 6 caratteri. Ad esempio: Per codificare il file occorrono 2 3 = 36 bit. Possiamo fare meglio con un codice a lunghezza variabile che assegni codici più corti ai caratteri più frequenti. Ad esempio con il codice: Bastano 57 + 49 3 + 4 4 = 26 bit. 7 Codici a lunghezza variabile Tengono conto della frequenza con cui determinati simboli vengono emessi dalla sorgente. Questi codici sono molto utilizzati nella codifica dei dati digitali, soprattutto quelli multimediali, quali immagini, audio e video (tecniche di compressione), che cerca appunto di ridurre il numero di bit necessari per immagazzinare un'informazione. Le tecniche di compressione vengono applicate da appositi programmi immediatamente prima della memorizzazione o trasmissione dei dati. Ovviamente in fase di lettura o ricezione analoghi programmi devono effettuare la decompressione. e i simboli da trasmettere non sono equiprobabili utilizzando i codici a lunghezza variabile si ottengono dei codici molto più efficienti rispetto a quelli a lunghezza fissa perché consentono di ottenere un minor numero medio di bit per trasmettere un certo messaggio. 8 4

Tecniche di compressione Algoritmi di compressione lossless o senza perdita(non distruttivi) Comprimono i dati attraverso un processo senza perdita d'informazione e si basano sulla codifica in forma compatta di sequenze di dati uguali, oppure sulla codifica con un numero ridotto dei bit di dati statisticamente più frequenti. Dopo la decodifica il messaggio originale viene ricostruito interamente. UnesempiosonoiformatiZIPperifileeGI,PNGeTIperleimmagini. Gli algoritmi di compressione senza perdita più importanti sono la codifica RLE (Run Length Encoding), la codifica LZW(Lempel-Ziv-Welch) e la codifica di Huffman. Algoritmi di compressione lossy o con perdita(distruttivi) Comprimono i dati attraverso un processo con perdita d'informazione che sfrutta le ridondanze nell'utilizzo dei dati e non possono assicurare una reversibilità assoluta. La parte meno significativa del messaggio viene soppressa in modo irreversibile. Vengono usati per comprimere file multimediali (immagini, audio, video). fruttano il fatto che l'informazione multimediale può essere sottoposta a trasformazioni pur rimanendo intelegibile per noi. Un esempio sono i formati JPEG per le immagini, P3 per il suono e PEG per le immagini in movimento. In molti casi lo spazio che si riesce a risparmiare effettuando la compressione con algoritmi lossy è molto maggiore rispetto a quello risparmiato usando algoritmi lossless. 9 Run Length Encoding (RLE) La sequenza di N campioni uguali(run) viene sostituita (encoding) dal numero di occorrenze del valore(length) ed il valore. L'inizio di un blocco codificato deve essere identificabile: in questo esempio si usa il carattere * per indicare che seguono due valori in codifica run-length 5

La codifica di Huffman Il codice di Huffman costruisce una tabella di codifica-decodifica utilizzando un numero di bit differente a seconda della probabilita' che si ha di trovare uno specifico valore. Utilizzando: meno bit per i codici più probabili, e piùbitperquellimenoprobabili si hanno dei vantaggi: risparmio di spazio nella memorizzazione risparmio di tempo nella trasmissione minore occupazione di banda del canale upponiamo che una sorgente possa emettere solo i seguenti caratteri dell alfabeto e di conoscere anche le loro probabilità di essere inviati.. i ordinano i simboli per probabilità decrescente imbolo Prob. A E.2 2. finché c'è più di un elemento nella tabella ripeti: a) associa a ciascuno dei due simboli con probabilità minore un nodo foglia dell'albero e considera rimossi i due simboli dalla tabella; b)crea un nuovo nodo interno all'albero con questi due nodi come figli, e con probabilità pari alla somma delle loro probabilità; c) aggiungi il nuovo elemento alla tabella con la probabilità somma calcolata, rispettando l ordinamento; 2 6

imbolo Prob. A E.2.5.5 3 imb. Prob. A E.2.5.5 4 7

imb. Prob. E.45.45 A E.2.5 E.2.5 5 imb. Prob. LA.55 E.45.55.45 A L.3 A E.2 E.2.5.5 6 8

imb. Prob.. LA.55 E.45.55.45 A L.3 A E.2 E.2.5.5 3. Il nodo rimanente è la radice con probabilità, e l'albero è completo. 7..55.45 L.3 A E.2 4. A partire dalla radice si visita l albero assegnando ogni volta: al ramo del sottoalbero di destra e al ramo del sottoalbero di sinistra fino ad arrivare a tutte le foglie..5 2 9

5. i codifica ogni simbolo leggendo la sequenza di e che si incontrano scritti sui rami, attraversando l albero dalla radice al simbolo stesso. imbolo Prob. Codice Lunghezza 2 A 2 E.2 2 3 4 L.3.55 A. E.2.45.5 4 2 imbolo Prob. Codice Lunghezza 2 A 2 i può ora calcolare la lunghezza media del codice così costruito utilizzando la formula seguente: E.2 2 3 4 4 L =,3 2 +,25 2 +,2 2 +, 3 +, 4 +,5 4 =2,4bit/simbolo 22