che si ripete n volte, con n molto grande. Determinare il rate ottenuto dalla codifica LZ77, usando i parametri:

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "che si ripete n volte, con n molto grande. Determinare il rate ottenuto dalla codifica LZ77, usando i parametri:"

Transcript

1 Corso: Gestione ed elaborazione grandi moli di dati Lezione del: 8 giugno 2006 Argomento: Esercizi sulle tecniche di compressione Scribes: Massimo Bellio, Massimo Padovan, Adalberto Zurlo 1 Esercizio su LZ77 Si supponga di avere un alfabeto A = { a i : 0 i < 2 d} e una stringa periodica X = a 0 a 1 a 2 a 2 d 1a 0 a 1 a 2 a 2 d 1/ /a 0 a 1 a 2 a 2 d 1a 0 a 1 a 2 a 2 d 1 che si ripete n volte, con n molto grande. Determinare il rate ottenuto dalla codifica LZ77, usando i parametri: t bit per rappresentare l offset ( t > d ) r bit per rappresentare la lunghezza dei match d bit per rappresentare i simboli di A codifica delle triple (o, l, a) Supponiamo di trovarci a regime con search buffer pieno (si veda Figure 1): Figure 1: Situazione a regime In questa situazione il search buffer contiene 2 t 1 simboli e il lookahead buffer contiene al massimo 2 r simboli (2 r 1 dovuti alla lunghezza del match più uno, terzo componente della tripla). Poiché t > d deriva che 2 t 1 2 d il che comporta che il primo simbolo nel loockahead buffer, sia esso a i, è sicuramente presente nel search buffer. Posso quindi affermae che il prefisso di lunghezza massima è tutto quello contenuto nel lookahead buffer e il match inizia con la prima occorrenza (guardando da destra a sinistra) di a i nel search buffer e sconfina nel loockahead buffer se 2 r 1 > 2 t 1. Le triple codificate a regime sono (2 d, 2 r 1, a j ). Per rappresentare un segmento lungo 2 r uso una tripla lunga t + r + d. Il rate è R = t+r+d 2 r, per 1

2 r che tende ad infinito il rate tende a 0. Nota: In informatica, l algoritmo Run-length encoding (RLE) è storicamente il primo algoritmo di compressione per le immagini inventato, utilizzato nei fax ben prima che le elaborazioni grafiche al computer fossero un attività comune. L RLE è lossless (senza perdita), ovvero permette di comprimere e decomprimere senza alcuna perdita di informazione. Solitamente si applica alle immagini e si fonda su l assunto che l immagine abbia pochi colori, ma può essere utilizzato su qualunque file dove si trovino lunghe sequenze dove lo stesso byte viene ripetuto. La compressione RLE viene spesso impiegata anche nei protocolli di rete (ad esempio, IBM SNA) o nei formati di dati di applicazioni in cui il tempo di elaborazione è critico (ad esempio, alcuni filmati AVI), perché è il formato che permette la maggior velocità di decompressione. L algoritmo di RLE cerca nei dati da comprimere una serie di elementi uguali (in un immagine bitmap, essa corrisponde ad una campitura piatta), e la sostituisce con un solo elemento, quindi un carattere speciale e infine il numero di volte che esso va ripetuto. Per esempio supponiamo di avere un immagine dove la prima riga è formata da cento pixel neri, il RLE memorizzerà il primo pixel nero poi metterà il carattere speciale e in seguito memorizzerà il numero 100. Così invece di occupare cento locazioni la prima riga ne occuperà solo 3. Il carattere speciale è definito diversamente da ogni implementazione dell algoritmo, e serve a distinguere un elemento normale da uno compresso. 2

3 2 Esercizio su LZ77 Si mantengano tutte le ipotesi dell esercizio precedente ma con la variante: t d In questo caso t d e quindi 2 t 1 < 2 d, che esclude la presenza di a i nel search buffer(si ricorda che la sequenza è periodica e i simboli sono presenti tutti una sola volta nel periodo). Figure 2: Situazione a regime La tripla di codifica a regime sarà (0, 0, a i ). Il rate ottenuto è t+r+d 1 = t + r + d 3 Esercizio 3 su LZW Si supponga di avere un alfabeto A ={a i : 0 i < p, p numero primo } e una stringa periodica X = a 0 a 1 a 2 a p 1 a 0 a 1 a 2 a p 1 / /a 0 a 1 a 2 a p 1 a 0 a 1 a 2 a p 1 che si ripete n volte, con n molto grande. Si utilizzi la codfica LZW con dizionario D di taglia p 2 che si congela al riempimento completo, D = D [0], D [1],, D [ p 2 1 ]. 1. Dimostrare che a regime D [(j 1) p],, D [jp 1], con j = 1 p, contiene tutti e soli i pattern di lunghezza j del tipo a i a i+1...a (i+j) 1, dove la somma si intende modulo p. 2. Determinare il rate della codifica supponendo rappresentare ogni puntatore al dizionario con t = 2 log 2 p bit. 3

4 1. Forniamo innanzitutto un esempio: p = 3, A = {a, b, c} X = abcabcabcabcabc X c = i D [i] 0 a 1 b 2 c 3 ab Il dizionario D: 4 bc 5 ca 6 abc 7 cab 8 bca Si vede che nell esempio la proprietà è dimostrata. Dimostriamo ora in generale per induzione su j. Dim: Caso base: j = 1, la proprietà è vera per come è costruito il dizionario, che nelle prime p posizioni contiene i simboli dell alfabeto. P asso induttivo: Consideriamo la proposizione vera per un qualche j (1 j < p). Dall ipotesi induttiva sappiamo che D = D [0], D [1],, D [jp 1] sono tutti i pattern di lunghezza j costituiti da caratteri consecutivi dell alfabeto. Consideriamo il momento in cui è stata inserita in D la entry D [jp 1]. Nel passo successivo l algoritmo di codifica cerca il prefisso più lungo presente nel dizionario. Chiaramente troverà nel dizionario un prefisso di lunghezza j (in quanto per ipotesi induttiva ci sono tutti i pattern di lunghezza j formati da simboli consecutivi) e inserirà nel dizionario un pattern di lunghezza j + 1. Da questo momento in poi l algoritmo continuerà a trovare nel dizionario prefissi di lunghezza j e inserire pattern di lunghezza j + 1, sino a quando nel dizionario non trova un prefisso di lunghezza j + 1. Sia t il primo passo in cui l algoritmo trova nel dizionario un pattern w di lunghezza j + 1 che è prefisso della sottosequenza ancora da codificare, e supponiamo che w sia stato inserito nel dizionario al passo t h. Tra il passo t h e il passo t 1 sono stati inseriti nel dizionario h pattern di lunghezza j + 1 e la codifica della sequenza è andata avanti di h j simboli. Poiché il simbolo in testa al prefisso al passo t è lo stesso che era in testa al prefisso al passo t h si ha che h j è un multiplo di p, e poiché p è primo e j < p deve essere h multiplo di p, 4

5 e quindi h = p. Se ne deduce quindi che tra il passo t h e il passo t sono stati inseriti nel dizionario p pattern di lunghezza j +1 costituiti da caratteri consecutivi dell alfabeto, ovvero tutti i pattern di questo tipo. Figure 3: Passi successivi all inserimento di D[jp 1] in D 2. D, essendo pieno, contiene tutti i pattern di simboli consecutivi di lunghezza p. La codifica continua rappresentando pattern di lunghezza p con un indice del dizionario. Otteniamo quindi un rate R = 2 log 2 p p 4 Esercizio sull entropia Si supponga di avere una sorgente S che emette blocchi di k simboli uguali su un alfabeto A = {a, b}, con la seguente distribuzione di probabilità: P (a a) = P (b b) = 1 2 con a a = b b = k. 1. Determinare l entropia della sorgente S. 2. Trovare una codifica efficiente per le sequenze prodotte da S e determinarne il rate. 1. Si definisca una nuova sorgente memoryless S su un alfabeto A, con A = {α, β} e P (α) = P (β) = 1 2. H (S ) = P (α) log 1 1 P (α) + P (β) log P (β) = 1 2 log log 2 = 1 Se vediamo α e β come corrispondenti a blocchi di a e b, rispettivamente, di taglia k, si può facilmente dedurre che 5

6 H (S) = 1 k H (S ) = 1 k 2. Una codifica efficiente per lo stream di S è la seguente: α 0 β 1 Questa codifica diventa, per S: (a a) 0 (b b) 1 Il rate ottenuto è R = 1 k = H (S) e la codifica è quindi ottima. 5 Esercizio del libro [Sayood06] Si supponga di avere una sorgente con modello di probabilità P = {p 0, p 1,, p m } ed entropia H p. Si supponga inoltre di avere un altra sorgente con modello di probabilità Q = {q 0, q 1,, q m } ed entropia H q, dove e q i = p 1, se i = 0, 1,, j 2, j + 1,, m q j = q j 1 = p j+ 2 Dire in quale relazione si trovano H q eh p (minore, maggiore o uguale) e provare la risposta. Notiamo che q j e q j 1 sono la media di p j e e se p j = avremo q j = q j 1 = p j = e le due entropie saranno uguali. Se invece p j l entrpia di H q sarà maggiore perché ha una distribuzione maggiormente uniforme. Dimostriamo rigorosamente che H q H p : H p = H q q j log 1 q j q j 1 log 1 q j 1 + p j log 1 p j + log 1 = H p H q = 2 p j+ 2 2 log p j + + p j log 1 p j + log 1 = ] = p j [log 1 2 p j log + [log 1 2 log p j + = [ ] [ ] = p j log p j+ p j 1 + log p j+ 1 = { [ ] ( ) [ ]} pj = (p j + ) p j + log p j+ pj 1 p j 1 + p j + log p j+ 1 = = (p j + ) [H 1] p j + ] Dove H è l entropia di una sorgente binaria con una distribuzione di probabilità: r 1 = p j p j +, r 2 = p j +. Poiché H 1 per una qualunque sorgente binaria, concludiamo che H p H q 0 e quindi H q H p come intuitivamente previsto. 6

7 6 Esercizio del libro [Sayood06] Usando un file di testo calcolare la probabilità p i di ogni simbolo. 1. Assumendo che sia necessaria una codeword di lunghezza log 1 p i per codificare il simbolo i, determinare il numero di bit necessari per codificare il file. 2. Calcolare la probabilità condizionata P(i j) di ogni simbolo i dato il precedente simbolo j. Assumendo che servano log 1 p (i j) per rappresentare il simbolo i che segue j, determinare il numero di bit necessari a codificare il file. Il testo che prenderemo in esame è il seguente: trentatre trentini entrarono a trento Assumiamo che per codificare un carattere (alfabeto italiano) si usino log 22 = 5 bit (21 caratteri e lo spazio). 1. Con il primo modello: p ( ) = 4 log 4 = 4 p (a) = 3 log 3 = 4 p (e) = 5 log 3 = 3 p (i) = 2 log 2 = 5 p (n) = 6 log 6 = 3 p (o) = 3 log 3 = 4 p (r) = 6 log 6 = 3 p (t) = 8 log 8 = 3 Codificando con il modello di ordine 0 si ottiene una codifica lunga 125 bit e un rate R = Con il secondo modello: p (r a) = 1 3 log 3 1 = 2 p (t a) = 1 3 log 3 1 = 2 p ( a) = 1 3 log 3 1 = 2 p (n e) = 4 5 log 5 4 = 1 p ( e) = 1 5 log 5 1 = 3 p (n i) = 1 2 log 2 1 = 1 p ( i) = 1 2 log 2 1 = 1 p (i n) = 1 6 log 6 1 = 3 p (o n) = 1 6 log 6 1 = 3 p (t n) = 4 6 log 6 4 = 1 p (n o) = 1 2 log 2 1 = 1 p ( o) = 1 2 log 2 1 = 1 p (a r) = 1 6 log 6 1 = 3 p (e r) = 4 6 log 6 4 = 1 p (o r) = 1 6 log 6 1 = 3 p (a t) = 1 8 log 8 1 = 3 p (i t) = 1 8 log 8 1 = 3 p (o t) = 1 8 log 8 1 = 3 p (r t) = 5 8 log 8 5 = 1 p (a ) = 1 4 log 4 1 = 2 p (e ) = 1 4 log 4 1 = 2 p (t ) = 2 4 log 4 2 = 1 7

8 Codificando con il modello di ordine 1 si ottiene una codifica lunga 62 bit e un rate R = Al primo simbolo, mancando il predecessore è stata assegnata una codeword lunga 5. Già con un piccolo testo possiamo notare come effettivamente una maggiore conoscenza della sorgente permetta di effettuare una migliore compressione. Bibliografia [Sayood06] K. Sayood. Introduction to Data Compression, 3rd Edition. Morgan Kaufmann,

1 Esercizio - caso particolare di ottimalità

1 Esercizio - caso particolare di ottimalità Corso: Gestione ed elaborazione grandi moli di dati Lezione del: 5 giugno 2006 Argomento: Compressione aritmetica e Tecniche di compressione basate su dizionario Scribes: Andrea Baldan, Michele Ruvoletto

Dettagli

1 L algoritmo LZ Descrizione generale

1 L algoritmo LZ Descrizione generale Corso: Gestione ed elaborazione grandi moli di dati Lezione del: 6 giugno 2006 Argomento: Tecniche di compressione con dizionario Scribes: Fabrizio Lana, Daniele Masato e Luca Polin 1 L algoritmo LZ77

Dettagli

Def. La lunghezza media L(C) di un codice C per una v.c. Obiettivo: Codice ottimo rispetto alla lunghezza media. Lunghezza media di un codice

Def. La lunghezza media L(C) di un codice C per una v.c. Obiettivo: Codice ottimo rispetto alla lunghezza media. Lunghezza media di un codice Lunghezza media di un codice Def. La lunghezza media L(C) di un codice C per una v.c. X con d.d.p. P(x) è data da L(C) = x X p (x) l (x) = E[l(X)] Obiettivo: Codice ottimo rispetto alla lunghezza media

Dettagli

Lunghezza media. Teorema Codice D-ario prefisso per v.c. X soddisfa. L H D (X). Uguaglianza vale sse D l i. = p i. . p.1/27

Lunghezza media. Teorema Codice D-ario prefisso per v.c. X soddisfa. L H D (X). Uguaglianza vale sse D l i. = p i. . p.1/27 Lunghezza media Teorema Codice D-ario prefisso per v.c. X soddisfa L H D (X). Uguaglianza vale sse D l i = p i.. p.1/27 Lunghezza media Teorema Codice D-ario prefisso per v.c. X soddisfa L H D (X). Uguaglianza

Dettagli

Tecniche di compressione senza perdita

Tecniche di compressione senza perdita FONDAMENTI DI INFORMATICA Prof. PIER LUCA MONTESSORO Facoltà di Ingegneria Università degli Studi di Udine Tecniche di compressione senza perdita 2000 Pier Luca Montessoro (si veda la nota di copyright

Dettagli

La codifica di sorgente

La codifica di sorgente Tecn_prog_sist_inform Gerboni Roberta è la rappresentazione efficiente dei dati generati da una sorgente discreta al fine poi di trasmetterli su di un opportuno canale privo di rumore. La codifica di canale

Dettagli

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base due sarà del tipo: c m c m-1... c 1 c 0 (le c i sono cifre

Dettagli

Informatica 3. LEZIONE 16: Heap - Codifica di Huffmann. Modulo 1: Heap e code di priorità Modulo 2: Esempio applicativo: codifica di Huffmann

Informatica 3. LEZIONE 16: Heap - Codifica di Huffmann. Modulo 1: Heap e code di priorità Modulo 2: Esempio applicativo: codifica di Huffmann Informatica 3 LEZIONE 16: Heap - Codifica di Huffmann Modulo 1: Heap e code di priorità Modulo 2: Esempio applicativo: codifica di Huffmann Informatica 3 Lezione 16 - Modulo 1 Heap e code di priorità Introduzione

Dettagli

Gestione ed Elaborazione di Grandi Moli di Dati. Scritto 29/08/2006: SOLUZIONI

Gestione ed Elaborazione di Grandi Moli di Dati. Scritto 29/08/2006: SOLUZIONI Gestione ed Elaborazione di Grandi Moli di Dati Scritto 29/08/2006: SOLUZIONI Gest. ed Elab. di Grandi Moli di Dati: Scritto 29/08/2006 Problema. Con riferimento ai sistemi di dischi RAID a. Definire le

Dettagli

La codifica di sorgente

La codifica di sorgente Tecn_prog_sist_inform Gerboni Roberta è la rappresentazione efficiente dei dati generati da una sorgente discreta al fine poi di trasmetterli su di un opportuno canale privo di rumore. La codifica di canale

Dettagli

METODI MATEMATICI PER L INFORMATICA

METODI MATEMATICI PER L INFORMATICA METODI MATEMATICI PER L INFORMATICA Tutorato Lezione 6 12/05/2016 Corso per matricole congrue a 1 Docente: Margherita Napoli Tutor: Amedeo Leo Induzione Esercizio 20 pagina 330 Mostrare che 3 n < n! se

Dettagli

Informazione binaria:

Informazione binaria: Informazione binaria: Codici di compressione Ingegneria Meccanica e dei Materiali Università degli Studi di Brescia Prof. Massimiliano Giacomin Una soluzione per le immagini: la tavolozza (palette) Spesso

Dettagli

METODI DI BASE PER LA COMPRESSIONE. Multimedia: Nicole R. Andrea C. Gianluca G

METODI DI BASE PER LA COMPRESSIONE. Multimedia: Nicole R. Andrea C. Gianluca G METODI DI BASE PER LA COMPRESSIONE Multimedia: Nicole R. Andrea C. Gianluca G INTRODUZIONE Multimedia: Nicole R. Andrea C. Gianluca G Indica il numero minimo di bit necessari per comprimere un segnale

Dettagli

Programmazione Greedy I codici di Huffman

Programmazione Greedy I codici di Huffman Programmazione Greedy I codici di Huffman Codifica dell informazione La rappresentazione ordinaria dell informazione prevede l impiego di un numero costante di bit; per esempio ad ogni carattere del codice

Dettagli

Compressione di dati: testi, immagini, suoni e video

Compressione di dati: testi, immagini, suoni e video 1 Compressione di dati: testi, immagini, suoni e video B. Cipolla V1.2 Gennaio 2008 2 Compressione: motivazioni Ridurre le dimensioni di oggetti digitali per Risparmiare spazio occupato tempo di trasmissione

Dettagli

INFORMAZIONE E COMPLESSITA

INFORMAZIONE E COMPLESSITA INFORMAZIONE E COMPLESSITA Antonio Restivo Università degli Studi di Palermo Lezioni Lincee di Scienze Informatiche Palermo 26 Febbraio 2015 Concetti fondamentali delle Scienze Informatiche Le Scienze

Dettagli

Sommario. Lempel-Ziv coding e varianti Run-length encoding. 1 Introduzione. 2 Codifica mediante predittori (Lossless JPEG, PNG, ecc.

Sommario. Lempel-Ziv coding e varianti Run-length encoding. 1 Introduzione. 2 Codifica mediante predittori (Lossless JPEG, PNG, ecc. Sommario Lempel-Ziv coding e varianti 1 2 Codifica mediante predittori (Lossless JPEG, PNG, ecc.) 3 Lempel-Ziv coding e varianti 4 Lempel-Ziv coding e varianti Il codice di Huffman visto prima sfrutta

Dettagli

Sistemi di Elaborazione delle Informazioni

Sistemi di Elaborazione delle Informazioni Università degli Studi di Messina Policlinico G. Martino - Sistemi di Elaborazione delle Informazioni A.A. 26/27 Università degli Studi di Messina Policlinico G. Martino - Sistemi di Elaborazione delle

Dettagli

RAPPRESENTAZIONE DELLE INFORMAZIONI

RAPPRESENTAZIONE DELLE INFORMAZIONI RAPPRESENTAZIONE DELLE INFORMAZIONI 1 RAPPRESENTAZIONE DELLE INFORMAZIONI Le informazioni gestite dai sistemi di elaborazione devono essere codificate per poter essere memorizzate, elaborate, scambiate,

Dettagli

1 Entropia: Riepilogo

1 Entropia: Riepilogo Corso: Gestione ed elaborazione grandi moli di dati Lezione del: 30 maggio 2006 Argomento: Entropia. Costruzione del modello di una sorgente. Codifica di Huffman. Scribes: Galato Filippo, Pesce Daniele,

Dettagli

Capitolo 3 Compressione sorgenti statiche

Capitolo 3 Compressione sorgenti statiche Capitolo 3 Compressione sorgenti statiche Elementi di codifica di sorgente Entropia Classificazione degli algoritmi Testo RLE Huffman statico Huffman dinamico Codifica aritmetica LZ Immagini Prestazioni

Dettagli

carattere a b c d e f cod. var

carattere a b c d e f cod. var Codici prefissi Un codice prefisso è un codice in cui nessuna parola codice è prefisso (parte iniziale) di un altra Ogni codice a lunghezza fissa è ovviamente prefisso. Ma anche il codice a lunghezza variabile

Dettagli

Codifica di Huffman e Lempel-Ziv-Welch

Codifica di Huffman e Lempel-Ziv-Welch Codifica di e Lempel-Ziv-Welch 1 ALBERTO BELUSSI ANNO ACCADEMICO 2009/2010 Tipi di compressione Senza perdita (lossless lossless): permettono di ricostruire perfettamente la rappresentazione del dato originale,

Dettagli

UNIVERSITÀ DEGLI STUDI DI TRIESTE

UNIVERSITÀ DEGLI STUDI DI TRIESTE UNIVERSITÀ DEGLI STUDI DI TRIESTE Corso di Elaborazione Elettronica di Immagini CODIFICA DI IMMAGINI SENZA PERDITA Sommario 1 2 (Lossless JPEG, PNG, ecc.) 3 4 Motivazione Gli algoritmi per la codifica

Dettagli

Codifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O /

Codifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O / Codifica di Huffman e Lempel-Ziv-Welch 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 0 / 2 0 1 1 Tipi di compressione Senza perdita (lossless): permettono di ricostruire perfettamente

Dettagli

Codifica di Huffman e Lempel-Ziv-Welch

Codifica di Huffman e Lempel-Ziv-Welch e Lempel-Ziv-Welch 1 A L B E R T O B E L U S S I A N N O A C C A D E M I C O 2 0 1 0 / 2 0 1 1 Tipi di compressione Senza perdita (lossless): permettono di ricostruire perfettamente la rappresentazione

Dettagli

Alberi binari: definizione e alcune proprietà

Alberi binari: definizione e alcune proprietà Alberi binari: definizione e alcune proprietà Alberi binari Un albero binario è un albero con radice in cui ogni nodo ha al più due figli. In maniera più formale: Definizione. (Alberi binari) Un albero

Dettagli

Compressione di dati: testi, immagini, suoni e video. B. Cipolla

Compressione di dati: testi, immagini, suoni e video. B. Cipolla V1.3: Novembre 2008 1 Compressione di dati: testi, immagini, suoni e video B. Cipolla V1.3: Novembre 2008 2 Compressione: motivazioni Ridurre le dimensioni di oggetti digitali per Risparmiare spazio occupato

Dettagli

Comunicazioni Elettriche II

Comunicazioni Elettriche II Comunicazioni Elettriche II Laurea Magistrale in Ingegneria Elettronica Università di Roma La Sapienza A.A. 2017-2018 Equiripartizione asintotica AEP Asymptotic Equiripartition Property AEP Nella teoria

Dettagli

SCUOLA GALILEIANA DI STUDI SUPERIORI CLASSE DI SCIENZE NATURALI ESAME DI AMMISSIONE, PROVA DI MATEMATICA 13 SETTEMBRE 2011

SCUOLA GALILEIANA DI STUDI SUPERIORI CLASSE DI SCIENZE NATURALI ESAME DI AMMISSIONE, PROVA DI MATEMATICA 13 SETTEMBRE 2011 1 SCUOLA GALILEIANA DI STUDI SUPERIORI CLASSE DI SCIENZE NATURALI ESAME DI AMMISSIONE, PROVA DI MATEMATICA 13 SETTEMBRE 011 Problema 1. Sia Z l insieme dei numeri interi. a) Sia F 100 l insieme delle funzioni

Dettagli

Indice. 1 Introduzione 2. 2 Algoritmo di compressione LZ78 3

Indice. 1 Introduzione 2. 2 Algoritmo di compressione LZ78 3 Algoritmi e Strutture Dati 2 e Aneno Acc. 1999/2000 PROF. ALFREDO DE SANTIS Metodo di Compressione LZ78 a cura di Maria Grazia Calabrò z 24 Luglio 2000 Indice 1 Introduzione 2 2 Algoritmo di compressione

Dettagli

Teoria dell Informazione II Anno Accademico Lezione 6-7

Teoria dell Informazione II Anno Accademico Lezione 6-7 Teoria dell Informazione II Anno Accademico 2017 2018 Lezione 6-7 Ugo Vaccaro ( ) 1 2 n Data una variabile casuale X = che assume valori i, con probabilità p p 1 p 2 p i, per i = 1,...,n, n vogliamo studiare

Dettagli

L'Informazione e la sua Codifica. Maurizio Palesi

L'Informazione e la sua Codifica. Maurizio Palesi L'Informazione e la sua Codifica Maurizio Palesi 1 Obiettivo Il calcolatore è una macchina digitale Il suo linguaggio è composto da due soli simboli Gli esseri umani sono abituati a comunicare utlizzando

Dettagli

Compressione dei dati. Appunti di Sistemi A cura del prof. Ing. Mario Catalano

Compressione dei dati. Appunti di Sistemi A cura del prof. Ing. Mario Catalano Compressione dei dati Appunti di Sistemi A cura del prof. Ing. Mario Catalano Compressione di dati Cosa significa comprimere i dati? Eliminare l'informazione ridondante, in modo da poter rappresentare

Dettagli

METODI MATEMATICI PER L INFORMATICA

METODI MATEMATICI PER L INFORMATICA METODI MATEMATICI PER L INFORMATICA Tutorato Lezione 7 19/05/2016 Corso per matricole congrue a 1 Docente: Margherita Napoli Tutor: Amedeo Leo Ricorsione Esercizio 2 pagina 357 Trovare f(1), f(2), f(3),

Dettagli

Numeri interi. Laboratorio di Calcolo Paola Gallo

Numeri interi. Laboratorio di Calcolo Paola Gallo Numeri interi Alfabeto binario anche il segno può essere rappresentato da 0 o 1 è indispensabile indicare il numero k di bit utilizzati Modulo Modulo e segno 1 bit di segno (0 positivo, 1 negativo) k 1

Dettagli

La codifica del testo

La codifica del testo La codifica delle informazioni Informatica e sistemi di elaborazione delle informazioni La codifica delle informazioni Informatica e sistemi di elaborazione delle informazioni I slide Informatica e sistemi

Dettagli

Introduzione alla codifica entropica

Introduzione alla codifica entropica Compressione senza perdite Il problema Introduzione alla codifica entropica Abbiamo un alfabeto di simboli A (nota: non è detto che gli elementi di A siano numeri) Sappiamo che il simbolo a A si presenta

Dettagli

Codifica CCITT Fax. Introduzione Codifica monodimensionale Codifica bidimensionale. Codifica CCITT Fax. Codifica JBIG2

Codifica CCITT Fax. Introduzione Codifica monodimensionale Codifica bidimensionale. Codifica CCITT Fax. Codifica JBIG2 Codifica CCITT Fax Metodo per la codifica senza perdita di immagini bitonali, standardizzato nel 1988 dal CCITT (ora ITU-T) Sviluppato per la trasmissione di fax, ma utilizzato anche per l archiviazione

Dettagli

LZ e il formato GIF. Chiara Epifanio. LZ e GIF

LZ e il formato GIF. Chiara Epifanio. LZ e GIF LZ e il formato GIF LZ77 abracadabra abracadabra abra Corpo principale Look-Ahead Buffer Pos. della stringa richiamata Carattere suppletivo LZ78 Dizionario e la sua applicazione sulla stringa s= abracadabra

Dettagli

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno. Trasferimento Ambiente esterno Controllo Informatica Mario Pavone - Dept. Mathematics & Computer Science - University of Catania mpavone@dmi.unict.it Cos è l Informatica La scienza della rappresentazione

Dettagli

Codifica di immagini senza perdita

Codifica di immagini senza perdita Sistemi Multimediali Codifica di immagini senza perdita Marco Gribaudo marcog@di.unito.it, gribaudo@elet.polimi.it Le immagini GIF Lo standard GIF e' uno degli standard per la compressione di immagini

Dettagli

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2

Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Un ripasso di aritmetica: Conversione dalla base 10 alla base 2 Dato un numero N rappresentato in base dieci, la sua rappresentazione in base due sarà del tipo: c m c m-1... c 1 c 0 (le c i sono cifre

Dettagli

Suono digitale. Ø Un secondo di musica stereo richiede 44'100 campioni di 16 bit (2 byte) ciascuno per due canali, quindi 176'400 byte.

Suono digitale. Ø Un secondo di musica stereo richiede 44'100 campioni di 16 bit (2 byte) ciascuno per due canali, quindi 176'400 byte. Suono digitale Ø Formato standard per i CD audio frequenza di campionamento di 44'100 Hz quantizzazione su 65'536 livelli (un campione viene codificato su 16 bit) Ø Un secondo di musica stereo richiede

Dettagli

L algoritmo di decodifica è semplice e computazionalmente meno oneroso rispetto a quello di codifica.

L algoritmo di decodifica è semplice e computazionalmente meno oneroso rispetto a quello di codifica. Decodificatore LZW L algoritmo di decodifica è semplice e computazionalmente meno oneroso rispetto a quello di codifica. A differenza di altre tecniche (ad es. Huffman), non è necessario fornire preventivamente

Dettagli

Lezione 4 Ugo Vaccaro

Lezione 4 Ugo Vaccaro Teoria dell Informazione II Anno Accademico 205 206 Lezione 4 Ugo Vaccaro Il risultato principale che abbiamo scoperto nella lezione scorsa è il seguente: data una sorgente DSSM X, X 2,..., X i,... con

Dettagli

Compressione dati. Capitolo 11. Leonora Bianchi IDSIA-DTI-SUPSI Leonora Bianchi

Compressione dati. Capitolo 11. Leonora Bianchi IDSIA-DTI-SUPSI Leonora Bianchi Compressione dati Capitolo 11 IDSIA-DTI-SUPSI 1 La compressione è ovunque! Nelle reti di computer: compressione pacchetti inviati file di backup FAX N.B.: trasmettere qui è sinonimo di comprimere 2 Indice

Dettagli

Informazione binaria: - rappresentazione dei numeri naturali e interi relativi -

Informazione binaria: - rappresentazione dei numeri naturali e interi relativi - Informazione binaria: - rappresentazione dei numeri naturali e interi relativi - Percorso di Preparazione agli Studi di Ingegneria Università degli Studi di Brescia Docente: Massimiliano Giacomin Tipologie

Dettagli

Nozioni di base (II Parte)

Nozioni di base (II Parte) Nozioni di base (II Parte) 1 Ricorsione [GTG14, Par. 5.1-5.4 and 13.1] Algoritmo Ricorsivo: algoritmo che invoca se stesso (su istanze sempre più piccole) sfruttando la nozione di induzione. La soluzione

Dettagli

La codifica dei numeri

La codifica dei numeri La codifica dei numeri La rappresentazione dei numeri con il sistema decimale può essere utilizzata come spunto per definire un metodo di codifica dei numeri all interno degli elaboratori: la sequenza

Dettagli

Codifica dell Informazione

Codifica dell Informazione Introduzione all Informatica Fabrizio Angiulli Codifica dell Informazione CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati

Dettagli

LABORATORIO DI INFORMATICA

LABORATORIO DI INFORMATICA LABORATORIO DI INFORMATICA Corso di laurea in Scienze della Formazione Primaria a.a.2014/2015 A cura del Prof. Sergio Miranda 2 LEZIONE N.5 Codifica delle Informazioni LA CODIFICA DEI NUMERI Obiettivo:

Dettagli

Rappresentazione dei numeri

Rappresentazione dei numeri Corso di Calcolatori Elettronici I Rappresentazione dei numeri: sistemi di numerazione posizionale Prof. Roberto Canonico Università degli Studi di Napoli Federico II Dipartimento di Ingegneria Elettrica

Dettagli

1.2d: La codifica Digitale dei caratteri

1.2d: La codifica Digitale dei caratteri 1.2d: La codifica Digitale dei caratteri 2 12 ott 2011 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 12 ott 2011 La codifica dei caratteri Un testo

Dettagli

Codifica delle sequenze sorgente

Codifica delle sequenze sorgente Codifica delle sequenze sorgente Sorgente emette sequenza di simboli appartenenti ad un alfabeto X che vengono codificati come sequenze di simboli di un alfabeto D-ario.. p.1/?? Codifica delle sequenze

Dettagli

Capitolo 3 Compressione sorgenti statiche

Capitolo 3 Compressione sorgenti statiche Capitolo 3 Compressione sorgenti statiche Elementi di codifica di sorgente Entropia Classificazione degli algoritmi Testo RLE Huffman statico Huffman dinamico Codifica aritmetica LZ Immagini Prestazioni

Dettagli

Compressione di dati: testi, immagini, suoni e video. B. Cipolla

Compressione di dati: testi, immagini, suoni e video. B. Cipolla V1.4: Novembre 2009 1 Compressione di dati: testi, immagini, suoni e video B. Cipolla V1.4: Novembre 2009 2 Compressione: motivazioni Ridurre le dimensioni di oggetti digitali per Risparmiare spazio occupato

Dettagli

Teoria dell informazione

Teoria dell informazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2008-09 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Dettagli

RAPPRESENTAZIONE DELLE INFORMAZIONI

RAPPRESENTAZIONE DELLE INFORMAZIONI RAPPRESENTAZIONE DELLE INFORMAZIONI 1 RAPPRESENTAZIONE DELLE INFORMAZIONI Le informazioni gestite dai sistemi di elaborazione devono essere codificate per poter essere memorizzate, elaborate, scambiate,

Dettagli

Compressione Delta mediante l algoritmo LZSS

Compressione Delta mediante l algoritmo LZSS Compressione Delta mediante l algoritmo LZSS CORSO DI COMPRESSIONE DATI IN SISTEMI MULTIMEDIALI ANNO 2007/08 PROF. B. CARPENTIERI Gruppo TK Indice degli argomenti Introduzione LZSS Delta Encoding Delta

Dettagli

MATEMATICA DISCRETA CLAUDIA MALVENUTO PRIMA PROVA IN ITINERE 24 APRILE 2014

MATEMATICA DISCRETA CLAUDIA MALVENUTO PRIMA PROVA IN ITINERE 24 APRILE 2014 MATEMATICA DISCRETA CLAUDIA MALVENUTO PRIMA PROVA IN ITINERE 4 APRILE 014 1. Trovare il numero di stringhe di lunghezza n che si possono formare usando le lettere A, B, C, D, E in modo che ogni stringa

Dettagli

CODIFICA DI CARATTERI

CODIFICA DI CARATTERI CODIFICA DI CARATTERI Associando un simbolo dell alfabeto ad ogni numero possiamo codificare tutte le lettere Codifica ASCII (American Standard Code for Information Interchange): Caratteri speciali, punteggiatura,

Dettagli

La codifica delle immagini

La codifica delle immagini Lettere e numeri non costituiscono le uniche informazioni utilizzate dagli elaboratori ma si stanno diffondendo sempre di più applicazioni che utilizzano ed elaborano anche altri tipi di informazione:

Dettagli

TEORIA DELL INFORMAZIONE ED ENTROPIA FEDERICO MARINI

TEORIA DELL INFORMAZIONE ED ENTROPIA FEDERICO MARINI TEORIA DELL INFORMAZIONE ED ENTROPIA DI FEDERICO MARINI 1 OBIETTIVO DELLA TEORIA DELL INFORMAZIONE Dato un messaggio prodotto da una sorgente, l OBIETTIVO è capire come si deve rappresentare tale messaggio

Dettagli

Un ripasso di aritmetica: Rappresentazione decimale - limitazioni

Un ripasso di aritmetica: Rappresentazione decimale - limitazioni Un ripasso di aritmetica: Rappresentazione decimale - limitazioni Consideriamo la base dieci: con tre cifre decimali si possono rappresentare i numeri compresi tra 0 e 999, il numero successivo (1000)

Dettagli

Istituzioni di Matematiche (V): Seconda Prova Parziale, 13 Gennaio 2015 (versione 1)

Istituzioni di Matematiche (V): Seconda Prova Parziale, 13 Gennaio 2015 (versione 1) Istituzioni di Matematiche (V): Seconda Prova Parziale, 13 Gennaio 015 (versione 1) Nome e Cognome: Numero di matricola: Esercizio 1 Esercizio Esercizio 3 Esercizio 4 Esercizio 5 Totale 4 6 6 8 6 Tutte

Dettagli

La codifica delle immagini

La codifica delle immagini Lettere e numeri non costituiscono le uniche informazioni utilizzate dagli elaboratori ma si stanno diffondendo sempre di più applicazioni che utilizzano ed elaborano anche altri tipi di informazione:

Dettagli

Modello di sistema di comunicazione

Modello di sistema di comunicazione Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria dell informazione A.A. 2006-07 Alberto Perotti DELEN-DAUIN Modello di sistema di comunicazione Il modello di

Dettagli

Codifica dell Informazione

Codifica dell Informazione Francesco Folino CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati e istruzioni in un formato tale che l esecutore automatico

Dettagli

Esercitazione 0. Alberto Marchesi Informatica A Ingegneria Matematica (sez. 2) 25 Settembre 2019

Esercitazione 0. Alberto Marchesi Informatica A Ingegneria Matematica (sez. 2) 25 Settembre 2019 Esercitazione Alberto Marchesi Informatica A Ingegneria Matematica (sez. 2) 25 Settembre 219 Gli esercizi visti a lezione sono segnalati con ( ). Esercizio.1 ( ). Convertire in base 1 il numero (1111)2

Dettagli

La codifica digitale

La codifica digitale La codifica digitale Codifica digitale Il computer e il sistema binario Il computer elabora esclusivamente numeri. Ogni immagine, ogni suono, ogni informazione per essere compresa e rielaborata dal calcolatore

Dettagli

Università degli Studi di Roma Tor Vergata. Principio di induzione matematica

Università degli Studi di Roma Tor Vergata. Principio di induzione matematica Università degli Studi di Roma Tor Vergata. Principio di induzione matematica Il Principio di induzione matematica è una tecnica di dimostrazione che permette la dimostrazione simultanea di infinite affermazioni.

Dettagli

Informazione e Registri - 2

Informazione e Registri - 2 Informazione e Registri Le informazioni (dati e/o istruzioni) trattate da una macchina sono memorizzate in elementi detti registri Il registro può essere visto come un contenitore di informazione individuato

Dettagli

Notazione posizionale. Codifica binaria. Rappresentazioni medianti basi diverse. Multipli del byte

Notazione posizionale. Codifica binaria. Rappresentazioni medianti basi diverse. Multipli del byte Codifica binaria Rappresentazione di numeri Notazione di tipo posizionale (come la notazione decimale). Ogni numero è rappresentato da una sequenza di simboli Il valore del numero dipende non solo dalla

Dettagli

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.

Informatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno. Trasferimento Ambiente esterno Controllo Informatica Mario Pavone - Dept. Mathematics & Computer Science - University of Catania mpavone@dmi.unict.it Cos è l Informatica La scienza della rappresentazione

Dettagli

Rappresentazione dei numeri

Rappresentazione dei numeri Rappresentazione dei numeri Così come per qualsiasi altro tipo di dato, anche i numeri, per essere immagazzinati nella memoria di un calcolatore, devono essere codificati, cioè tradotti in sequenze di

Dettagli

Digitalizzazione delle immagini

Digitalizzazione delle immagini Digitalizzazione delle immagini Informazione multimediale Lettere e numeri non costituiscono le uniche informazioni utilizzate dai computer ma sempre più applicazioni utilizzano ed elaborano anche altri

Dettagli

Fondamenti di Informatica. Ipotesi fondamentale. Irrisolubilità. Prof. V.L. Plantamura Informatica e Comunicazione Digitale a.a.

Fondamenti di Informatica. Ipotesi fondamentale. Irrisolubilità. Prof. V.L. Plantamura Informatica e Comunicazione Digitale a.a. Fondamenti di Informatica Prof. V.L. Plantamura Informatica e Comunicazione Digitale a.a. 2006-2007 Ipotesi fondamentale Tesi di Church Qualunque algoritmo può essere espresso sotto forma di matrice funzionale

Dettagli

Il Livello di presentazione

Il Livello di presentazione IL LIELLO I RESENTAIONE 1 La codifica dei dati 1 La compressione dei dati. 2 Tecnica di uffmann 3 Crittografia 18 Il Livello di presentazione La codifica dei dati Scopo fondamentale del livello di presentazione

Dettagli

Sistemi di Elaborazione delle Informazioni 6 CFU

Sistemi di Elaborazione delle Informazioni 6 CFU Università degli Studi di Palermo Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica Sistemi di Elaborazione delle Informazioni 6 CFU Anno Accademico 2015/2016 Docente: ing. Salvatore

Dettagli

15 Informazione e Predizione

15 Informazione e Predizione (FX) Teoria dell Informazione e della Trasmissione 5 Informazione e Predizione Docente: Nicolò Cesa-Bianchi versione 4 maggio 03 Consideriamo una sorgente X, p. Dallo studio della codifica sorgente, sappiamo

Dettagli

LA CODIFICA. CANALE IDEALE E REALE

LA CODIFICA. CANALE IDEALE E REALE LA CODIFICA. CANALE IDEALE E REALE L A CODIFICA Per trasmettere i simboli generati dalla sorgente devo tradurli in segnali adatti al canale. Per effettuare la trasmissione dovremo: MODULARE il segnale:

Dettagli

Abbiamo visto nella lezione precedente che le immagini possono essere compresse in vari modi, per ridurne l'occupazione di memoria (su disco o rete)

Abbiamo visto nella lezione precedente che le immagini possono essere compresse in vari modi, per ridurne l'occupazione di memoria (su disco o rete) Algoritmi di compressione per le immagini Abbiamo visto nella lezione precedente che le immagini possono essere compresse in vari modi, per ridurne l'occupazione di memoria (su disco o rete) compressione

Dettagli

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007 Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 007 Primo esercizio Per una certa stampante S 1, la probabilità che un generico foglio

Dettagli

LE IMMAGINI DIGITALI 3 formati. Università IUAV di venezia

LE IMMAGINI DIGITALI 3 formati. Università IUAV di venezia LE IMMAGINI DIGITALI 3 formati Università IUAV di venezia Compressione Trasmissione ed archiviazione dei file grafici Algoritmo di compressione: trasformare la sequenza di byte che costituisce un file

Dettagli

..., x M. : codice o sequenza di bit che rappresentano il messaggio x i ; n i : lunghezza in bit del codice C X i

..., x M. : codice o sequenza di bit che rappresentano il messaggio x i ; n i : lunghezza in bit del codice C X i Definizioni X : sorgente di informazione discreta; X k : messaggi prodotti da X ; ogni messaggio è una v.c.d., k è l'indice temporale; alfabeto di X : insieme {x,..., x } degli messaggi che la sorgente

Dettagli

Comunicazioni Elettriche II

Comunicazioni Elettriche II Comunicazioni Elettriche II Laurea Magistrale in Ingegneria Elettronica Università di Roma La Sapienza A.A. 27-28 Teoria dell informazione Esercitazione 6 Teorema della codifica di sorgente Si consideri

Dettagli

Analogico vs digitale

Analogico vs digitale Analogico vs digitale Informazione classificatoria e più che classificatoria Informazione classificatoria: è questo, ma avrebbe potuto essere quest altro altro. Informazione più che classificatoria: riconoscere

Dettagli

CODIFICA DI CARATTERI

CODIFICA DI CARATTERI CODIFICA DI CARATTERI Associando un simbolo dell alfabeto ad ogni numero possiamo codificare tutte le lettere Codifica ASCII (American Standard Code for Information Interchange): Caratteri speciali, punteggiatura,

Dettagli

La codifica delle immagini

La codifica delle immagini Non sempre il contorno della figura coincide con le linee della griglia. Quella che si ottiene nella codifica è un'approssimazione della figura originaria Se riconvertiamo la stringa 0000000011110001100000100000

Dettagli

CP210 Introduzione alla Probabilità: Esame 2

CP210 Introduzione alla Probabilità: Esame 2 Dipartimento di Matematica, Roma Tre Pietro Caputo 2018-19, II semestre 9 luglio, 2019 CP210 Introduzione alla Probabilità: Esame 2 Cognome Nome Matricola Firma Nota: 1. L unica cosa che si può usare durante

Dettagli

Dati e Algoritmi I (Pietracaprina) Esercizi sulle Nozioni di Base

Dati e Algoritmi I (Pietracaprina) Esercizi sulle Nozioni di Base Dati e Algoritmi I (Pietracaprina) Esercizi sulle Nozioni di Base Dati e Algoritmi I (Pietracaprina): Esercizi 1 Problema 1. Sia T una stringa arbitraria di lunghezza n 1 su un alfabeto Σ. È sempre possibile

Dettagli

Elaborazione dell informazione. Elaborazione dell informazione. Rappresentazione dei numeri INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042)

Elaborazione dell informazione. Elaborazione dell informazione. Rappresentazione dei numeri INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042) Elaborazione dell informazione INFORMATICA PER LE DISCIPLINE UMANISTICHE 2 (13042) Elaborazione di informazione prevede una codifica come: Dato: insieme di simboli rappresentati su un supporto Negli elaboratori:

Dettagli

Sui Linguaggi Regolari: Teorema di Kleene - Pumping Lemm

Sui Linguaggi Regolari: Teorema di Kleene - Pumping Lemm Sui Linguaggi Regolari: Teorema di Kleene - Pumping Lemma N.Fanizzi - V.Carofiglio 6 aprile 2016 1 Teorema di Kleene 2 3 o 1 o 3 o 8 Teorema di Kleene Vale la seguente equivalenza: L 3 L FSL L REG Dimostrazione.

Dettagli