Codifica Immagini Fisse

Documenti analoghi
Abbiamo visto nella lezione precedente che le immagini possono essere compresse in vari modi, per ridurne l'occupazione di memoria (su disco o rete)

UNIVERSITÀ - OSPEDALE di PADOVA MEDICINA NUCLEARE 1. Lezione 5: Formati di immagine: JPEG. D. Cecchin, F. Bui FORMATO GRAFICO JPEG

LE IMMAGINI DIGITALI 3 formati. Università IUAV di venezia

Segnale analogico. Analogico vs digitale. Segnale digitale. Trasformazione da analogico a digitale

Compressione delle immagini (codifica JPEG)

La codifica dell informazione. Rappresentazione binaria. Rappresentazione posizionale in base 10

La compressione video. Analis i in multiris oluzione Wavelet La compres s ione di immag ini C ompres s ione JPEG S tandard MPEG

La codifica dell informazione

Nozioni di grafica sul calcolatore. concetti di base

Sistemi di Elaborazione delle Informazioni 6 CFU

UNIVERSITÀ DEGLI STUDI DI TRIESTE

Sistemi di Elaborazione delle Informazioni 6 CFU

Aosta Formati di file immagine. Quick tutorial per scegliere il formato giusto per ogni output. Diapositiva 1 di 13

Rappresentazione di immagini a colori. Rappresentazione dei colori. Rappresentazione dei colori LA RAPPRESENTAZIONE DELL INFORMAZIONE - II

Corso di Informatica

INFORMATICA GENERALE

Le immagini digitali

I formati dei file immagine

Sistemi di Elaborazione delle Informazioni

Suono digitale. Ø Un secondo di musica stereo richiede 44'100 campioni di 16 bit (2 byte) ciascuno per due canali, quindi 176'400 byte.

Informazione multimediale

gestione e modifica di immagini fotografiche digitali

4.3: La Codifica dei Suoni e dei Video

Rappresentazione binaria. Laboratorio di Informatica. Calcolatori digitali. N: numeri naturali. La codifica binaria. I primi 16 numeri binari

Codifica Video MPEG. Ing. Francesco Benedetto - Prof. Gaetano Giunta. Laboratorio di Telecomunicazioni (COMLAB) Università degli Studi Roma Tre

Compressione dei dati multimediali

Programma del corso. Introduzione Rappresentazione delle Informazioni Calcolo proposizionale Architettura del calcolatore Reti di calcolatori

Numeri interi. Laboratorio di Calcolo Paola Gallo

TECNICHE DI COMPRESSIONE DATI

Analogico vs digitale

RETI INTERNET MULTIMEDIALI. JPEG, TIFF, Facsimile

I.4 Rappresentazione dell informazione - Altre codifiche

Laboratorio di Informatica

La codifica di sorgente

Compressione dei dati. Appunti di Sistemi A cura del prof. Ing. Mario Catalano

Teoria e pratica I formati sonori

CODIFICA IMMAGINI IN BIANCO E NERO

C M A P M IONAM A E M NT N O

Soluzioni di Esercizi di Esame di Segnali Aleatori per Telecomunicazioni

INFORMATICA SANITARIA Domande ed Esercizi di Preparazione all Esame (Parti 8-17)

L'Informazione e la sua Codifica. Maurizio Palesi

Codifica dei caratteri ASCII ESTESO. Codifica delle immagini. Codifica immagini bitmap

2. FORMATI PER IMMAGINI STATICHE

Modulo informatica di base 1 Linea 2

RAPPRESENTAZIONE DELLE INFORMAZIONI

Elementi di informatica

Informatica di Base 1 Linea 1

Tipi di Informazione

Corso di Informatica

Codifica CCITT Fax. Introduzione Codifica monodimensionale Codifica bidimensionale. Codifica CCITT Fax. Codifica JBIG2

Codifica di Huffman e Lempel-Ziv-Welch A L B E R T O B E L U S S I A N N O A C C A D E M I C O /

Compressione di dati: testi, immagini, suoni e video. B. Cipolla

Image Elaboration. Image Processing

Le immagini digitali. formati, caratteristiche e uso. Testo e foto di Mario Ceppi

PDF created with pdffactory trial version

Cenni alla compressione delle immagini

La sensibilità dell occhio umano

Laboratorio di Informatica. delle informazioni. Pagina 1

Compressione di dati: testi, immagini, suoni e video. B. Cipolla

Immagini Digitali Immagini digitali

Lez. 7 Immagini Digitali. Prof. Pasquale De Michele (Gruppo 2) e Raffaele Farina (Gruppo 1) 1

Formati multimediali e metadati: Audio

Digital Watermarking Technology

La codifica delle immagini

Rappresentazione dei numeri. Esercizio. Rappresentazione dei numeri. Informazione multimediale

IMAGING DIGITALE COMPRESSIONE LOSSLESS LOSSY COSTO DI UN SEGNALE ESEMPIO NUMERICO C = AA COMPRESSIONE DI SEGNALI DATI E INFORMAZIONE

La codifica del testo

Informatica di Base - 6 c.f.u.

Corso di Informatica

Modulo 1: Le I.C.T. UD 1.3d: La Codifica Digitale dei Video

Cos è una wavelet? Applicazioni della trasformata wavelet. Analisi multirisoluzione

1.3d: La Codifica Digitale dei Video

Rappresentazione dell'informazione

Le nuove macchine fotografiche. Gianluca Tiburzi

Immagini vettoriali Immagini bitmap (o raster) Le immagini vettoriali .cdr.swf .svg .ai.dfx .eps.pdf .psd

Il sistema binario: bit e Byte Codifica del testo Il Byte come U.d.M. dell'informazione Multipli del Byte

L informazione e la sua codifica. Prof. Maurizio Naldi A.A. 2015/16

1 PERCHÉ LA AG-HPX301E È UNA CAMERA RIVOLUZIONARIA?

Codifica dei segnali audio

R. Cusani, F. Cuomo: Telecomunicazioni - DataLinkLayer: Gestione degli errori, Aprile 2010

Tecniche di compressione senza perdita

Tecniche di enfatizzazione

Informazione binaria: suoni, immagini, sequenze video

1.3d: La Codifica Digitale dei Suoni

Formati Immagine. Un po d immaginazione

Abilità Informatiche. capitoli 1-2. Prof. Fabio Calefato a.a Giurisprudenza

Rappresentazione delle Immagini

Informatica grafica e Multimedialità. 4 Immagini grafiche

FORMATI IMMAGINI. Formati Multimediali Francesca Gasparini

UNIVERSITÀ DEGLI STUDI DI TRIESTE

Capitolo 1. Video digitale. 1.1 Vantaggi del digitale.

La codifica binaria. Informatica B. Daniele Loiacono

La rappresentazione dell informazione. La codifica dei dati multimediali. Sommario

La rappresentazione dell informazione

RGB, YUV2, YV12, COSA SONO? Vediamolo nel dettaglio, cercando di capire quale sia conveniente utilizzare e perché.

Codifica dell Informazione

1.3c: La Codifica Digitale dei Suoni

Componenti multimediali per il Web. Modulo 14

Nozioni basilari sull audio digitale (2)

Interazione & Multimedia

Transcript:

Codifica Immagini Fisse Corso di Telecomunicazioni Anno Accademico 2008/2009

Contenuti Caratteristiche delle immagini Codifica JPEG

Perché comprimere Si supponga di voler trasmettere 30 fotografie in bianco e nero, digitalizzate e quantizzate con 8 bit/pixel di dimensione CIF (352x288) nel caso si utilizzi una codifica naturale senza compressione (es. BMP o TIFF). Ogni fotografia risulta composta da 352x288=101376 pixel. Ogni foto viene poi digitalizzata e quantizzata con 8 bit per ogni pixel, ottenendo un numero di bit per ogni foto pari a 8*101376=811008 bit. Per 30 foto il conto totale in bit risulta pari a 811008*30=24330240 bit (ovvero più di 3MB di informazione). Supponendo di utilizzare un canale GSM a 9.6 kbit/s, il tempo necessario alla trasmissione risulta pari a circa 42.2 minuti, con un modem a 64 kbit/s si riduce a 6.3 minuti.

Standard JPEG JPEG è uno standard di compressione per immagini, definito nel 1991 da un gruppo di esperti (Joint Photographic Experts Group). JPEG è stato progettato per comprimere sia immagini a colori che immagini a gradazioni di grigio. Si distinguono due tipi di compressione: compressione lossy: scarta delle informazioni delle immagini poco visibile all'occhio umano e comprime le rimanenti informazioni. L'immagine compressa è una buona approssimazione dell'immagine originale; compressione lossless: comprime tutte le informazioni di un immagine, in modo tale che l immagine prima compressa e poi decompressa, sia identica bit a bit a quella originale, senza alcuna perdita di informazioni e quindi di qualità. JPEG utilizza un algoritmo di compressione di tipo lossy.

Standard JPEG Lo standard JPEG è stato sviluppato in modo da soddisfare le seguenti indicazioni: deve essere in grado di ottenere elevati rapporti di compressione; deve poter ricostruire l'immagine in modo totalmente reversibile, oppure in modo irreversibile, ma con una elevata fedeltà; deve poter essere parametrizzato in modo da lasciare all'applicazione la possibilità di definire al meglio il rapporto di compressione e la fedeltà dell'immagine ricostruita; l'algoritmo non deve dipendere né dalla complessità della scena rappresentata né, possibilmente, dalle caratteristiche intrinseche dell'immagine, quali dimensione dello spazio dei colori, rapporto bit/pixel, etc.; la sua complessità computazionale deve permettere sia un'implementazione software, sia un'implementazione hardware, che rimanga contenuta in termini di costo.

Algoritmo JPEG

Lettura file sorgente I dati letti dal file immagine sorgente, sono organizzati come tre matrici, nello Spazio Colore RGB, di generiche dimensioni M x N. Ogni matrice sarà successivamente divisa in blocchi di dimensione 8x8, ovvero ogni blocco conterrà 64 pixel dell immagine originale. Quindi se M o N non risultano multipli di 8, sono aggiunte delle copie dell ultima riga o dell ultima colonna alla matrice dell immagine originale, sino a che la dimensione della nuova matrice non diventi un multiplo di 8. Nella decodifica si terrà conto di questi pixel di riempimento aggiunti, che verranno quindi eliminati

Trasformazione Spazio Colore L immagine viene trasformata dallo Spazio Colore RGB a quello Yuv. Dopo aver calcolato Y, u e v è possibile ridurre l informazione riguardante le componenti di crominanza tramite sottocampionamento. La componente di luminanza non deve invece essere decimata, altrimenti si avrebbe una perdita elevata di informazione a livello di qualità percettiva. Ciò deriva dal fatto che l occhio umano è meno sensibile alle variazioni cromatiche e non a quelle di luminosità.

RGB RGB -> Yuv U V Y

Trasformata (DCT) Ogni matrice è divisa in blocchi di dimensione 8x8. Ad ogni blocco è applicata la trasformata DCT bidimensionale, che restituisce ancora un blocco di dimensioni 8x8. Con l applicazione della DCT si passa da una rappresentazione nel dominio spaziale a una nel dominio delle frequenze. Una caratteristica saliente del blocco restituito dalla DCT è che nell angolo in lato a sinistra si trovano i dati relativi alle basse frequenze ed energeticamente più rilevanti, mentre nell angolo in basso a destra i coefficienti rappresentanti le alte frequente ed energeticamente meno importanti (si ricordi che l occhio si comporta come un filtro passa-basso).

Trasformata (DCT)

Frequenze (DCT) L utilità dell utilizzo della DCT è duplice: da un lato si sfruttano le note proprietà di compattazione dell energia, dall altro si riescono a trattare i coefficienti DCT in modo indipendente senza perdere di efficienza nella compressione. La DCT è invertibile senza perdita d informazione, a parte eventuali errori di arrotondamento.

Quantizzazione Escludendo la trasformazione in formati YUV, questa è la prima operazione lossy effettuata dall algoritmo in esame. Dopo aver ricevuto la matrice (8x8) delle frequenze dalla DCT, l algoritmo applica delle divisioni e arrotondamenti (queste due operazioni vengono appunto chiamate quantizzazione), in modo da rendere più valori possibili uguali a 0 (che vengono compressi in maniera estremamente semplice tramite RLE o codifica Huffman). In questa fase ogni elemento di ciascun blocco viene diviso per un coefficiente presente nella tabella di quantizzazione sempre di dimensione 8x8. L'effetto dell'operazione di divisione e' quello di arrotondare i valori prodotti dalla DCT, portando a zero quelli prossimi allo zero, smorzare le alte frequenze e arrotondare con maggiore precisione le frequenze basse, utilizzando una Tabella di quantizzazione per la luminanza e una opportuna per le due di crominanza.

Quantizzazione

Errore di Quantizzazione L'operazione di divisione e di arrotondamento del risultato per alti coefficienti nella Tabella di quantizzazione definiscono una tabella DCT quantizzata con valori notevolmente meno accurati nella parte bassa a destra. E' evidente che l'errore aumenta all'aumentare del coefficiente di quantizzazione a causa degli arrotondamenti. Le Tabelle di Quantizzazione non sono standard ma differiscono dal produttore di software, i gradi di compressione poi dipendono da essa (di solito viene usate quelle definite dagli standard H263 o MPEG). Qualitativamente se si ricostruisse l'immagine considerando le basse frequenze, risulterebbe priva di dettagli, con zone d'ombra e di luminosità notevolmente sfuocate. Diversamente considerando quelle alte si evidenzierebbero i contorni e i dettagli, mentre le parti sfumate verrebbero eliminate, quindi tutte di una stessa tonalità. Queste matrici sono di solito mutuate da studi psicovisuali (dobbiamo ringraziare i limiti dei nostri occhi per questo!).

Riordino coefficienti La fase finale del processo JPEG è la codifica dell'immagine quantizzata. La codifica JPEG consiste in tre differenti passi per comprimere l'immagine. Se i valori del blocco vengono visti come un'onda acustica (con la posizione nel blocco in ascissa e il valore in ordinata), l'elemento del blocco in posizione (0,0) detto coefficiente DC rappresenta la componente continua dell'onda (da qui il nome DC, Direct Current o corrente continua); gli altri valori del blocco sono relativi ad esso. Ai fini del calcolo, il coefficiente DC è il valore massimo in ampiezza presente nel blocco.

Codifica RLE Run Length Encode (RLE) è una semplice tecnica di compressione applicata ai componenti AC: il vettore 1x64 risultante dalla lettura a zig-zag contiene diversi valori nulli in sequenza, per questo si rappresenta il vettore tramite coppie (skip, value), dove skip è il numero di valori uguali a zero e value è il successivo valore diverso da zero. La coppia (0,0) viene considerata come segnale di fine sequenza. Sul valore DC di ciascun blocco viene invece applicata una tecnica detta DPCM. Questo sistema modifica il coefficiente DC dal valore assoluto ad un valore relativo al coefficiente DC del blocco precedente. Ad esempio, se i coefficienti DC di due blocchi adiacenti sono 227 e 205, il secondo diventerà -22. I blocchi adiacenti solitamente hanno un elevato grado di correlazione, così la codifica del coefficiente DC come differenza dal coefficiente precedente tipicamente produce un piccolissimo numero; gli altri elementi, di valori di per sé già contenuti, non vengono modificati.

Codifica Huffman L'ultima codifica entropica applicata ai dati è la classica codifica a lunghezza di codice variabile. In pratica i dati vengono suddivisi in 'parole' (stringhe di bit), viene analizzata la frequenza statistica di ciascuna parola e ognuna viene ricodificata con un codice a lunghezza variabile in funzione della frequenza di apparizione. Un codice corto per le parole che appaiono frequentemente e via via codici più lunghi per quelle meno frequenti. Complessivamente il numero di bit necessari per rappresentare i dati si riduce consistentemente.

Esempi Immagine originale in RGB, occupazione su disco in TIFF = 579KB

Immagine sulla componente Y

Immagine sulle componenti U, V

Immagine originale in RGB ricostruita senza la componente V

Esempi di compressione Immagine compressa JPG con qualità 5% occupazione su disco = 4.89KB

Esempi di compressione Immagine compressa JPG con qualità 15% occupazione su disco = 7.87KB

Esempi di compressione Immagine compressa JPG con qualità 50% occupazione su disco = 15.3KB

Esempi di compressione Immagine compressa JPG con qualità 90% occupazione su disco = 40.3KB

Esempi di compressione Immagine compressa JPG con qualità 100% occupazione su disco = 140KB