Università degli Studi di Palermo. Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica. Informatica per la Storia dell Arte

Documenti analoghi

La compressione audio

Informatica per la Storia dell Arte

Compressione del Segnale (Audio)

wave a 44,1 khz, 16 bit, PCM, stereo (standard cd audio) L utilizzo di una risoluzione dipende anche dal supporto che la dovrà ospitare.

Flussi Multimediali. Introduzione

Informatica per la Storia dell Arte Anno Accademico 2014/2015 Docente: ing. Salvatore Sorce

La compressione audio

Lezione 8: La rappresentazione dell informazione Multimediale Suoni e Video Venerdi 6 Novembre 2009

Come si misura la memoria di un calcolatore?

La compressione audio. Come risparmiare spazio e tempo lavorando sulla forma d onda

Informatica per la comunicazione" - lezione 7 -

Un ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti

Codifica delle Informazioni

La compressione audio. Come risparmiare spazio e tempo lavorando sulla forma d onda

Corso di Informatica

Realizzazione siti web. I suoni

Informatica. Rappresentazione binaria Per esempio diventa /10/2007. Introduzione ai sistemi informatici 1

FILE: ESTENSIONI o Formati. Augusto Grossi

Università degli Studi di Palermo. Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica

Informatica per la Storia dell Arte. Anno Accademico 2014/2015

Linguaggi ed Applicazioni mul1mediali

La codifica delle immagini

Immagini digitali. Paolo Zatelli. Dipartimento di Ingegneria Civile ed Ambientale Università di Trento. Immagini digitali

Informatica per la Storia dell Arte Anno Accademico 2013/2014 Docente: ing. Salvatore Sorce

La Videosorveglianza Criteri per il dimensionamento dello storage

IMMAGINE BITMAP E VETTORIALI

GUIDA ALLE SOLUZIONI

ELETTRONICA DIGITALE

Informatica grafica e Multimedialità. 4 Immagini grafiche

INFORMATICA E GRAFICA PER IL WEB

) *!' " * +! #"#, ( -. - ( #

La codifica delle Immagini. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132Sesto San Giovanni

Capitolo V : Il colore nelle immagini digitali

FONDAMENTI DI INFORMATICA. Ing. DAVIDE PIERATTONI. Facoltà di Ingegneria Università degli Studi di Udine. Compressione MPEG

Corso di Fondamenti di Telecomunicazioni

Software di compressione

Codifica video. Il video digitale. Sistemi Multimediali. Il video digitale. Il video digitale. Il video digitale.

La rappresentazione dell informazione. La codifica dei dati multimediali. Sommario

Le immagini digitali. Le immagini digitali. Caterina Balletti. Caterina Balletti. Immagini grafiche. Trattamento di immagini digitali.

La codifica delle immagini

Ingegneria Aerospaziale Prof. A. Palomba - Elementi di Informatica (E-Z) Rappresentazione caratteri Rappresentazioni immagini Rappresentazione suoni

Strutturazione logica dei dati: i file

Immagini Digitali Immagini digitali

PDF created with pdffactory trial version

Giorgio Maria Di Nunzio

Dal foglio di carta alla multimedialità

Elementi di teoria dei segnali /b

C M A P M IONAM A E M NT N O

La rappresentazione dell informazione

Realizzazione siti web. Le immagini

Elementi di Informatica e Programmazione

Computer Graphics and Animation. Introduzione a Maya

Rappresentazione delle informazioni

Algoritmi e strutture dati. Codici di Huffman

Un ripasso di aritmetica: Conversione dalla base 10 alla base 16

COMUNICAZIONI ELETTRICHE + TRASMISSIONE NUMERICA COMPITO 13/7/2005

La codifica delle immagini

Sistema operativo: Gestione della memoria

Il colore. IGEA febbraio 2007

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

La codifica delle immagini

Il campionamento. La digitalizzazione. Teoria e pratica. La rappresentazione digitale delle immagini. La rappresentazione digitale delle immagini

VideoStreaming su IP

Codifica delle immagini

Elaborazione di Immagini e Suoni / Riconoscimento e Visioni Artificiali 12 c.f.u. Rappresentazione delle informazioni

Unità di Misura Informatiche

ARCHITETTURA DI RETE FOLEGNANI ANDREA

Rappresentazione delle immagini

Codifica dell informazione

gestione e modifica di immagini fotografiche digitali

Esercitazione E6 Esercizi d esame

Elaborazione testi: immagini

Digital Signal Processing: Introduzione

La memoria - generalità

Codifica delle immagini

L informazione grafica. Le immagini digitali. Esempi. Due grandi categorie. Introduzione

Standard per Reti a Commutazione di Pacchetto Prof. Vincenzo Auletta Università degli studi di Salerno Laurea in Informatica

Introduzione all analisi dei segnali digitali.

PIANO BIENNALE PER I DIRITTI DELLE PERSONE CON DISABILITÀ

Marta Capiluppi Dipartimento di Informatica Università di Verona

Facoltà di Scienze e Tecnologie

Programmazione per il Web

Sistema di ripresa con fotocamera digitale fissa Calibrazione

Logica e codifica binaria dell informazione

Laboratorio di Informatica

Le immagini digitali. formati, caratteristiche e uso. Testo e foto di Mario Ceppi

DISCRETIZZAZIONE DI UN SEGNALE ANALOGICO:

Elementi di Informatica e Programmazione

La memoria centrale (RAM)

xdsl Generalità xdsl fa riferimento a tutti i tipi di Digital Subscriber Line

Codifica delle immagini

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

Nella prima lezione... Che cos è il Digitale. Prima parte: Che cos è il Digitale. Che cos è il Digitale. Che cos è il Digitale

Analisi di scenario File Nr. 10

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l Ambiente e il Territorio

Lezione 2: Immagini digitali (1)

Colorare coi numeri La rappresentazione delle immagini

INFORMATICA. Elaborazione delle immagini digitali. Università degli Studi di Foggia Dipartimento di Medicina Clinica e Sperimentale

Architettura dei calcolatori II parte Memorie

Transcript:

Università degli Studi di Palermo Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica Informatica per la Storia dell Arte Anno Accademico 2014/2015 Docente: ing. Salvatore Sorce La compressione sulla base di materiale didattico originale del prof. Vincenzo Lombardo MultiD@MS Torino

Sull uso dell e-mail SUBJECT:<testo significativo> Testo chiaro e conciso Usare l italiano *esteso* e grammaticalmente corretto Inserire i dati utili per ottenere l informazione desiderata Firmare sempre il messaggio In mancanza di subject e di firma, il messaggio rimarrà senza risposta!! Altri dettagli nella sezione F.A.Q. del mio sito

Notizie Docente: Ing. Salvatore Sorce, Ph.D. salvatore.sorce@unipa.it, 09123862609 Lezioni: Lunedì, 14-17, aula Multimediale A del Polo Didattico Ricevimento: Lunedì, 11-12, @ ex-dip. Ing. Nucleare, edificio 6, II piano Dopo il corso: per appuntamento Sito web: http://www.unipa.it/sorce (LEGGERE LA SEZIONE F.A.Q.)

La compressione Arte di minimizzare il numero di bit necessari per rappresentare le informazioni Obiettivi: ridurre la memoria occupata ridurre i costi (tempo) di trasmissione mantenere una buona qualità in confronto alla versione non compressa (al limite, la stessa qualità)

Obiettivo: riproduzione trasparente Riproduzione dei contenuti uguale all originale Audio che anche orecchie sensibili non riescono a distinguere dall originale (non compresso) Immagini che anche occhi sensibili non riescono a distinguere dall originale (non compresso) Sequenze audio/video che si vedono e suonano come l originale (non compresso) Numero minimo di bit mantenendo una riproduzione trasparente del segnale

Esempio: l audio digitale Audio digitale non compresso: alta fedeltà delle copie del segnale robustezza gamma dinamica estesa Svantaggio: alto tasso di trasferimento dati campionamento: 44.1 khz (CD), 48 khz (DAT) quantizzazione: PCM lineare a 16 bit L audio digitale non compresso occupa... molto spazio sull hard-disk per la memorizzazione una banda ampia sul canale di trasmissione

Esempio: brano di 1 min con qualità CD Parametri campionamento = 44.100 campioni/sec quantizzazione = 16 bit/campione = 2 byte/campione canali = 2 Memoria = 44.100 c/s * 2 can * 2 byte/c * 60 s ~ 10 Mbyte per ogni minuto di musica stereo. Tempo necessario per il trasferimento di un minuto di musica stereo su un collegamento a 200 kbps = 10 Mbyte * 8 bit/byte 10*1024*1024*8 = ~ 7 minuti (200 kbps * 60 s) 200*1024*60 per scaricare un solo minuto di musica stereo! (sarebbe impossibile qualsiasi applicazione live, come la web-radio)

Parametri: Esempio: immagine a colori 1600x1200 px 1600x1200 = 1.920.000 pixel Quantizzazione a 24 bit/px Memoria = 19200000px x 24 bit/px = 46.080.000 bit In Byte -> 46.080.000 bit / 8 bit/byte = 5.760.000 Byte ~ 5,5 Mbyte Tempo necessario per il trasferimento di un immagine 1600x1200 a 24 bit/px su un collegamento a 200 kbps = 46.080.000 bit 200 kbps = 230 secondi (~ 4 minuti) (sarebbe impossibile qualsiasi applicazione live, come lo streaming A/V)

Tipi di compressione Classificazione in base al principio: Compressione percettiva Si basa su considerazioni fisiologiche, cioè su come l informazione viene percepita (es.: il suono dalle orecchie, le immagini dagli occhi) Il risultato è (o tende ad essere) percettivamente uguale all originale Alti tassi di compressione possibili, a costo di un risultato percettivamente peggiore Compressione non-percettiva Si basa su considerazioni esclusivamente numeriche Il risultato può essere identico all originale (non compresso) Il tasso di compressione dipende da come è strutturata l informazione non compressa (può anche peggiorare!)

Tipi di compressione Classificazione in base al risultato: Compressione con perdita La sequenza di bit ricostruita non è uguale all originale Nonostante ciò, il segnale finale può essere percepito come uguale all originale Compressione senza perdita La sequenza di bit ricostruita è uguale all originale Il segnale finale è identico all originale

Compressione e decompressione Dati originali non compressi lossy lossless Segnale non compresso diverso ma percepito come l originale Encoding, Codifica, Compressione Decoding, Decodifica, Decompressione Bitstream in modalità compressa

Compressione non-percettiva

Compressione non-percettiva Basata su sole considerazioni numeriche Run-Length Encoding, RLE Codifica una stringa di bit contando le sequenze di bit 0 e 1 che si susseguono Esempio: i fax sono lunghe sequenze di 0 e 1 che codificano il contenuto di una pagina in bianco e nero. La codifica RLE è utilizzata per specificare la lunghezza della prima sequenza di 0, seguita dalla sequenza di 1, ecc. la compressione RLE è lossless, cioè senza perdita la rappresentazione originale può essere ricostruita perfettamente Per le immagini, memorizzazione di zone di colore uniforme tramite stringhe speciali Buona per immagini che hanno un numero limitato di colori Se l immagine è complessa la memorizzazione compressa occupa più spazio dell originale!

Audio: Codifica della differenza (DPCM) +1 +1 0 0 +1-1 -1 0 0 +1 0-1 +3-3 -1-1 0 +1 +2 Ridondanze temporali tra campioni (è molto probabile che campioni vicini nel tempo siano abbastanza simili, cioè differiscano di poco) La differenza tra due campioni a n bit si può rappresentare con meno bit di n Si memorizza la differenza rispetto al campione precedente

Audio: Codifica della differenza (DPCM) +1 +1 +1 0 0-1 -1 0 +1 0 0-1 +5 +6-2 +4-4 -4-8 In questa zona bastano 2 bit per codificare le differenze In questa zona servono 4 bit Differenze elevate (alte frequenze) non si possono rappresentare con un numero piccolo di bit Gli errori introdotti porterebbero a distorsioni sulle alte frequenze La compressione DPCM può essere con perdita

Immagini: Palette, Tavolozza, Look-Up-Table Non sempre in un immagine sono presenti tutti i colori rappresentabili con 24 bit (che sono 2 24 = 16.777.216) Si conta il numero di colori effettivamente presenti Si stabilisce il numero di bit necessario a rappresentarli (ricorda: 2 n = nr di rappresentazioni possibili con n bit) Si crea una tabella (codice) che associa ai colori presenti le relative sequenze di bit Può essere senza perdita, a prezzo di allegare all immagine la palette utilizzata Non sempre è percorribile (immagini con elevato numero di colori presenti) Esempio con 256 colori (quindi bastano 8 bit, 2 8 = 256): 0 R 0 G 0 B 0 1 R 1 G 1 B 1 2 R 2 G 2 B 2 255 R 255 G 255 B 255

La compressione percettiva MP3, JPEG & Co. Principi psicoacustici applicati

X(n) (sequenza di bit originale) Schema generale Info aggiuntive Compressione (analisi psicoacustica, rimozione componenti percettivamente irrilevanti) Codifica del bitstream X (n) (sequenza di bit ricostruita) bitstream nel canale Sintesi segnale Ricostruzione campioni Decodifica del bitstream X (n) X(n), ma, nei limiti della larghezza di banda disponibile, deve essere percepito X(n)

Audio: Soglia assoluta dell udito

Audio: MPEG (Motion Picture Experts Group) Gruppo di lavoro di ISO/IEC per lo sviluppo di standard internazionali per: compressione, decompressione, elaborazione, e rappresentazione codificata di Video Audio combinazioni A/V

Audio: Alcuni standard MPEG MPEG-1: memorizzazione/recupero video/audio (11/92) MPEG-2, standard per la TV digitale (11/94) MPEG-4 v. 1, standard applicazioni multimediali (10/98) v. 2, standard audio/video HDTV (12/99) MPEG-7: standard per la rappresentazione dei contenuti ricerca, filtraggio, gestione di info multimediale rilasciato a luglio 2001

Audio: MPEG-1/2 Layer III (MP3) 1987 progetto Eureka (Digital Audio Broadcasting) lavoro su audio percettivo in collaborazione tra Fraunhofer IIS e l Università di Erlangen risultato: algoritmo molto potente ISO-MPEG Audio Layer- III http://it.wikipedia.org/wiki/mp3

Audio: Lo schema di compressione MPEG-1 Struttura di base comune su più layer calcolo delle sottobande calcolo del modello psicoacustico 3 Layer Layer I: semplice, poco efficace Layer III: complesso, efficace Scelta del layer - rapporto qualità/compressione

Layer I Audio: I tre livelli di compressione il più semplice (bitrate oltre 128 kbps a canale) DCC di Philips usa la compressione di Layer I a 192 Layer II complessità media (bitrate circa 128 kbps a canale) applicazioni in DAB Layer III il più complesso, migliore qualità 64 kbps adatto per trasmissione audio su ISDN

Audio: Modalità di compressione Più frequenze di campionamento (32/44.1/48) Bitstream compresso supporta mono, dual mono, stereo, joint stereo Bit rate da 32 a 224 kbps (compressione da 24 a 2,7 volte) tassi fissi e variabili Supporta il controllo e la correzione degli errori Informazioni supplementari

Audio: MPEG 1 - Layer III (complessità) audio digitale PCM Analisi tempo-frequenza Banco di filtri (32 sottobande) 31 0 Analisi psicoacustica MDCT 575 0 Allocazione dei bit, quantizzazione e codifica Loop controllo distorsione Loop controllo quant. log. Codifica di Huffman Riserva FFT 1024 punti Modello psicoacustico Codifica info agg. Codifica del bitstream bitstream audio digitale decompresso Ricostruzione dei campioni nel tempo Ricostruzione dei campioni per bande Decodifica del bitstream

Audio: Tipiche riduzioni di MPEG Riferimento standard (CD): 16 bit * 2 canali * 44100 sr = 1.411 kbps 1:4 con Layer I corrisponde a 384 kbps per un segnale stereo 1:6...1:8 con Layer II corrisponde a 256..192 kbps per un segnale stereo 1:10...1:12 con Layer III (MP3) corrisponde a 128..112 kbps per un segnale stereo sempre mantenendo percettivamente la qualità audio CD

Audio: Decodifica Sintetizza un segnale a partire dalle componenti spettrali codificate Non si ha più lo stesso segnale!!! Tutto dipende dal bit-rate bitstream audio digitale decompresso Ricostruzione dei campioni nel tempo Ricostruzione dei campioni per bande Decodifica del bitstream

Audio: Esempi di bitrate bit-rate = numero medio di bit consumati da un secondo di dati audio (kbps) bit-rate per il CD = 1411.2 kbps bit-rate per MP3 per qualità CD = 128 kbps

Audio: Le performance di MP3 qualità telefonica: 96:1 (2.5 khz / mono / 8 kbps) meglio di AM radio: 24:1 (7.5 khz / mono / 32 kbps) simile a FM radio: 26...24:1 (11 khz / stereo / 56...64 kbps) quasi-cd: 16:1 (15 khz / stereo / 96 kbps) CD: 14..12:1 (>15 khz / stereo / 112..128kbps) prende approx. 1Mb/minute di spazio hard-disk Oltre: 8 4:1 per la musica acustica

Audio: MP3 Codec programma del tipo di una libreria di sistema (collezione di funzioni) vengono lanciate dai programmi di frontend codec in distribuzione con frontend MP3

Audio: L encoder migliore Non ha senso chiedersi quale sia l encoder migliore: la risposta dipende dalle esigenze encoder veloci/lenti (> velocità, < fedeltà audio) confrontare mp3 ottenuti da encoder diversi a parità di bit-rate Consiglio pratico: creare MP3 con basso (ma adeguato) bitrate con encoder lenti Le cose potrebbero cambiare se c è l esigenza del tempo reale (codifica in diretta)

interfaccia ai codec Audio: I Frontend MP3 Alcuni frontend implementano funzioni per normalizzare il volume, o realizzano ID TAGS IDTAG è informazione (testuale, in genere) nel file di layer III (autore, titolo, etc...) Esempio: MP3Editor, Audacity, Nero WaveEditor, Player MP3 suona mentre decomprime i dati audio (campioni) vengono inviati alla scheda audio per la conversione D/A Esempi: winamp, windows media player, videolan, ecc.

Immagini: Dithering Il dithering viene usato nelle immagini digitali per creare l'illusione di una profondità di colore (nr di bit per pixel) maggiore di quella disponibile In un'immagine sottoposta a dithering, i colori non disponibili vengono approssimati dalla distribuzione dei pixel colorati con le tinte disponibili. L'occhio umano percepisce la diffusione come un amalgama dei colori Si può usare come forma particolare di compressione percettiva (con perdita)

Immagini: Dithering in rosso e blu

Immagini: Dithering a 32 colori

Immagini: Dithering Immagine originale Tavolozza std 8 bit no dithering Tavolozza std 8 bit dithering Tavolozza opt 8 bit no dithering Tavolozza opt 4 bit no dithering Tavolozza opt 4 bit dithering Fonte: http://it.wikipedia.org/wiki/dithering

Immagini: Compressione JPEG Osservazione 1: disponibilità di immagini con un elevatissimo numero di colori e di computer in grado di elaborarle Osservazione 2: I nostri occhi non sono sensibili alle piccole variazioni di tonalità, ma sono sensibili alle piccole variazioni di luminosità La compressione JPEG provvede a salvare le componenti a bassa frequenza (zone di colore uniformi) e una parte delle componenti ad alta frequenza (particolari dell immagine) fornisce una descrizione meno accurata delle sfumature di colore Rapporto di compressione variabile sulla base della qualità residua desiderata Compressione fino a 20:1 senza variazioni percepibili ai nostri occhi È una compressione percettiva e con perdita (sempre)

Immagini: Compressione JPEG

Immagini: Compressione JPEG Qualità 10% - 3,2 KB Qualità 50% - 6,7 KB Qualità 90% - 30,2 KB Qualità 100% - 87,7 KB Fonte: http://it.wikipedia.org/wiki/joint_photographic_experts_group

Sequenze A/V: Compressione MPEG La stessa idea alla base del JPEG, ma applicata ai filmati Osservazione: i filmati sono costituiti in genere da lunghe sequenze di immagini consecutive molto simili Il primo frame si comprime con JPEG I successivi si codificano per differenza dal precedente la compressione MPEG memorizza solo la differenza tra fotogrammi consecutivi ciò permette livelli di compressione elevatissimi (finché non si avvera uno stacco di scena) Per la traccia audio: MP3