La compressione audio. Come risparmiare spazio e tempo lavorando sulla forma d onda



Documenti analoghi
La compressione audio. Come risparmiare spazio e tempo lavorando sulla forma d onda

La compressione audio

La compressione audio

Compressione del suono. Come risparmiare spazio e tempo lavorando sulla forma d onda

Compressione del suono. Come risparmiare spazio e tempo lavorando sulla forma d onda

Compressione del suono. Come risparmiare spazio e tempo lavorando sulla forma d onda

Università degli Studi di Palermo. Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica. Informatica per la Storia dell Arte

Compressione Parte 2. Prof. Filippo Milotta Informatica Musicale

Percezione del Suono

Compressione Parte 1. Prof. Filippo Milotta Informatica Musicale

Tecnologie Multimediali a.a. 2017/2018. Docente: DOTT.SSA VALERIA FIONDA

Il suono digitale. Concetti di base

Tecnologie Multimediali a.a. 2018/2019. Docente: DOTT.SSA VALERIA FIONDA

Università degli Studi di Cagliari Facoltà di Scienze Corso di Laurea in Matematica

Introduzione alle reti wireless Reti Avanzate, a.a. 2012/2013

Capitolo 4 Compressione sorgenti dinamiche

Nozioni basilari sull audio digitale (2)

La codifica dei suoni

Digitalizzazione Parte 2

Teoria e pratica I formati sonori

Corso di Informatica

FORMATI MULTIMEDIALI Audio digitale

Informazione binaria:

La codifica dei suoni

L informazione numerica

La codifica dei suoni

INTRODUZIONE ALL AUDIO DIGITALE. 29/10/2008 Imparare a registrare Antonio Arzedi

Rappresentazione di immagini a colori. Rappresentazione dei colori. Rappresentazione dei colori LA RAPPRESENTAZIONE DELL INFORMAZIONE - II

Rappresentazione digitale del suono

Formati multimediali e metadati: Audio

Elaborazione di Immagini e Suoni / Riconoscimento e Visioni Artificiali 12 c.f.u. I suoni Rappresentazione digitale

La codifica dei Suoni. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San Giovanni

FONDAMENTI DI INFORMATICA. Prof. PIER LUCA MONTESSORO. Facoltà di Ingegneria Università degli Studi di Udine. Compressione audio

Rappresentazione digitale del suono

La codifica dei suoni

I SUONI. I suoni Il campionamento File Wave e Midi

Corso di Informatica modulo Informatica di Base 6 CFU. I suoni Rappresentazione digitale

Formati audio Lossy (con perdita di qualità) WMA (.wma): formato windows media audio, compresso e molto simile a un mp3. Formato di compressione

Suono digitale. Ø Un secondo di musica stereo richiede 44'100 campioni di 16 bit (2 byte) ciascuno per due canali, quindi 176'400 byte.

Compressione del Segnale (Audio)

Conversione Analogica-Digitale e Digitale-Analogica

Tutti i dispositivi di un elaboratore sono realizzati con tecnologia digitale

Audio. Lezione precedente: codifica binaria. Tutta l'informazione viene codificata in binario. La musica non fa eccezione (digitalizzazione)

Informatica Musicale

Rappresentazione digitale del suono

FRANCESCO MARINO - TELECOMUNICAZIONI

Storicamente, ogni tipo di macchina usava un suo formato per i dati audio. Alcuni formati applicabili in modo più generale

La codifica del suono. Informatica di Base D -- Rossano Gaeta 102

La codifica video. Per comprendere il procedimento di rappresentazione digitale di un filmato prendiamo come modello una pellicola cinematografica:

Analogico vs digitale

Audio. Lezione precedente: codifica binaria. Tutta l'informazione viene codificata in binario. La musica non fa eccezione (digitalizzazione)

FORMATI GRAFICI BITMAP

di Napoli Prof. Antonio Fratini

Linguaggi ed Applicazioni mul1mediali

Carlo Alberto Bentivoglio Aldo Caldarelli Tecnologie multimediali Audio e video. eum x tecnologie dell educazione

Archiviazione dei dati audio

LA CODIFICA DEI SUONI

Storicamente, ogni tipo di macchina usava un suo formato per i dati audio. Alcuni formati applicabili in modo più generale

Tecnologie Multimediali a.a. 2016/2017 DOTT.SSA VALERIA FIONDA DOTT. ROBERTO PARISE

Evoluzione degli standard MPEG

Sistemi di Elaborazione delle Informazioni

Rappresentazione digitale del suono

La compressione video. Analis i in multiris oluzione Wavelet La compres s ione di immag ini C ompres s ione JPEG S tandard MPEG

Calcolo numerico per utilizzare i residui di udito

Tecnologie Multimediali a.a. 2016/2017. Docente: DOTT.SSA VALERIA FIONDA

Page 1. Elettronica delle telecomunicazioni 2003 DDC 1. Politecnico di Torino Facoltà dell Informazione. Contenuti del Capitolo 4

INDICE Esempi di segnali determinati: periodici e di energia Esempio di segnale aleatorio...4

Architettura di un elaboratore. Informatica Architettura di un elaboratore 1

Codifica dei caratteri

Università degli Studi di Palermo. Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica

I suoni! (digitali) V2.1 Ott

Numeri interi. Laboratorio di Calcolo Paola Gallo

QUANTIZZAZIONE E CONVERSIONE IN FORMA NUMERICA. 1 Fondamenti Segnali e Trasmissione

Campionamento e quantizzazione

Informazione binaria: Codici per la rilevazione e correzione di errori Codici di compressione

La codifica di sorgente

Codifica dei segnali audio

La codifica del testo

I principali Formati Audio. Progetto The Wall Liceo Classico G. D Annunzio - Pescara

I suoni Rappresentazione digitale

Compressione di dati: testi, immagini, suoni e video

VOIP. (Telefonia su Internet) V1.5: Febbraio

Comunicazioni Elettriche II

OROS A2S OROS Advanced Swept Sine

Rappresentazione digitale del suono

Rappresentazione delle immagini

Progetto e realizzazione di un sistema DSP software per la correzione degli artefatti nella riproduzione audio digitale

Modulo 1: Le I.C.T. UD 1.3c: La Codifica Digitale dei Suoni

Codifica dei caratteri ASCII ESTESO. Codifica delle immagini. Codifica immagini bitmap

Reti di Calcolatori a.a

Audio Digitale. Rappresentazione e trattamento. Multimedia 112

Tecnologie Multimediali a.a. 2017/2018. Docente: DOTT.SSA VALERIA FIONDA

Campionamento e quantizzazione, errori, SNR. errori, tipi base, esempi di circuiti. errori, classificazione, esempi di circuiti

Come si misura la memoria di un calcolatore?

La codifica video. Il codificatore ibrido. Principi di base Compressione spaziale Tecniche di predizione temporale Stima e compensazione del movimento

Transcript:

La compressione audio Come risparmiare spazio e tempo lavorando sulla forma d onda 1

La compressione audio L arte di minimizzare le risorse per i dati audio ridurre la memoria occupata ridurre i costi di trasmissione Risultati attuali: buona qualità in confronto all audio non compresso (stesso tasso di trasferimento dati) 2

Obiettivo: riproduzione trasparente Audio che anche orecchie sensibili non riescono a distinguere dall originale Numero minimo di bit mantenendo una riproduzione trasparente del segnale 3

L audio digitale Vantaggi alta fedeltà delle copie del segnale robustezza gamma dinamica estesa Svantaggio: alto tasso di trasferimento dati campionamento: 44.1 khz (CD), 48 khz (DAT) quantizzazione: PCM lineare a 16 bit 4

Perché nasce la compressione L audio digitale non compresso occupa... molto spazio sull hard-disk per la memorizzazione una banda ampia sul canale di trasmissione 5

Esempio: brano di 1 min con qualità CD Parametri campionamento = 44,100 c/s quantizzazione = 16 bit = 2 byte canali = 2 Memoria = 44.100 c/s * 2 can * 2 byte/c * 60 s ~ 10 Mbyte Tempo = 10 Mbyte * 8 bit/byte / (56 kbps * 60 s) ~ 24 min Solo per scaricare un minuto di musica stereo! 6

non solo Problemi di banda per applicazioni multimediali Accesso e trasferimento dati sempre più veloce, ma... immagini, video, testo, e audio di alta qualità sincronizzati tutti assieme 7

Due livelli di applicazioni Bassa qualità telefonia Alta qualità colonne sonore per giochi su CD-ROM memorie allo stato solido (flash) per i suoni audio su Internet broadcast di audio digitale (Radio e TV) 8

Compressione e decompressione Dati audio non compressi lossless Encoding, Codifica, Compressione Decoding, Decodifica, lossy Decompressione Audio non compresso che suona come l originale Bitstream in modalità compressa 9

Nell analogico Problema: gamma dinamica ridotta Riduzione del rumore (Dolby) per aumentare la gamma dinamica ridotta dal rumore compansion: compression + expansion registrazione: compressione della gamma dinamica riproduzione: espansione della gamma dinamica Compansion su tutte le frequenze (dbx) o su bande selezionate (Dolby A, B, C) 10

La compansion nel digitale Esempio: valori di 8 bit 00001101 = 1101 x 1 00011010 = 1101 x 10 00110100 = 1101 x 100 01101000 = 1101 x 1000 11010000 = 1101 x 10000 Sono sufficienti 7 bit = 4 + 3 (si risparmia 1 bit: riduzione del 12,5%) Perdita di accuratezza nei valori più grandi 11

ITU-T G.711, µ-law e A-law +32767 255 +32767-32768 0-32768 12

µ-law compansion +7 +3-4 -8 Quantizzazione logaritimica Gamma dinamica di 14 bit con una codifica a 8-bit Per i servizi voce ISDN in Nord America e Giappone Semplice il computo della codifica 13

Codifica µ-law Codifica PCM lineare (a 16 bit) codifica µ-law a 8-bit Decodifica PCM lineare (a 16 bit) 14

Esempi di codifica µ-law 15

Lossy µ-law -200 (a 16 bit) 106 a 8-bit -193 (a 16 bit) 16

ADPCM CCITT G.721, G.723, e ITU-T G.726 Standard per la compressione di dati vocali CCITT G.721 (ADPCM a 32 Kbps) CCITT G.723 (ADPCM a 24 e 40 Kbps) ADPCM = Adaptive Differential PCM metodo comune di compressione buon compromesso tra velocità di elaborazione, tasso di compressione e decodifica di qualità 17

Codifica della differenza (DPCM) +1 0 0 +1 +1-1 -1 +1 0 0 0-1 -3 +3-1 -1 0 +1 +2 Ridondanze temporali tra i campioni La differenza tra due campioni a x-bit si può rappresentare con meno bit di x Si memorizza la differenza (non il campione) 18

Problema Slope Overload +1 +1 +1 0 0-1 -1 0 +1 0 0-1 -2 +5-4 -8 +6-4 +4 Differenze elevate (alte frequenze) non si possono rappresentare con un numero piccolo di bit Gli errori introdotti porterebbero a distorsioni sulle alte frequenze 19

Adaptive DPCM (ADPCM) Passi di quantizzazione più grandi per differenze più grandi, e viceversa Si usano i campioni precedenti per stimare i cambiamenti futuri 20

Schema di ADPCM 21

Raffiniamo l adattabilità ADPCM campione PCM a x-bit + + Quantizer differenza ADPCM a y-bit Campione n+1 PCM predetto + Adattatore Step-Size Predictor + + Requantizer 22

Due varianti di ADPCM IMA/DVI ADPCM comprime dati audio a 16-bit in soli 4 bit Microsoft ADPCM variante di ADPCM da usare con i WAV anch esso dati audio a 16-bit data in 4-bit data 23

IMA ADPCM campione PCM a 16-bit + + Quantizer differenza ADPCM a 4-bit Campione n-1 PCM + Adattatore Step-Size Register + + Requantizer Predictor non adattativo Passo di quantizzazione aumenta in modo logaritmico 24

25 IMA: Tabella Passi (di quantizzazione) 6484 71 1166 53 209 35 37 17 32767 88 5894 70 1060 52 190 34 34 16 29794 87 5358 69 963 51 173 33 31 15 27086 86 4871 68 876 50 157 32 28 14 24623 85 4428 67 796 49 143 31 25 13 22358 84 4026 66 724 48 130 30 23 12 20350 83 3660 65 658 47 118 29 21 11 18500 82 3327 64 598 46 107 28 19 10 16818 81 3024 63 544 45 97 27 17 9 15289 80 2749 62 494 44 88 26 16 8 13899 79 2499 61 449 43 80 25 14 7 12635 78 2272 60 408 42 73 24 13 6 11487 77 2066 59 371 41 66 23 12 5 10442 76 1878 58 337 40 60 22 11 4 9493 75 1707 57 307 39 55 21 10 3 8630 74 1552 56 279 38 50 20 9 2 7845 73 1411 55 253 37 45 19 8 1 7132 72 1282 54 230 36 41 18 7 0 Passo Indice Passo Indice Passo Indice Passo Indice Passo Indice

Selezione step-size adattiva Quantizzazione Output del Quantizer Moltiplicatore Variazione indice differenza < 1/4passo 000 0,00-1 1/4passo < differenza < 1/2passo 001 0,25-1 1/2passo < differenza < 3/4passo 010 0,50-1 3/4passo < differenza < passo 011 0,75-1 passo < differenza < 5/4passo 100 1,00 2 5/4passo < differenza < 3/2passo 101 1,25 4 3/2passo < differenza < 7/4passo 110 1,50 6 7/4passo < differenza 111 1,75 8 26

Adattatore Step-size Quantizer Adattatore Step-Size Requantizer Quantizer Nuovo Step-Size Output Quantizer Lookup Tabella Step-Size Limiti tabella (0-88) + Adattamento indice Calcolo Adattamento Indice Tabella Step-size Nuovo Step-Size Nuovo indice Registro Requantizer 27

Esempio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X[n] 100 112 120 127 131 129 118 106 100 100 111 113 99 54 20 C[n] 12 9 9 4-1 -12-13 -9 0 11 3-14 -45-51 Indice/ Passo 0/7 0/7 6/13 5/12 4/11 3/10 2/9 6/13 5/12 4/11 3/10 5/12 4/11 8/16 16/34 Confronto C[N]-Passo 3/2 7<12<7/4 7 1/2 13<9<3/4 13 3/4 12<9< 12 1/4 11<4<1/2 11 1<1/4 10 5/4 9<12<3/2 9 3/4 13<13< 13 3/4 12< 9< 12 0<1/4 11 10<11<5/4 10 1/4 12<3<1/2 12 5/4 11<14<3/2 11 7/4 16<45 3/2 34<51<7/4 34 Output Quant. 110 010 011 001 000 101 011 011 000 100 001 101 111 110 Var. indice 6-1 -1-1 -1 4-1 -1-1 2-1 4 8 6 Nuovo indice 6 5 4 3 2 6 5 4 3 5 4 8 16 22 Molt. 1,5 0,5 0,75 0,25 0 1,25 0,75 0,75 0 1,00 0,25 1,25 1,75 1,5 10,5 6,5 9 2,75 0 11,25 9,75 9 0 10 3 13,75 28 51 Decode 100 111 118 127 130 130 119 109 100 100 110 113 99 71 20 28

La compressione di tipo percettivo MP3 & Co. Principi psicoacustici applicati 29

Schema generale X(n) Analisi tempo/ frequenza Analisi psicoacustica Parametri Soglie di mascheramento Quantizzazione e Codifica Allocazione di bit Compressione senza perdite (entropia) Info aggiuntive Codifica del bitstream bitstream nel canale X (n) Sintesi segnale Ricostruzione campioni per banda Decodifica del bitstream 30

Soglia assoluta dell udito 31

Le bande di frequenza critiche Bande di 100 Hz fino a circa 500 Hz Bande per 20% del centro oltre 500 Hz Banda Centro Estremi 1 50-100 2 150 100-200 3 250 200-300 7 700 630-770 11 1370 1270-1480 15 2500 2320-2700 19 4800 4400-5300 20 5800 5300-6400 25 19500 15500-32

Soglie di mascheramento globale 33

Mascheramento simultaneo db SNR SMR MNR Soglia di mascheramento m-1 m m+1 Tono di mascheramento Minima soglia di mascheramento Banda critica Banda vicina frequenza 34

Mascheramento temporale db Pre (5 ms) Simultaneo Post (50-300ms) masker -50 0 50 100150 0 50 100 150 250 ms 35

MPEG (Motion Picture coding Experts Group) Gruppo di lavoro di ISO/IEC per lo sviluppo di standard internazionali per... compressione, decompressione, elaborazione, e rappresentazione codificata di video, audio, combinazioni A/V. 36

Standard MPEG MPEG-1: memorizzazione/recupero video/audio (11/92) MPEG-2, standard per la TV digitale (11/94) MPEG-4 v. 1, standard applicazioni multimediali (10/98) v. 2, standard audio/video HDTV (12/99) MPEG-7: standard rappr. dei contenuti ricerca, filtraggio, gestione di info multimediale rilasciato a luglio 2001 37

e MPEG1/2 Layer III (MP3) 1987 progetto Eureka (Digital Audio Broadcasting) lavoro su audio percettivo in collaborazione tra Fraunhofer IIS e l Università di Erlangen risultato: algoritmo molto potente ISO-MPEG Audio Layer-III 38

Lo schema di compressione MPEG-1 Struttura di base comune su più layer calcolo delle sottobande calcolo del modello psicoacustico 3 Layer Layer I: semplice, poco efficace Layer III: complesso, efficace Scelta del layer - rapporto qualità/compressione 39

Modalità di compressione Più frequenze di campionamento (32/44.1/48) Bitstream compresso supporta mono, dual mono, stereo, joint stereo Bit rate da 32 a 224 kbps (compressione da 2,7 a 24 volte) tassi fissi e variabili Supporta il controllo e la correzione degli errori Informazioni supplementari 40

I tre livelli di compressione Layer I il più semplice (bitrate oltre 128 kbps a canale) DCC di Philips usa la compressione di Layer I a 192 Layer II complessità media (bitrate circa 128 kbps a canale) applicazioni in DAB Layer III il più complesso, migliore qualità 64 kbps adatto per trasmissione audio su ISDN 41

MPEG 1 - Layer III audio digitale PCM Analisi tempo-frequenza Banco di filtri (32 sottobande) 31 0 Analisi psicoacustica MDCT 575 0 Allocazione dei bit, quantizzazione e codifica Loop controllo distorsione Loop controllo quant. log. Codifica di Huffman Riserva FFT 1024 punti Modello psicoacustico Codifica info agg. Codifica del bitstream bitstream audio digitale decompresso Ricostruzione dei campioni nel tempo Ricostruzione dei campioni per bande Decodifica del bitstream 42

Corrispondenza bande critiche e MPEG 43

Frame di 12 campioni consecutivi 44

Modello psico-acustico FFT a 1024 punti Separazione del segnale in tonale e non tonale perceptual noise shaping perceptual subband coding Calcolo soglie mascheramento globale Calcolo rapporto SMR (Signal to Masker Ratio) per quantificare i dati da comprimere 45

Modello psicoacustico Necessario per stabilire il livello max di quantizzazione Non si deve udire il rumore di quantizzazione Analisi psicoacustica FFT 1024 punti Modello psicoacustico 46

Compressione dei dati audio Più cicli di quantizzazione e codifica Modello psicoacustico + bitrate in uscita Allocazione dei bit, quantizzazione e codifica 575 0 Loop controllo distorsione Loop controllo quant. log. Codifica di Huffman Riserva 47

Allocazione dei bit Alloca i bit necessari per sottobanda Calcola MNR = SNR - SMR per sottobanda Prende il minimo MNR Assegna i bit necessari db SNR SMR NMR m-1 m m+1 frequenza 48

Spettro di ampiezza per 32 sottobande Soglia globale di mascheramento Allocazione di bit per banda 49

Quantizzazione e codifica I bit determinano i livelli di quantizzazione Codifica logaritmica dei campioni 50

Codifica di Huffman Meno bit ai valori più frequenti Dopo Huffman: ok per i limiti del bitrate? 51

Due cicli di lavoro Ciclo interno sui limiti del bitrate (RATE LOOP) si quantizzano e si codificano i valori compressione di Huffman se si eccede il bitrate, si allocano meno bit e go back Ciclo esterno sul controllo del rumore per banda all inizio tutte le bande sono trattate allo stesso modo se dopo il RATE LOOP il rumore in qualche banda va oltre il mascheramento, si allocano più bit solo per quelle bande 52

Terminazione: 3 casi In nessuna banda il rumore supera la soglia del mascheramento (no distorsione) Iterare ancora comporta per qualche banda il superamento dei valori permessi La prossima iterazione porterebbe ad aumentare i bit per tutte le bande Gli encoder che lavorano in real time hanno anche limiti di tempo 53

Quantizzazione/codifica Bit di allocazione fino a 4 Fattore di scala tra 0 e 6 bit 54

Frame Packer file compresso in frame di campioni ogni frame ha un header con le info di sincronizzazione 16 bit per il CRC Bit per 12 campioni per 32 sottobande Coda di bit per info supplementari 55

Tipiche riduzioni di MPEG Riferimento standard (CD): 16 bit * 2 canali * 44100 sr = 1.411 kbps 1:4 con Layer I (PASC) corrisponde a 384 kbps per un segnale stereo 1:6...1:8 con Layer II corrisponde a 256..192 kbps per un segnale stereo 1:10...1:12 con Layer III (MP3) corrisponde a 128..112 kbps per un segnale stereo sempre mantenendo la qualità audio CD 56

Decodifica Sintetizza un segnale a partire dalle componenti spettrali codificate Non si ha più lo stesso segnale!!! Tutto dipende dal bit-rate bitstream audio digitale decompresso Ricostruzione dei campioni nel tempo Ricostruzione dei campioni per bande Decodifica del bitstream 57

Esempi di bitrate bit-rate = numero medio di bit consumati da un secondo di dati audio (kbps) bit-rate per il CD = 1411.2 kbps bit-rate per MP3 per qualità CD = 128 kbps 58

Le performance di MP3 qualità telefonica: 96:1 (2.5 khz / mono / 8 kbps) meglio di AM radio: 24:1 (7.5 khz / mono / 32 kbps) simile a FM radio: 26...24:1 (11 khz / stereo / 56...64 kbps) quasi-cd: 16:1 (15 khz / stereo / 96 kbps) CD: 14..12:1 (>15 khz / stereo / 112..128kbps) prende approx. 1Mb/minute di spazio hard-disk Oltre: 8 4:1 per la musica acustica 59

MP3 Codec programma del tipo di una libreria di sistema (collezione di funzioni) vengono lanciate dai programmi di frontend codec in distribuzione con frontend MP3 60

L encoder migliore Non ha senso chiedersi quale sia l encoder migliore: la risposta dipende dalle esigenze encoder veloci/lenti (> velocità, < fedeltà audio) confrontare mp3 ottenuti da encoder diversi a parità di bit-rate Consiglio pratico (ovvio): creare MP3 con basso bitrate con encoder lenti 61

I Frontend MP3 interfaccia ai codec Alcuni frontend implementano funzioni per normalizzare il volume, o realizzano ID TAGS IDTAG è informazione (testuale, in genere) nel file di layer III (autore, titolo, etc...) 62

Player MP3 suona mentre decomprime i dati audio (campioni) vengono inviati alla scheda per la conversione 63