Codifica Musicale (Standard MPEG)

Похожие документы

Compressione del Segnale (Audio)

Lezione 8: La rappresentazione dell informazione Multimediale Suoni e Video Venerdi 6 Novembre 2009

Realizzazione siti web. I suoni

) *!' " * +! #"#, ( -. - ( #

Informatica. Rappresentazione binaria Per esempio diventa /10/2007. Introduzione ai sistemi informatici 1

Codifica delle Informazioni

Informatica per la comunicazione" - lezione 7 -

Algoritmi e strutture dati. Codici di Huffman

Elementi di teoria dei segnali /b

Strutturazione logica dei dati: i file

Informatica per la Storia dell Arte

Informatica grafica e Multimedialità. 4 Immagini grafiche

wave a 44,1 khz, 16 bit, PCM, stereo (standard cd audio) L utilizzo di una risoluzione dipende anche dal supporto che la dovrà ospitare.

Excel. A cura di Luigi Labonia. luigi.lab@libero.it

ARCHITETTURA DI RETE FOLEGNANI ANDREA

Flussi Multimediali. Introduzione

Codifica binaria dei numeri relativi

Aggiornamento Titoli

Codifiche a lunghezza variabile

DISCRETIZZAZIONE DI UN SEGNALE ANALOGICO:

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Introduzione all analisi dei segnali digitali.

Corso di Fondamenti di Telecomunicazioni

12. Evoluzione del Software

Entrare nel sistema. Clicca su Entra per entrare nel sistema. PAGINA 1

Un ripasso di aritmetica: Rappresentazione binaria - operazioni. riporti

Digital Signal Processing: Introduzione

Amplificatori Audio di Potenza

QUANTIZZAZIONE diverse fasi del processo di conversione da analogico a digitale quantizzazione

Come si misura la memoria di un calcolatore?

11. Evoluzione del Software

COMUNICAZIONI ELETTRICHE + TRASMISSIONE NUMERICA COMPITO 13/7/2005

La Videosorveglianza Criteri per il dimensionamento dello storage

Lezione 28 Maggio I Parte

Software di compressione

WoWords. Guida all uso: creare ed utilizzare le frasi. In questa guida è descritto come creare ed utilizzare le frasi nel software WoWords.

Sistema operativo. Sommario. Sistema operativo...1 Browser...1. Convenzioni adottate

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Funzioni in C. Violetta Lonati

ELETTRONICA DIGITALE

Codifica dei numeri negativi

MANUALE ESSE3 Gestione Registro delle lezioni

Rappresentazione delle informazioni

GUIDA ALLE SOLUZIONI

IL CODICE BINARIO. Il codice binario. Codifica posizionale. Aritmetica binaria

Come modificare la propria Home Page e gli elementi correlati

Esercizio data base "Biblioteca"

Informazioni demografiche e socio-economiche sugli Enti Locali

la scienza della rappresentazione e della elaborazione dell informazione

Mon Ami 3000 Multimagazzino Gestione di più magazzini fisici e/o logici

Dispensa di Informatica I.1

Come masterizzare dischi con Nero 11

File, Modifica, Visualizza, Strumenti, Messaggio

Università degli Studi di Padova Dipartimento di Matematica. - Corso di Laurea in Informatica

Consiglio regionale della Toscana. Regole per il corretto funzionamento della posta elettronica

CAP X GLI INTERVALLI. Teoria musicale - 13

Guida alla configurazione della posta elettronica dell Ateneo di Ferrara sui più comuni programmi di posta

ICARO Terminal Server per Aprile

Rappresentazione delle immagini

FIRESHOP.NET. Gestione completa delle fidelity card & raccolta punti. Rev

GESTIONE DEI BENI USATI

ARCIDIOCESI DI LANCIANO-ORTONA

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro,

CAMPIONAMENTO E RICOSTRUZIONE DI SEGNALI

Classificazione delle applicazioni multimediali su rete

Manuale Utente Albo Pretorio GA

ATTIVITÀ DI STAGE PRESSO STMICROELECTRONICS

Il Campionameto dei segnali e la loro rappresentazione. 1 e prende il nome frequenza di

CREARE UN JUKEBOX CON POWERPOINT

Quando si manifesta la necessita di operare sul nuovo anno e indispensabile lanciare questo programma.

Università di L Aquila Facoltà di Biotecnologie Agro-alimentari

manuale utente per Viabizzuno online

SISTEMI DI NUMERAZIONE E CODICI

Technical Document Release Version 1.0. Product Sheet. MediaList. Creazione e gestione palinsesto giornaliero

4 3 4 = 4 x x x 10 0 aaa

Calcolo del Valore Attuale Netto (VAN)

Il calendario di Windows Vista

Mon Ami 3000 Centri di costo Contabilità analitica per centri di costo/ricavo e sub-attività

Mon Ami 3000 Varianti articolo Gestione di varianti articoli

1) GESTIONE DELLE POSTAZIONI REMOTE

Novità di Access 2010

InfiXor. il programma facile e versatile per preventivi veloci e completi. il software di preventivazione per produttori e rivenditori di infissi

L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E

L archiviazione della posta elettronica può aiutarci a recuperare spazio senza costringerci a cestinare documenti importanti

Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini

POLIAGE GUIDA RAPIDA

Matrice Excel Calcolo rata con IMPORTO DEL FINANZIAMENTO determinato dall'utente

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

Suono: aspetti fisici. Tutorial a cura di Aldo Torrebruno

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO

Monitoraggio sulla conversione dei prezzi al consumo dalla Lira all Euro

Analisi e diagramma di Pareto

Come costruire una presentazione. PowerPoint 1. ! PowerPoint permette la realizzazione di presentazioni video ipertestuali, animate e multimediali

FIRESHOP.NET. Gestione Lotti & Matricole.

Soluzione dell esercizio del 2 Febbraio 2004

Транскрипт:

Codifica Musicale (Standard MPEG) Ing. Francesco Benedetto - Prof. Gaetano Giunta Corso di Elaborazione Numerica dei Segnali Dipartimento di Elettronica Applicata Università degli Studi Roma Tre 1

Il segnale audio Il segnale audio è per sua natura un segnale analogico, ovvero un segnale che varia in modo continuo nel tempo. Riuscire a rappresentare un segnale audio con un segnale digitale preservando l'informazione è un argomento che è alla base della teoria dell'informazione. 2

Campionamento La risposta sta nel campionare il segnale, ossia prelevare, ad intervalli regolari, il valore del segnale audio. All aumentare della risoluzione, ovvero del numero di rettangoli (passo di campionamento), l'errore di conversione diminuisce. 3

Esempio qualità CD Le tracce audio digitali di un CD sono immagazzinate in file binari ed in ogni secondo vengono prelevati ben 44100 campioni e ogni campione è quantizzato con 16 bit. Considerando due canali, sinistro e destro, si avrà un bit-rate complessivo pari a: 44100 * 16 *2= 176400 bytes/secondo valore che corrisponde alla velocità di lettura "1x" dei normali lettori CD audio. Tale bit-rate, a partire dalla codifica finora discussa, porta alla qualità sonora nota come "qualità CD", che è lo standard di riferimento quando si valutano i risultati prodotti dagli algoritmi di compressione. 4

Le tecniche Tecniche di compressione senza perdita di informazione: particolari codifiche riescono a comprimere i dati relativi al filmato senza decurtarne il contenuto informativo Tecniche di compressione con perdita: codifiche che producono una riduzione irreversibile del contenuto informativo del filmato Tipicamente i due tipi di codifica vengono usate contemporaneamente in modo da ottenere significativi rapporti di compressione con una perdita di qualità relativamente bassa 5

I modelli Nel caso dell' audio, delle immagini e dei filmati, un certo livello di degradazione è un compromesso accettabile per ridurre (e di molto) l'occupazione o la banda richiesta dal file. Le codifiche di compressione dell'audio sono numerose ed utilizzano tecniche anche molto differenti l'una dall'altra: - le codifiche nel dominio del tempo (lossless), - le codifiche per modelli (lossy), - le codifiche nel dominio della frequenza (lossy). Generalmente le prime due categorie di algoritmi vengono usate per comprimere il segnale vocale mentre alla terza appartengono algoritmi come MP3, WMA, ATRAC-3 e AAC ottimi per la compressione della musica. 6

Codifiche in Frequenza Questi algoritmi sono accomunati dal fatto di esaminare e processare il segnale non nel dominio del tempo, ma nel dominio della frequenza. Ogni strumento musicale, ogni suono e anche la voce ha una propria impronta spettrale caratteristica costituita da una combinazione di frequenze contenute in uno spettro più o meno ampio. Lavorando su tale spettro è possibile comprimere il segnale in misura molto maggiore di quanto non si riesca a fare nel dominio del tempo. 7

Voce e Musica La voce umana occupa solo certe frequenze mentre gli strumenti musicali spaziano su range diversi a seconda del tipo di strumento impiegato. Comprimere una musica generica utilizzando un approccio basato su modelli (CELP) risulterebbe estremamente complesso. La musica dovrà essere "ascoltata da un orecchio" quindi conoscere fino in fondo quello che un uomo medio riesce a sentire o non riesce a sentire può rivelarsi sorprendentemente utile. 8

Modello Percettivo Il nostro orecchio non è uno strumento lineare, non percepisce tutti i suoni e soprattutto non li percepisce nello stesso modo. Da qui l idea di eliminare tutte quelle componenti frequenziali che non possiamo udire. Dal grafico emerge che l'orecchio umano è maggiormente sensibile alle frequenze comprese fra 2 e 4 KHz. In sostanza si tagliano le alte frequenze e le bassissime frequenze. 9

Mascheramento Audio La percettività del suono non è costante nel tempo, varia in funzione di ciò che ascoltiamo. Nella figura è riportata la variazione della caratteristica in presenza di un suono. In pratica un tono forte copre i suoni d intensità minore non solo ad una determinata frequenza ma anche in quelle vicine. 10

Mascheramento Temporale Supponiamo di avere al solito due toni, uno forte e l'altro, che gli è vicino in frequenza, piuttosto debole. Dall'analisi vista prima percepiremo solo il tono più forte (tono maschera). Se improvvisamente questo tono maschera cessa di esistere, la membrana del nostro timpano deve assestarsi. Impiegheremo quindi un pò prima di riuscire a sentire il tono più debole anche dopo che il tono forte è morto. 11

Pre e Post Mascheramento Pre-Mascheramento Post-Mascheramento La maschera complessiva (global Masking Threshold) rappresenta la parte dell informazione ininfluente che può esser eliminata. 12

MPEG-1 La tecnica di codifica permette di selezionare diverse opzioni, primo fra tutti il numero di canali e la loro funzionalità: - a canale singolo; - a due canali; - stereo semplice; - stereo congiunta. Le frequenze di campionamento possono essere di 32 khz, 44.1 khz o 48 khz, il bitrate varia da 16 a 320 kbit/sec. 13

MPEG-1 Layer I: è il più semplice dei tre ed è studiato per avere le migliori prestazioni con bitrate sopra 128 kbit/s per canale. Fornisce fattori di compressione di circa 1 a 4. Layer II: superiore per complessità al primo è adatto per bitrate intorno a 128 kbit/s per canale. I fattori di compressione vanno da 1 a 6 fino a 1 a 8. Layer III: è il più complesso dei tre ed offre ottime prestazioni con bitrate di circa 64 kbit/s per canale. Riesce a ridurre la dimensione fino a 12 volte. 14

Schema di co/decodifica Si riporta il segnale audio nel dominio temporale. 15

Codificatore - Analisi: si trasforma il segnale rappresentandolo nel dominio delle frequenze. - Modello percettivo: indica quali componenti spettrali possono essere scartate. - Quantizzazione e codifica: incrementa o decrementa il valore d ogni campione fino a portarlo a livelli standard e poi lo codifica con un certo numero di bit. - Creazione dello stream: ai dati relativi alla finestra si aggiunge un intestazione con le informazioni necessarie alla decodifica. 16

Layers I e II Molto simili tra loro, vengono analizzati insieme: 17

Analisi Il segnale viene scomposto in 32 sottobande tramite il banco di filtri. Il layer I esegue un finestramento ogni 12 passi mentre il layer II ogni 36. Si hanno quindi 384 (32*12) campioni per finestra nel primo e 1152 (32*36) nel secondo. Si noti che questi sono campioni spettrali, nel dominio delle frequenze e non più in quello del tempo. 18

FFT e Quantizzazione Modello percettivo: genera per ogni pacchetto la Threshold Mask, che sarà utilizzata in fase di campionamento per eliminare le componenti frequenziali non necessarie. Quantizzazione: operazione che inevitabilmente introduce rumore. Il numero di livelli di quantizzazione è ottenuto, per ogni componente spettrale, da un algoritmo d allocazione dinamica dei bit. Questo sceglie il quantizzatore all interno di quelli disponibili, lavorando in modo da ottenere il bitrate richiesto e da rispettare le imposizioni della Threshold Mask. 19

Layer III Il Layer III, più comunemente noto come MP3, introduce nuove tecniche al fine di migliorare la qualità dell audio e mantenere accettabile il bitrate. 20

MP3 - Funzionamento Per ognuna delle sottobande, viene calcolata l'entità del mascheramento causata dalle bande adiacenti. Se la potenza in una sottobanda è sotto la soglia di mascheramento, allora non viene codificata in uscita l'informazione poiché sarebbe inudibile. Altrimenti, occorre calcolare il numero di bit necessari per rappresentare l'informazione della sottobanda facendo attenzione che il rumore introdotto stia sotto la soglia. 21

MP3-Esempio Consideriamo per semplicità solo 16 delle 32 sottobande: Dai dati del nostro modello psicoacustico, sappiamo che l'ottava banda, se presenta una intensità di 60dB, genera una maschera di 12dB nella settima e di 15dB nella nona. La settima ha un livello pari a 10 (<12dB), ed è perciò mascherata e tagliata via dall'uscita. La nona è a 35dB (>15) così passa in uscita. 22

MP3 Formato dei Dati bit reservoir: se la dimensione dei dati in una finestra è inferiore al numero di bit a lei assegnata, il codificatore usa questo spazio vuoto per inserire dati relativi alle finestre successive. 23

MP3 - Prestazioni I dati non sono assoluti, la riduzione varia in funzione del suono da comprimere e del codificatore utilizzato. I dati riportati sono stati recuperati dal Fraunhofer Institut e si riferiscono al loro codificatore. 24

Prestazioni Audio Sono evidenti le migliori performance raggiunte dai codificatori MPEG. * Il sistema European DAB usa MPEG-1 Layer II 25

MPEG-2 Con il passare del tempo è divenuto chiaro che due canali non sono sufficienti a coprire tutte le applicazioni, per permettere la codifica multicanale è stato sviluppato il secondo standard. L impulso principale è stato dato dalla necessità di codificare l audio che rispondesse alle richieste del settore cinematografico-televisivo, con almeno 5 canali: destro, sinistro, centrale, destro e sinistro surround. Il progetto MPEG-2 si articola in due fasi successive, nella prima si è privilegiata la compatibilità con gli standard precedenti. Nella seconda questa è stata sacrificata, si era compreso che abbandonare la compatibilità era l unica via per ottenere un notevole incremento nelle prestazioni. 26

MPEG-2 Schema a Blocchi I codificatori non presentano novità concettuali rispetto ai precedenti. I codificatori di seconda generazione aggiungono altre frequenze di campionamento: a 16 khz, a 22.05 e a 24 khz. Per quanto riguarda il bitrate, questo può variare da un minimo di 8 kbit/s fino a 160 kbit/s per canale. 27

MPEG-2 AAC La seconda fase di MPEG-2, denominata AAC (Advanced Audio Coding), parte con l obiettivo di sviluppare un tool per migliorare le prestazioni nella codifica multicanale. Il risultato ottenuto è notevole, si possono codificare fino a 48 canali con una frequenza di campionamento che va da 8 a 96 khz per canale. Per comprendere il livello raggiunto si tenga presente che alcuni test dimostrano come, a parità di qualità e nel caso di codifica a 5 canali, l AAC in pratica dimezza la bitrate rispetto a MPEG-2 Layer II. 28

MPEG-2 AAC Com è possibile notare, l AAC segue gli stessi principi del layer III, oltre a migliorare il funzionamento d alcuni punti, introduce una serie di blocchi che migliorano la compressione e riducono il bitrate. 29

MPEG-2 AAC Fra le parti migliorate ci sono: Risoluzione di frequenza: il numero di linee di frequenza in uscita dal Filter Bank passa da 576 a 1024 (potenza di 2 e più facile da gestire), la dimensione delle finestre quindi diventa di 2048 campioni; Codifica stereo congiunta, M/S: anziché codificare i due canali separatamente si codifica la loro media e la loro differenza (left-right), si ricordi che codificare piccoli valori richiede pochi bit; Codifica di Huffman: si utilizzano un maggior numero di tabelle, che oltre a migliorare la codifica facilitano il lavoro del quantizzatore. 30

MPEG-4 Seguendo l evoluzione informatica, MPEG-4 introduce il concetto di oggetto nel settore audiovisivo. Ogni file multimediale è una combinazione di diversi oggetti che, pur potendo esistere separatamente sono armonizzati per ottenere l effetto complessivo. 31

MPEG-4 - Il parlato può essere realizzato in lingue diverse e codificato tramite un tool dedicato che offre buona qualità ad un bitrate modesto. - Per l annuncio non è indispensabile una qualità eccelsa, è codificato come parlato sintetico ottenendo l effetto desiderato ad un bitrate molto basso (fino a 200 bit/s). - Il rumore del treno è codificato con 8 canali, in modo da ottenere un perfetto effetto stereo. - La musica di sottofondo è codificata con l AAC. 32

Architettura MPEG-4 Synthetic-Natural Hybrid Coding (SNHC): questa tecnica permette la composizione d audio naturale (compresso) e suono sintetico creato in real-time sul terminale ricevente. 33

Prestazioni MPEG-4 Le valutazioni devono tener conto di due parametri, bitrate e qualità del suono. La qualità del suono, purtroppo non può essere misurata scientificamente ma resta una valutazione soggettiva, la scala di riferimento riportata è puramente indicativa. Tabella di valutazione della configurazione mono 34

Prestazioni MPEG-4 Superiore capacità dell AAC di comprimere i dati, ad un costo più basso, mentre ovviamente cede ai bassi bit-rate a TwinVQ e CELP, ottimizzati per dare il massimo in condizioni critiche. 35

Principali Riferimenti P. Noll: Wideband Speech Audio Coding, IEEE audio coding comunication magazine, Vol. 31. No 11, Nov 1993. D. Pan: A tutorial on MPEG/Audio compression, IEEE Trans. on Multimedia, vol. 2, no. 2, 1995, pp. 60-74. G. Giunta: Codifica Audio, Università degli Studi ROMA TRE, Facoltà di Ingegneria (scaricabile gratuitamente dal sito www.comlab.uniroma3.it/ens.html). G. Vercellesi: MPEG audio tutorial, Università degli Studi di Milano, Dipartimento di Informatica e Comunicazione. F. Visciotti: Tecniche di Compressione Audio: Evoluzione dello Standard MPEG, Università degli Studi di Bologna, Facoltà di Ingegneria. 36