Codifica e pacchettizzazione della voce

Похожие документы
Codifica e pacchettizzazione della voce

Conversione Analogico/Digitale

Campionamento e quantizzazione

QUANTIZZAZIONE Conversione analogico/digitale

Codifica dei segnali audio

Il tema proposto può essere risolto seguendo due ipotesi:

Comunicazioni Elettriche Esercizi

Compressione del Segnale (Audio)

Campionamento e quantizzazione, errori, SNR. errori, tipi base, esempi di circuiti. errori, classificazione, esempi di circuiti

La codifica dei suoni

QUANTIZZAZIONE E CONVERSIONE IN FORMA NUMERICA

QUANTIZZAZIONE E CONVERSIONE IN FORMA NUMERICA. 1 Fondamenti Segnali e Trasmissione

Reti di Calcolatori a.a

CAMPIONAMENTO CATENA ELETTROACUSTICA DIGITALE, CAMPIONAMENTO, QUANTIZZAZIONE

Dipartimento di Ingegneria dell Informazione, Elettronica e Telecomunicazioni. Esercitazioni del corso di. Telecomunicazioni

di Napoli Prof. Antonio Fratini

Rappresentazione digitale del suono

La codifica dei suoni

Teoria e pratica I formati sonori

MULTIPLAZIONE PCM MULTIPLAZIONE PCM 2

Schema ADC. FILTRO Campionatore Quantizzatore Codificatore. Analogico Tempo discreto Ampiezza continua

Sistemi di Elaborazione delle Informazioni 6 CFU

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche. Modulazione A.A Alberto Perotti

Corso di Fondamenti di Telecomunicazioni

Teoria dell informazione

Modulazione PAM Multilivello, BPSK e QPSK

M149 - Esame di stato di istituto tecnico industriale Sessione ordinaria Seconda prova scritta

Rappresentazione digitale del suono

Segnale Analogico. Forma d onda continua

TRASMISSIONE NUMERICA IN BANDA BASE

10.. Codici correttori d errore. Modulo TLC:TRASMISSIONI Codici correttori d errore

Elementi di informatica musicale Conservatorio G. Tartini a.a Sintesi del suono. Sintesi del suono

Corso di Fondamenti di Telecomunicazioni 1 - INTRODUZIONE

TECNICHE DI CODIFICA DEL SEGNALE VOCALE

convertitore D/A convertitore A/D

La codifica di sorgente

Introduzione alle reti di telecomunicazioni

Corso di Fondamenti di Telecomunicazioni

Cos è una wavelet? Applicazioni della trasformata wavelet. Analisi multirisoluzione

CARATTERISTICHE GENERALI DEI SISTEMI DI TLC DIGITALI CONTENUTI

La codifica dei suoni

Informatica. Caratterizzazione del canale I simboli emessi dalla sorgente passano attraverso un canale di trasmissione.

Le reti telefoniche. Evoluzione delle reti telefoniche. Evoluzione delle reti telefoniche. Fine 800 primi 900: Anni 20 e 30. Anni 40 e 50: Anni 60:

Le reti telefoniche. Richiami alla telefonia fissa tradizionale POTS (Plain Old Telephony Service) ed alle tecniche di codifica vocale

Delle C0NOSCENZE: Test con domande a risposta aperta e/o a scelta multipla Interrogazioni orali

E03 ESERCIZI SU LIVELLO FISICO

ISTITUTO TECNICO INDUSTRIALE " VILLAGGIO DEI RAGAZZI " (MADDALONI) PIANO DI LAVORO. Anno scolastico 2005/2006

Teoria dei Segnali Quantizzazione dei segnali; trasformata zeta

Gianfranco Cariolaro, Gianfranco Pierobon, Giancarlo Calvagno Segnali e sistemi Indice analitico

Conversione Analogico/Digitale

Analogico vs digitale

Tecniche di commutazione

4.3: La Codifica dei Suoni e dei Video

Le modulazioni impulsive

Multiplazione dei segnali

1.3d: La Codifica Digitale dei Suoni

Sistemi di Telecomunicazione

Segnale analogico. Analogico vs digitale. Segnale digitale. Trasformazione da analogico a digitale

1.3c: La Codifica Digitale dei Suoni

DAE Digital Audio Experience

Rappresentazione digitale del suono

Fasi di analisi dei segnali biomedici

Compressione dei dati multimediali

Strumentazione per la misura a banda stretta del campo elettromagnetico. Laura Vallone

CONVERSIONE ANALOGICO-DIGITALE E DIGITALE-ANALOGICA

L informazione e la sua codifica. Prof. Maurizio Naldi A.A. 2015/16

SECONDA LEZIONE: CAMPIONAMENTO E QUANTIZZAZIONE I CONVERTITORI A/D

L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E

TRASMISSIONE NUMERICA IN BANDA BASE. 1 Fondamenti Segnali e Trasmissione

RETI INTERNET MULTIMEDIALI. Esercitazione 2

Esercizio C2.1 - Acquisizione dati: specifiche dei blocchi

Teoria dei Segnali Densità spettrale di energia e di potenza; campionamento e teorema di Shannon

In realtà i segnali con i quali dobbiamo confrontarci più frequentemente sono limitati nel tempo

La codifica del testo

Транскрипт:

Codifica e pacchettizzazione della voce Segnale vocale Il segnale vocale è un onda di pressione in aria Un microfono lo trasforma in un segnale elettrico analogico (pressione volt) 1

Il trasmettitore a grani di carbone 1878: microfono a granuli di carbone...con qualche miglioria ancora in uso I granuli di carbone, in una cavità metallica chiusa da un diaframma, forniscono molti percorsi elettrici possibili Diaframma vibrando fa variare il no. di possibili percorsi e quindi la corrente Il trasmettitore a grani di carbone accoppiamenti flessibili granuli di carbone Segnale elettrico in uscita Cavità metallica diaframma 2

Segnale vocale Processo continuo nel tempo ed in ampiezza Tramite la codifica si passa da un segnale analogico ad uno numerico Valutazione della qualità dei codificatori Per valutare la qualità di un sistema di codifica della voce si usano tecniche: oggettive (es. SNR, dove N è dato dalla differenza tra i campioni del segnale originale e il segnale codificato) soggettive 3

Valutazione della qualità dei codificatori Esempio di tecnica soggettiva: MOS (Mean Opinion Score) Valutazione della qualità dei codificatori Valutazione ottenuta in modo statistico da un campione di persone (maschi e femmine) che ascoltano brevi pezzi di parlato 4

Scala MOS MOS Qualità 5 Eccellente 4 Buona Definizione Nessuno sforzo richiesto per la comprensione Richiede attenzione, ma non uno sforzo apprezzabile Esempio Dal vivo CD-audio Telefonia fissa Scala MOS MOS Qualità 3 Discreta 2 Scarsa Definizione È richiesto un moderato sforzo per la comprensione Il significato delle frasi è incomprensibile senza un notevole sforzo Esempio GSM 5

Scala MOS MOS Qualità Definizione Esempio 1 Insufficiente La comunicazione è sostanzialmente impossibile Codificatori vocali Le tecniche di codifica si dividono in: Codificatori della forma d onda: usano la sola conoscenza del segnale elettrico istantaneo (es. PCM, DPCM, ADPCM, Mod. Delta) Codificatori di sorgente (vocoder): sfruttano soprattutto le caratteristiche dell apparato di fonazione e uditivo (es. LPC) 6

Codificatori vocali In entrambi i casi, il primo stadio del codificatore comprende: Un filtro anti-aliasing Un campionatore Un quantizzatore Campionamento e quantizzazione I primi passi per qualsiasi codifica del segnale sono: Campionamento: Si rappresenta il segnale continuo tramite un insieme discreto di valori, senza alcun degrado se viene rispettato il teorema di Nyquist 7

Campionamento e quantizzazione I primi passi per qualsiasi codifica del segnale sono: Quantizzazione: Assegnazione a un insieme discreto di valori dei punti campionati, si ha degrado irreversibile del segnale Campionamento segnale analogico campioni del segnale ampiezza tempo intervallo di campionamento Tc 8

Campionamento Il teorema di Nyquist definisce il passo di campionamento affinché non si abbia alcun degrado nella ricostruzione del segnale 1/Tc > 2B B è il massimo contenuto in frequenza (banda) del segnale da campionare Quantizzazione ampiezza 5 4 3 2 1 tempo 9

Quantizzazione Introduce sempre un degrado noto come rumore di quantizzazione Il degrado è noto e controllabile e diminuisce con intervalli di quantizzazione più piccoli Il degrado può essere ridotto a piacere diminuendo la dimensione dell intervallo di quantizzazione (ma servono più bit per campione) PCM uniforme e non Il PCM (Pulse Code Modulation) è un processo di campionamento e quantizzazione La quantizzazione può essere: Uniforme (tutti gli intervalli uguali) Non uniforme (intervalli diversi a seconda dell ampiezza): compressione prima del quantizzatore uniforme, compensata in ricezione da una espansione (compander) 10

PCM uniforme e non PCM uniforme: CD (~44 khz, 16 bit) qualità eccellente (MOS 5) PCM non uniforme: Telefonia (8kHz, 8 bit, 64 kbit/s) qualità buona (MOS 4+), standard ITU-T G.711 PCM non uniforme Oggi si preferisce un campionamento uniforme a 12 bit, seguito da una compressione a 8 bit Il campionamento risultante è non uniforme a 8 bit 11

PCM differenziale (DPCM) Questa tecnica sfrutta la correlazione temporale del segnale vocale Codificare la differenza tra un campione e la stima del successivo (predizione) Se c è correlazione tra i campioni la dinamica della differenza è minore di quella dei campioni PCM differenziale (DPCM) S(n) S (n) Quantizzatore Predittore e q (n) + S (n) s(n) campione originale s (n) campione predetto s (n) corrisponde al campione ricostruito dal ricevitore 12

Modulazione Delta È un esempio particolare Il segnale è campionato a frequenza elevata per ottenere alta correlazione tra i campioni La differenza è campionata su un solo bit, che indica se il segnale cresce o decresce PCM adattativo Anche questa tecnica sfrutta la correlazione temporale presente nel segnale vocale Modifica nel tempo l ampiezza degli intervalli di quantizzazione in funzione della dinamica del segnale (adattamento) 13

PCM adattativo Se la variazione nel tempo del segnale è lenta (correlazione) si ottimizza l ampiezza dell intervallo in funzione del segnale PCM adattativo e differenziale (ADPCM) Lo standard ITU G.721 usato nei telefoni cordless moderni di tipo DECT è un PCM adattativo e differenziale Qualità buona (MOS 4) Velocità di trasmissione: 32kbit/s 14

Codificatori di sorgente Il PCM e i suoi derivati codificano il segnale campione per campione Le reti di telefonia tradizionale trasmettono campione per campione Codificatori di sorgente Le tecniche di correzione degli errori lavorano bene su blocchi di bit inoltre In reti a commutazione di pacchetto bisogna accumulare campioni fino a riempire un pacchetto (es. payload 80 byte 80 campioni PCM 10ms di voce) prima di iniziare la trasmissione 15

Codificatori di sorgente Considerando un segmento vocale (es. un fonema di durata 10-40 ms) è possibile usare algoritmi di codifica e compressione molto efficienti Si parte da una codifica PCM uniforme eccellente, si raggruppano da 80 a 320 campioni (10-40 ms) e si lavora sull insieme (blocco) Codificatori di sorgente I codificatori di sorgente si dividono in molte categorie a seconda degli algoritmi usati Tutti i codificatori a blocco sono basati su filtri numerici a risposta finita (FIR) di cui il codificatore calcola i parametri I parametri vengono trasmessi per la ricostruzione del segnale al ricevitore 16

Modellizzazione fisica Il filtro usato rappresenta i modi vibrazionali delle corde vocali e le cavità risonanti dell apparato di fonazione umano Codificatori di sorgente: codificatore segnale in ingresso (analogico) CONV. A/D CALCOLO PARAMETRI flusso numerico (PCM lineare) struttura del filtro coefficienti segnale di eccitazione......... 17

Codificatori di sorgente: schema al codificatore segnale vocale Filtro di sintesi Sequenza di eccitazione Pesatura e min dell errore errore Codificatori di sorgente: schema generale segnale in ingresso (analogico) CODIFICATORE trasmissione dei parametri (numerici) segnale di eccitazione (numerico) α β χ DECODIFICATORE segnale ricostruito (analogico) 18

Codificatori di sorgente: decodificatore segnale di eccitazione (numerico) T T T T C0 X C1 X C2 X C3 X C4 X flusso numerico (PCM lineare) SOMMATORE CONV. D/A segnale ricostruito (analogico) Soppressione dei silenzi Con i codificatori a blocco è possibile effettuare la soppressione dei silenzi (VAD Voice Activity Detection) Se non vi è attività vocale non vengono generati pacchetti di descrizione vocale 19

Soppressione dei silenzi Sul canale vengono trasmessi pacchetti di descrizione del silenzio Risparmio di banda e riduzione dell interferenza VAD - criticità I silenzi vanno soppressi senza dare la sensazione di linea caduta Il soppressore deve essere efficiente nell intervenire, ma soprattutto nel riprendere la codifica, per evitare di tagliare l inizio di nuove lettere/parole 20

VAD - criticità I soppressori possono essere: Lenti: intervengono solo durante lunghe pause di parlato Veloci: cercano di intervenire anche nei brevissimi silenzi tra parole della stessa frase Codifica LPC-LTP La codifica Linear Prediction Coding - Long Term Prediction si basa sulla modellizzazione fisica del tratto vocale mediante due filtri, uno a memoria breve (filtro LPC) e uno a memoria lunga (LTP) 21

Codifica LPC-LTP con RPE Il segnale viene rigenerato eccitando il filtro a memoria breve con rumore gaussiano bianco e il filtro a memoria lunga con un treno di impulsi regolari (RPE - Regular Pulse Excitation) Codifica LPC-LTP con RPE La codifica è divisa in: Predizione di breve periodo (LPC) Serve a codificare bene i fonemi con consonanti 22

Codifica LPC-LTP con RPE La codifica è divisa in: Predizione di lungo periodo (LTP) Serve a codificare bene i suoni vocalizzati Codifica LPC-LTP con RPE La codifica è divisa in: Calcolo del miglior segnale di eccitazione (RPE) 23

Codifica CELP Code Excited Linear Prediction È un codificatore LPC in cui l eccitazione per ricostruire il segnale non è rumore bianco ma una sequenza di un codebook (catalogo) che minimizza l errore rispetto al segnale originale Codifica CELP Il codificatore è molto complesso perché deve scegliere tra i possibili codici in modo esaustivo 24

Codificatori GSM GSM tradizionale: Codificatore LPC-LTP con RPE 13 kbit/s GSM Enhanced Full Rate (EFR): Telefonini dual-band e/o posteriori al 1997 CELP a 12.2 kbit/s Codificatori GSM e UMTS UMTS: Codec adattativo a rate variabile (AMR Adaptive Multi Rate) Può essere usato anche con GSM 25

Codificatore GSM base Codificatore LPC-LTP con RPE (standard ETSI) Blocchi da 20 ms che producono 260 bit raggruppati in 3 livelli di importanza 50 ricevono massima protezione 132 ricevono una protezione media 78 non sono protetti per nulla Totale 13 kbit/s Codificatore GSM base segnale vocale campionatore quantizzatore codificatore segmentazione analisi di breve periodo analisi di lungo periodo codifica RPE multiplazione al trasmettitore 26

Codifica e pacchettizzazione della voce 27