tesi 2013/1/26 18:23 page i #1

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "tesi 2013/1/26 18:23 page i #1"

Transcript

1 tesi 2013/1/26 18:23 page i #1

2 tesi 2013/1/26 18:23 page ii #2

3 tesi 2013/1/26 18:23 page iii #3 Università Politecnica delle Marche Scuola di Dottorato di Ricerca in Scienze dell Ingegneria Curriculum in Ingegneria Elettronica, Elettrotecnica e delle Telecomunicazioni Sviluppo di un sistema di riconoscimento vocale distribuito Tesi di Dottorato di: Massimo Mercuri Tutor: Prof. Claudio Turchetti Coordinatore del Curriculum: Prof. Franco Chiaraluce XI ciclo - nuova serie

4 tesi 2013/1/26 18:23 page iv #4

5 tesi 2013/1/26 18:23 page v #5 Università Politecnica delle Marche Scuola di Dottorato di Ricerca in Scienze dell Ingegneria Curriculum in Ingegneria Elettronica, Elettrotecnica e delle Telecomunicazioni Sviluppo di un sistema di riconoscimento vocale distribuito Tesi di Dottorato di: Massimo Mercuri Tutor: Prof. Claudio Turchetti Coordinatore del Curriculum: Prof. Franco Chiaraluce XI ciclo - nuova serie

6 tesi 2013/1/26 18:23 page vi #6 Università Politecnica delle Marche Scuola di Dottorato di Ricerca in Scienze dell Ingegneria Facoltà di Ingegneria Via Brecce Bianche Ancona (AN), Italy

7 tesi 2013/1/26 18:23 page vii #7 a chi mi vuol bene!

8 tesi 2013/1/26 18:23 page viii #8

9 tesi 2013/1/26 18:23 page ix #9 Ringraziamenti Desidero ringraziare alcune persone per il loro fondamentale contributo che ha reso possibile la definizione e la stesura di questo lavoro di tesi. Primo fra tutti il Prof. Claudio Turchetti, mio Tutore del Dottorato di Ricerca, che ha investito la sua conoscenza ed il suo tempo in interessanti confronti e determinanti contributi sull intero lavoro svolto consigliandomi e guidandomi costantemente. Ringrazio tutti i componenti del gruppo di ricerca per avermi trasmesso la metodologia di lavoro e la capacità di affrontare problematiche diverse. Con piacere e simpatia ringrazio tutte le persone con cui ho condiviso la sala dottorandi in questi tre anni contribuendo a renderla un luogo piacevole dove recarsi quotidianamente. Ancona, Gennaio 2013 Massimo Mercuri ix

10 tesi 2013/1/26 18:23 page x #10

11 tesi 2013/1/26 18:23 page xi #11 Sommario Nel corso degli anni sono stati utilizzati diversi dispositivi per l interazione uomo-macchina: dal mouse alla tastiera, dal joystick alla tavoletta grafica. La voce, in particolare, rappresenta una modalità di interazione estremamente naturale per l uomo, visto che rappresenta il metodo di comunicazione preferenziale utilizzato ogni giorno. Per questo, le tecnologie vocali hanno rivestito e rivestono un particolare interesse all interno della comunità scientifica. I sistemi di riconoscimento vocale rappresentano il componente tramite il quale l interazione vocale con un sistema può avere luogo. In particolare, in questa tesi, è stata posta l attenzione sullo sviluppo di un sistema di riconoscimento vocale distributo. In tale tipologia di sistemi l architettura del processo di riconoscimento vocale è riconducibile ad uno schema del tipo client-server. Nel client è ospitato il front-end che calcola ed estrae dei parametri rappresentativi del parlato (features). Il riconoscimento del messaggio trasmesso è effettuato dal back-end residente nel server ed è basato sull elaborazione dello stream di features. Inizialmente è stato messo a punto un front-end conforme allo standard ETSI ES , capace di lavorare in tempo reale. Tale front-end è stato dapprima implementato su piattaforma Java, e successivamente portato su un dispositivo mobile smartphone, basato su piattaforma Android. Il back-end remoto è stato messo a punto avvalendosi di un toolkit open source (Sphinx-4) sviluppato dalla Carneige Mellon University. Sulla base dei problemi emersi in questa prima fase e soprattutto dei margini di miglioramento intravisti, la ricerca si è successivamente focalizzata sulle tecniche di adattamento al parlatore. Dopo un attenta analisi della letteratura, in particolare per quanto concerne gli approcci di speaker adaptation, è stato proposto e sviluppato un algoritmo originale per l adattamento al parlatore, da applicare lato client. Questo algoritmo è caratterizzato da ridotta complessità, pur garantendo prestazioni elevate. I risultati ottenuti constatano l efficacia del metodo proposto e la funzionalità del sistema di riconoscimento vocale distribuito nel suo complesso. xi

12 tesi 2013/1/26 18:23 page xii #12

13 tesi 2013/1/26 18:23 page xiii #13 Indice 1 Introduzione 1 2 I sistemi DSR e lo standard ETSI ES Riconoscimento Automatico (ASR) Antecedenti Processo di riconoscimento Caratteristiche Riconoscimento Vocale Distribuito (DSR) STANDARD ETSI ES Noise Reduction Waveform Processing Cepstrum Calculation Blind Equalization Feature Compression Processamento del Server Implementazione del DSR Implementazione in Java del front-end ETSI ES Porting del front-end ETSI ES su piattaforma Android Struttura del sistema Activity Sviluppare per Android Due implementazioni del front-end ETSI per Android Il back-end remoto Architettura dello Sphinx Speaker Adaptation Adattamento dei parametri del modello Notazione HMM Adattamento delle medie Derivazione della matrice di regressione Definizione della funzione ausiliaria Massimizzazione della funzione ausiliaria Matrice di regressione tied xiii

14 tesi 2013/1/26 18:23 page xiv #14 Indice Trasformazione per il caso tied Estensione alle distribuzioni composte da misture Sequenze multiple di osservazione Approccio iterativo per l implementazione del metodo CMLLR MLLR e CMLLR background Trasformazione non vincolata Trasformazione vincolata CMLLR iterativo Costo computazionale Risultati sperimentali Adattamento nel dominio delle features Funzione ausiliaria con componenti misture multiple Adattamento nel dominio del modello Adattamento nel dominio delle features Algoritmo di trasformazione lineare nel dominio delle features Conclusioni e sviluppi futuri 81 xiv

15 tesi 2013/1/26 18:23 page xv #15 Elenco delle figure 2.1 Schema a blocchi di un sistema DSR. (a) raffigura il lato client. (b) raffigura il lato server Blocco di riduzione del rumore Calcolo della media sull ultimo T P SD frame Componenti principali del Waveform Processing Componenti principali del blocco per il calcolo del Cepstrum Mapping tra frequenza lineare e di Mel Suddivisione per coppie dei coefficienti per la quantizzazione a coppie Formato del multi-frame Allineamento dell m-esimo e dell (m + 1)-esimo frame Schematizzazione ad alto livello di un sistema DSR Formattazione del frame ETSI Formattazione del frame Sphinx Android Framework Android restore instance Android activity lifecycle Esempio di un semplice grafo che decodifica le parole one e two Architettura dello Sphinx Diagramma di flusso dell algoritmo ICMLLR Valutazione dell accuratezza in funzione del numero di iterazioni. L adattamento è stato ottenuto con la prima utterance del test corpus, mentre il materiale rimanente è stato usato per condurre test di riconoscimento Errore relativo e valutazione dell accuratezza del riconoscimento del metodo ICMLLR in funzione del numero di iterazioni. Il setup è lo stesso della Fig Confronto dell accuratezza tra i metodi ICMLLR e CMLLR. Il numero delle iterazioni è fissato a 15 per entrambi gli algoritmi. I dati di adattamento aumentano di una utterance alla volta.. 64 xv

16 tesi 2013/1/26 18:23 page xvi #16 Elenco delle figure 5.5 Accuratezza del metodo ICMLLR in uno scenario di adattamento incrementale. Il modello è aggiornato ogni volta che una nuova utterance è disponibile. I grandi punti quadrati mostrano il WER quando viene eseguita un operazione di ripristino Confronto tra le features MFCC originali e le stesse features dopo l adattamento con il metodo CMLLR convenzionale. Sopra i grafici è indicata la trascrizione fonetica allineata dell utterance in esame Confronto tra le features MFCC originali e le stesse features dopo l adattamento con il metodo ICMLLR proposto. Sopra i grafici è indicata la trascrizione fonetica allineata dell utterance in esame Schema di trasformazione dell adattamento lato client - lato server Matrice generata da γ m (τ)ζ(τ)ζ T (τ) τ=1 6.3 Diagramma a blocchi dell algoritmo per la stima della trasformazione lineare delle features xvi

17 tesi 2013/1/26 18:23 page xvii #17 Elenco delle tabelle 2.1 Quantizzazione delle classi Sequenza di sincronizzazione del multiframe Parametri usati nelle sperimentazioni xvii

18 tesi 2013/1/26 18:23 page xviii #18

19 tesi 2013/1/26 18:23 page 1 #19 Capitolo 1 Introduzione Molte volte in ambito ingegneristico ci si trova a dover far fronte ad un problema come il seguente. Un processo del mondo reale produce una sequenza di simboli osservabili, che possono essere a valori discreti (uscite di esperimenti di lancio di una moneta, lettere da un alfabeto finito,... ) o continui (campioni del parlato, vettori di autocorrelazione,... ): ciò che si chiede è di costruire un modello del segnale che spieghi e caratterizzi l occorrenza dei simboli osservati, così da poter essere utilizzato per l identificazione e il riconoscimento di altre sequenze di osservazioni. Per affrontare un tale problema si devono prendere alcune fondamentali decisioni, quale, per esempio, la forma del modello da utilizzare: lineare o non-lineare, tempo-variante o tempo-invariante, deterministico o stocastico. I modelli di sistemi lineari tempo-invarianti, che modellano i simboli osservati come l uscita di un sistema lineare a parametri costanti eccitato da un opportuno ingresso, si sono dimostrati utili per una grandissima varietà di applicazioni. Molti segnali del mondo reale, tuttavia, non possono essere significativamente modellati senza considerare una variazione temporale dei parametri prima accennati. Un tale problema può essere affrontato attraverso il seguente approccio. Molti tra i segnali fisici che nel loro complesso necessitano di modelli tempo-varianti possono essere ciononostante modellati da un sistema lineare tempo-invariante se considerati in un intervallo di tempo sufficientemente piccolo: la natura tempo-variante del processo può essere vista come una diretta concatenazione di questi brevi intervalli di tempo, ciascuno dei quali singolarmente rappresentato da un modello di sistema tempo invariante. Ciascuno di questi intervalli di tempo di osservazione viene visto come un unità con una durata prestabilita, che in molti sistemi fisici si determina in modo empirico. In molti processi, ovviamente, non ci si aspetta che le proprietà del processo cambino sincronicamente con la durata dell analisi di ogni unità, né che si osservino drastici cambiamenti da un unità alla successiva, se non in particolari casi. In molti casi, infatti, ciò che si osserva è un cambiamento di comportamento sequenziale: le proprietà del processo solitamente si mantengono per un certo periodo di tempo e successivamente cambiano, gradualmente o rapidamente, in un altro insieme di proprietà. Una 1

20 tesi 2013/1/26 18:23 page 2 #20 Capitolo 1 Introduzione rappresentazione efficiente può allora essere ottenuta utilizzando un modello di intervallo di tempo comune per ogni parte stabile del segnale, con l aggiunta di una qualche caratterizzazione di come un tale periodo evolve verso il successivo. Ecco quindi che per modellare un mondo mutevole si usa una variabile aleatoria per ogni aspetto del suo stato in ogni intervallo temporale. Le relazioni tra queste variabili descrivono l evoluzione dello stato. Il processo di cambiamento può essere visto come una serie di fotografie, ognuna delle quali descrive lo stato in un particolare istante. Ogni fotografia contiene un insieme di variabili aleatorie, alcune osservabili e altre no. Per semplicità si assume che in ogni intervallo di tempo sia osservabile lo stesso sottoinsieme di variabili e si assume che: i cambiamenti sono causati da un processo stazionario, cioè che i cambiamenti stessi sono regolati da leggi immutabili nel tempo; lo stato corrente dipende soltanto da una storia finita di stati precedenti. Da queste assunzioni nasce l idea degli Hidden Markov Models (HMM), processi doppiamente stocastici con un processo stocastico sottostante che non è osservabile (hidden, nascosto), ma che può solo essere osservato attraverso un altro insieme di processi stocastici che producono la sequenza di simboli osservati. In questo lavoro di tesi l applicazione dell HMM riguarda lo speech processing. In particolare è stato sviluppato un sistema di riconoscimento vocale distribuito. In tale tipologia di sistemi l architettura del processo di riconoscimento vocale è riconducibile ad uno schema del tipo client-server. Un sistema di riconoscimento vocale distribuito è composto da un front-end e da un backend. Il front-end calcola ed estrae i parametri caratteristici del segnale vocale e li trasmette al back-end che realizza il riconoscimento. La voce non è trasmessa su un canale vocale: ai fini del riconoscimento vocale, solo una rappresentazione parametrica codificata viene inviata usando un canale dati, pertanto la trasmissione è numerica e può usare opzionalmente ulteriori meccanismi di recupero e correzione degli errori, oltre a quelli già previsti dallo standard ETSI. Dopo l estrazione dei parametri cepstrali, questi sono formattati in un bitstream tramesso sul canale. Nel capitolo 2 viene descritta l architettura generale di un sistema di riconoscimento vocale distribuito conforme allo standard ETSI ES Nel capitolo 3 è descritta l implementazione del sistema di riconoscimento vocale distribuito, l implementazione in Java del front-end ed il successivo porting su un dispositivo mobile basato su piattaforma Android. Sulla base dei problemi emersi in questa prima fase e soprattutto dei margini di miglioramento intravisti, la ricerca si è successivamente focalizzata sulle tecniche di adattamento al parlatore. Nel capitolo 4 viene descritta la teoria che 2

21 tesi 2013/1/26 18:23 page 3 #21 sta alla base delle tecniche di adattamento al parlatore. Il capitolo 5 riporta la descrizione dello sviluppo di un algoritmo originale per l implementazione del metodo CMLLR. Infine nel capitolo 6 viene descritta una tecnica per l adattamento al parlatore da applicare lato client che implementa la trasformazione non vincolata. 3

22 tesi 2013/1/26 18:23 page 4 #22

23 tesi 2013/1/26 18:23 page 5 #23 Capitolo 2 I sistemi DSR e lo standard ETSI ES I sistemi di riconoscimento vocale (ASR, Automatic Speech Recognition) hanno ormai imboccato la strada necessaria per superare il gap tra la naturalezza data dall eloquio con un interlocutore reale e il risparmio sui costi, unitamente all affidabilità, garantito da un sistema automatico. Le performance dei sistemi di riconoscimento del parlato che ricevono il segnale vocale trasmesso nei canali mobili, presentano delle degradazioni in confronto con i sistemi che lavorano con il segnale originale, in genere dovute ad una codifica ad un basso bit rate e alla presenza di errori di trasmissione. Un sistema di riconoscimento vocale distribuito (DSR, Distributed Speech Recognition), risolve questi problemi mediante la sostituzione delle codifiche audio tradizionali con il calcolo di parametri rappresentativi del parlato (features) tramite l uso di meccanismi di filtraggio del rumore acustico sovrapposto al segnale vocale. Il processo si svolge in un terminale mobile e la rete. Il calcolo dei parametri e l identificazione degli intervalli di voce o di rumore sono realizzati sul client, tipicamente un terminale mobile, mentre il processo di riconoscimento si esegue in un server remoto. 2.1 Riconoscimento Automatico (ASR) Un sistema ASR permette di convertire il parlato in testo. Ad esempio un parlatore può parlare ad una frequenza di 160 parole per minuti, e automaticamente il computer converte il parlato in testo con errore pari del 4 percento [1]. Il processo di riconoscimento è eseguito da un software chiamato motore di riconoscimento vocale; in particolare se l applicazione può interpretare il risultato del motore di riconoscimento come se fosse un comando, l applicazione è chiamata command-control, se supporta solamente il testo riconosciuto come testo, l applicazione è di dettatura. Il silenzio, nelle applicazioni di riconoscimento, è tanto importante quanto l eloquio, perché esso delimita l inizio e la fine di una enunciazione (utterance). Una utterance è un flusso di parlato fra 5

24 tesi 2013/1/26 18:23 page 6 #24 Capitolo 2 I sistemi DSR e lo standard ETSI ES due intervalli di silenzio. Pertanto può essere una singola parola oppure una serie di parole che formano una frase. Le utterances sono inviate al motore di riconoscimento sottoforma di features per il loro trattamento: se il parlatore non produce nessun suono vocalizzato, il motore restituisce un timeout di silenzio, che indica che non è stata trovata nessuna enunciazione. Il motore di riconoscimento usa un insieme di dati, modelli statistici e algoritmi per convertire il segnale vocale in testo. Durante lo sviluppo di applicazioni di riconoscimento vocale, è opportuno definire l insieme delle parole e delle frasi che gli utenti possono pronunciare, in quanto tale informazione è utile per guidare e migliorare le prestazioni di riconoscimento. La definizione delle frasi e parole si specifica tramite una grammatica. Una grammatica usa una sintassi particolare, un gruppo di regole per definire le parole, le frasi che possono essere riconosciute dal motore. La specifica della grammatica può essere fatta semplicemente mediante un elenco di parole, cioè sfruttando le proprietà del linguaggio naturale. La dipendenza dal parlatore descrive il grado di conoscenza delle caratteristiche vocali di un parlatore, che un motore richiede per svolgere un riconoscimento accurato. Quei riconoscitori che esigono l interazione vocale con un utente per allenare il sistema in una fase preliminare, sono chiamati dipendenti dal parlatore (speaker-dependent) altrimenti sono chiamati indipendenti dal parlatore (speaker-independent). I sistemi di riconoscimento di parole isolate, con pause corte fra le parole, sono usati per applicazioni command-control con vocabolari ridotti come comandi per la navigazione internet, il controllo di menu tramite voce, etc Antecedenti I riconoscitori vocali sono basati sui modelli di Markov. Gli Hidden Markov Models (HMM), come detto in precedenza, permettono di modellare processi stocastici come il parlato. Gli HMM rappresentano il parlato come una sequenza di vettori di osservazione derivati da una funzione di probabilità di primo ordine chiamata catena di Markov. Gli stati del sistema sono identificati in uscita da una funzione probabilistica che descrive le variazioni e sono collegati mediante transizioni probabilistiche. Gli ASR sono divisi in due classi: direct voice input (DVI) e large vocabulary continuos speech recognition (LVCSR). I dispositivi DVI permettono alla voce di comandare e controllare, dall altro lato i sistemi LVCSR consentono il riconoscimento del parlato continuo e trovano applicazione nella generazione dei documenti tramite la dettatura. La configurazione dei sistemi DVI è orientata ai vocabolari ridotti (massimo 100 parole). I sistemi LVCSR lavorano con dei vocabolari più grandi (minimo 1000 parole) e sono configurati per la trascrizione del parlato continuo, inoltre i LVCSR possono non necessitare di un riconoscimento in tempo reale, 6

25 tesi 2013/1/26 18:23 page 7 # Riconoscimento Automatico (ASR) ad esempio per un servizio di dettatura tramite il telefono, il messaggio dettato può essere inviato successivamente via posta elettronica all utente. Dal punto di vista delle applicazioni, i benefici dei sistemi ASR derivano dal vantaggio di provvedere canali di comunicazioni extra per le interazioni uomo-macchina (comunicazioni multimodali) in ambiti di tipo hands-busy e eyes-busy, o semplicemente per comodità dell utente o abbattimento dei costi di un servizio Processo di riconoscimento Un sistema di riconoscimento automatico avviene in 3 fasi: 1. Il trattamento o analisi del parlato (front-end). In questa fase si fa un analisi preliminare della voce. Durante questo stadio, si esamina il segnale vocale attraverso il tempo e si estraggono i parametri spettrali (dopo la conversione analogica/digitale del segnale). 2. Classificazione delle unità fonetiche cioè modello acustico. Classifica e identifica i segmenti di voce già processati con dei simboli fonetici (fonemi). A volte si può associare una probabilità ai fonemi mediante una simbologia che permette di ampliare l informazione trasmessa allo stadio seguente. 3. Analisi usando delle regole del parlato dette anche modello del linguaggio. In quest ultima fase si sfruttano le regole usate per codificare il messaggio contenuto nel segnale, con lo scopo di migliorare le performance del sistema e infine per ottenere dei risultati migliori si ricava la conoscenza dall ortografia, sintattica, prosodica, semantica Caratteristiche Il sistema di produzione della voce umana può sembrare molto semplice, però a causa della grande quantità dei parametri descrittivi che interagiscono nel processo, il problema è insitamente complesso. La tecnologia ASR di natura interdisciplinare permette di applicare delle tecniche e delle conoscenze da diverse aree, quali [2] processamento dei segnali, fisica (acustica), riconoscimento di patterns, teoria dell informazione e comunicazioni, linguistica, fisiologia e informatica. I sistemi ASR hanno vantaggi e svantaggi. Gli svantaggi più importanti sono stati classificati in sei punti [3]: 1. Continuità. Nel linguaggio naturale non ci sono delle sospensioni tra le unità, inoltre le pause ed i silenzi possono essere molto brevi e mascherati da rumore di sottofondo. 2. Dipendenza dal Contesto. Ogni suono in cui si può dividere il parlato (fonema) è modificato dal contesto in cui si trova. La produzione del 7

26 tesi 2013/1/26 18:23 page 8 #26 Capitolo 2 I sistemi DSR e lo standard ETSI ES fenomeno chiamato coarticulation è legata alla vicinanza dei fonemi, due fonemi uno precedenti e uno successivo possono modificare l aspetto di un fonema adiacente. 3. Variabilità. La variabilità può essere intra-parlatore oppure inter-parlatore. La variabilità (intra-parlatore) è prodotta per le modifiche introdotte dallo stesso parlatore ad esempio, quando si pronuncia in maniera diversa gli stessi fonemi ovvero parole. La variazione di tipo inter-parlatore è prodotta dall interazione del parlatore con l ambiente, il segnale ottenuto dipenderà dai dispositivi usati per la sua registrazione, altro aspetto è il sistema di fonazione umana che cambia per ogni parlatore. 4. Salvataggio dell informazione. Il numero di dati processati e salvati cresce notevolmente all aumentare della durata dell eloquio, perciò è necessario avere a disposizione risorse di memoria che possano supportare queste esigenze. 5. Organizzazione dell informazione. Il segnale contiene informazione a diversi livelli di descrizione. L analisi del segnale richiede una struttura dell informazione in modo di poter classificarla. Nel processo di analisi ci sono dati di tipo semantico, sintattico e fonetico. Dall altra parte il segnale vocale contiene dell informazione che descrive il parlatore. 6. Assenza delle regole di descrizione e ridondanza. Finora non è stato definito un modello per descrivere i diversi livelli di informazione. 2.2 Riconoscimento Vocale Distribuito (DSR) La tecnologia vocale offre un nuovo metodo per la gestione dell informazione tramite i sistemi di riconoscimento vocale. La complessità dei vocabolari usati, le restrizioni di memoria e le risorse computazionali limitate sono alcuni degli aspetti che sono considerati per lo sviluppo di nuove applicazioni di riconoscimento distribuito tra un terminale e la rete. I server centralizzati sono usati per eseguire delle operazioni considerate pesanti per il terminale utente (tipicamente un dispositivo mobile). Il vantaggio di separare alcune funzionalità tra terminale utente (client) ed un server di rete è dovuto anche all aumento della capacità di aggiornamento delle tecnologie e dei servizi. Le reti mobili di voce potrebbero, in certi casi avere una bassa performance, causata maggiormente da un decremento del bit rate e dagli errori nel canale di trasmissione. Un sistema DSR (Distributed Speech Recognition) propone delle soluzioni ai problemi indicati, mediante l eliminazione della connessione voce e la sua sostituzione con una connessione dati a pacchetto per l invio di una rappresentazione 8

27 tesi 2013/1/26 18:23 page 9 # STANDARD ETSI ES parametrica della voce ottimizzata per il riconoscimento e non soggetta alle limitazioni e alle degradazioni causate dai codec vocali, il cui scopo è la sola compressione massima di banda. In un sistema distribuito, il riconoscimento è ripartito tra il terminale e la rete. Il terminale (front-end) esegue l estrazione delle features, che sono trasmesse tramite un canale dati ed arrivano al server per il riconoscimento automatico (back-end). Il contributo più importante è il basso impatto della codifica di trasmissione, ottimizzata per massimizzare la bontà del riconoscimento automatico e non per minimizzare l occupazione di banda, sulla performance del processo di riconoscimento. La Fig. 2.1 mostra l architettura generale di un sistema DSR. Figura 2.1: Schema a blocchi di un sistema DSR. (a) raffigura il lato client. (b) raffigura il lato server. Per facilitare lo sviluppo delle applicazioni che supportano il riconoscimento distribuito è stato proposto uno standard che garantisce la compatibilità tra il terminale (client) e il riconoscitore remoto (server). 2.3 STANDARD ETSI ES Il primo standard ETSI [4] è basato sulla rappresentazione del Mel-Cepstrum, data la diffusione di questa tecnica nell industria del riconoscimento vocale. Il secondo standard [5], precisa gli aspetti per la costruzione di un DSR resistente 9

28 tesi 2013/1/26 18:23 page 10 #28 Capitolo 2 I sistemi DSR e lo standard ETSI ES al rumore di sottofondo. Lo standard preso in esame in questa tesi è lo standard ETSI ES [6]. Nel terminale, il segnale del parlato è campionato e parametrizzato usando l algoritmo Mel-Cepstrum: come risultato sono generati 12 coefficienti cepstrali ed il valore dell energia (log energy), che vengono compressi e formattati per comporre il bitstream di trasmissione. Il bitstream è inviato su una linea di trasmissione di tipo cablata oppure senza fili al server remoto; dal lato server si esegue il processo di decodifica estraendo i parametri Mel-Cepstrum. La definizione dell architettura per il server di riconoscimento back-end non è parte dallo standard, in quanto l interoperabilità tra il terminale e la rete è garantita dalla definizione del solo bitstream trasmesso. I canali usati per trasportare il bitstream sono sensibili agli errori, per questo motivo nel codificatore (terminale mobile) sono aggiunti alcuni bit di codice correzione (CRC) ed è usato un algoritmo per l identificazione e la correzione degli errori nel decodificatore Noise Reduction La riduzione del rumore è divisa in due stadi, molto simili, basati sulla teoria del filtraggio di Wiener. La Fig. 2.2 mostra i principali elementi del blocco di riduzione del rumore del front-end. Il segnale rumoroso di entrata viene trattato nel primo stadio, l uscita è a sua volta l entrata del secondo stadio, infine l uscita del blocco è il segnale pulito. Figura 2.2: Blocco di riduzione del rumore. Il processo è realizzato per ogni frame del segnale. Dopo la frammentazione del segnale di input, il blocco chiamato Spectrum Estimation calcola lo spet- 10

29 tesi 2013/1/26 18:23 page 11 # STANDARD ETSI ES tro di ogni frame. Il blocco PSD Mean filtra lo spettro del segnale lungo l indice del tempo. Il blocco WF Design calcola i coefficienti di Wiener nel dominio della frequenza, usando la stima dello spettro del frame corrente e lo spettro del rumore. Lo spettro del rumore è calcolato dai frame rumorosi, trovati dal Voice Activity Detector (VADNest). I coefficienti di Wiener sono filtrati tramite il Mel Filter-bank. La riposta impulsiva del filtro di Wiener Mel-warped si ottiene applicando la Mel IDCT. Nell ultimo passo il blocco OFF cancella l offset del segnale trattato. Buffering Il segnale di input del blocco di riduzione del rumore è un frame di 80 campioni. Un buffer di 4 frame (dal frame 0 al frame 3) è usato per ogni stadio del blocco di riduzione del rumore. Ad ogni nuovo frame in ingresso, i buffer dei due stadi vengono traslati di un frame. Il nuovo frame in ingresso al blocco di riduzione del rumore diventa il frame 3 del buffer del primo stadio. Quindi viene processato il frame 1 (dalla posizione 80 alla posizione 159 nel buffer) del buffer del primo stadio. Tale frame diventa il frame 3 del buffer del secondo stadio. Dunque il frame 1 del buffer del secondo stadio viene processato. Tale frame processato rappresenta l uscita del blocco di riduzione del rumore. Quindi ad ogni stadio del blocco di riduzione del rumore c è una latenza di 2 frame (20 ms). Per ogni stadio del blocco di riduzione del rumore, la stima spettrale viene effettuata su una finestra che parte dalla posizione 60 e finisce alla posizione 259. Spectrum estimation Il segnale in ingresso viene diviso in frames sovrapposti di N in campioni. Il frame ha una lunghezza di 25 ms (N in = 200) e lo shift è pari a 10 ms (80 campioni). Ogni frame s in (n) è finestrato con una finestra di Hanning di lunghezza N in, w Hann (n) nel seguente modo: s w (n) = s in w Hann (n), 0 n N in 1 (2.1) dove w Hann = cos ( ) 2π(n + 0.5) N in (2.2) Quindi, viene effettuato uno zero-padding dal campione N in al campione N F F T 1, dove N F F T = 256 è la lunghezza della Fast Fourier Transform (FFT): { sw (n), 0 n N in 1 s F F T (n) = (2.3) 0, N in n N F F T 1 11

Politecnico di Torino. Un approccio verso i dispositivi mobili

Politecnico di Torino. Un approccio verso i dispositivi mobili Politecnico di Torino Corso Infrastruttura e servizi per reti geografiche SEMINARIO IL RICONOSCIMENTO VOCALE DISTRIBUITO: Un approccio verso i dispositivi mobili Alessandro Rinotti DISPOSITIVI MOBILI 15/06/05

Dettagli

TECNICHE DI COMPRESSIONE DATI

TECNICHE DI COMPRESSIONE DATI TECNICHE DI COMPRESSIONE DATI COMPRESSIONE DATI La compressione produce una rappresentazione più compatta delle informazioni è come se si usassero meno parole per dire la stessa cosa in modo diverso. Esistono

Dettagli

Compressione del Segnale (Audio)

Compressione del Segnale (Audio) Compressione del Segnale (Audio) Carlo Caini e Alessandro Vanelli Coralli Argomenti della Presentazione Introduzione Perché comprimere Come comprimere Esempi di Algoritmi di compressione Codifiche predittive

Dettagli

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale Esperienze di Apprendimento Automatico per il corso di lippi@dsi.unifi.it Dipartimento Sistemi e Informatica Università di Firenze Dipartimento Ingegneria dell Informazione Università di Siena Introduzione

Dettagli

2. SINCRONIZZAZIONE (CENNI)

2. SINCRONIZZAZIONE (CENNI) 2. SINCRONIZZAZIONE (CENNI) INTRODUZIONE AL PROBLEMA DELLA SINCRONIZZAZIONE SINCRONISMO DI BIT SCRAMBLING SINCRONISMO DI FRAME INTRODUZIONE Abbiamo visto diverse tecniche in grado di convertire e di trasmettere

Dettagli

Introduzione alla scienza della comunicazione (E. T. Jaynes)

Introduzione alla scienza della comunicazione (E. T. Jaynes) Introduzione alla scienza della comunicazione (E T Jaynes) S Bonaccorsi Department of Mathematics University of Trento Corso di Mathematical model for the Physical, Natural and Social Sciences Outline

Dettagli

Computazione per l interazione naturale: Modelli dinamici

Computazione per l interazione naturale: Modelli dinamici Computazione per l interazione naturale: Modelli dinamici Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2015.html

Dettagli

Autenticazione Vocale

Autenticazione Vocale Autenticazione Vocale (A. Gorziglia) INTRODUZIONE: perché usare i sistemi biometrici per l autenticazione. Il motivo principale è quello di impedire all utente di perdere (o dimenticare) la chiave di autenticazione

Dettagli

Capitolo 4 Tecnica di analisi on-line

Capitolo 4 Tecnica di analisi on-line Capitolo 4:Tecniche di analisi in on-line 70 Capitolo 4 Tecnica di analisi on-line 4.1 Introduzione L analisi in tempo reale di un sistema complesso comporta la scelta di tecniche di analisi di tipo statistico

Dettagli

RETI INTERNET MULTIMEDIALI

RETI INTERNET MULTIMEDIALI RETI INTERNET MULTIMEDIALI Compressive Video Motion JPEG, Digital Video, H.261, H.263 Il documento è adattato da materiale cortesemente messo a disposizione dal Prof. Stefano Paris e dal Prof. Vittorio

Dettagli

Elementi di teoria dei segnali /b

Elementi di teoria dei segnali /b Elementi di teoria dei segnali /b VERSIONE 29.4.01 Filtri e larghezza di banda dei canali Digitalizzazione e teorema del campionamento Capacità di canale e larghezza di banda Multiplexing e modulazioni

Dettagli

FONDAMENTI di INFORMATICA Prof. Lorenzo Mezzalira

FONDAMENTI di INFORMATICA Prof. Lorenzo Mezzalira FONDAMENTI di INFORMATICA Prof. Lorenzo Mezzalira Appunti del corso 1 Introduzione all informatica: algoritmi, linguaggi e programmi Indice 1. Introduzione 2. Risoluzione automatica di problemi - Algoritmi

Dettagli

Capitolo 5 RESTAURO E RICOSTRUZIONE DI IMMAGINI

Capitolo 5 RESTAURO E RICOSTRUZIONE DI IMMAGINI Capitolo 5 RESTAURO E RICOSTRUZIONE DI IMMAGINI La differenza tra il restauro e il miglioramento (enhancement) delle immagini è che il miglioramento è un processo soggettivo, mentre il restauro è un processo

Dettagli

Corso di Fondamenti di Telecomunicazioni

Corso di Fondamenti di Telecomunicazioni Corso di Fondamenti di Telecomunicazioni 5 - EGALI DIGITALI E A IMPULI I BADA BAE Prof. Mario Barbera [parte ] Codifica La fase di codifica prevede che venga fatta una associazione tra il livello del segnale

Dettagli

Università degli studi di Messina

Università degli studi di Messina Università degli studi di Messina Facoltà di Ingegneria Corso di laurea in Ingegneria Elettronica Tesina di Sistemi di Telecomunicazione Prenotazione Esami con CSLU Speech - toolkit Docente: Prof. Salvatore

Dettagli

DNA sequence alignment

DNA sequence alignment DNA sequence alignment - Introduzione: un possibile modello per rappresentare il DNA. Il DNA (Acido desossiribonucleico) è una sostanza presente nei nuclei cellulari, sia vegetali che animali; a questo

Dettagli

Introduzione al Campionamento e

Introduzione al Campionamento e Introduzione al Campionamento e all analisi analisi in frequenza Presentazione basata sul Cap.V di Introduction of Engineering Experimentation, A.J.Wheeler, A.R.Ganj, Prentice Hall Campionamento L'utilizzo

Dettagli

RETI INTERNET MULTIMEDIALI. Compressive Video

RETI INTERNET MULTIMEDIALI. Compressive Video RETI INTERNET MULTIMEDIALI Compressive Video Introduzione I formati di compressione per contenuti audio e video intruducono nuovi elementi per aumentare il rapporto di codifica Codifica nello spazio e

Dettagli

SISTEMI DI TELECOMUNICAZIONI

SISTEMI DI TELECOMUNICAZIONI SISTEMI DI TELECOMUNICAZIONI MODI DI TRASFERIMENTO SERVIZI DI TRASFERIMENTO DELL INFORMAZIONE L informazione da trasferire si ipotizza strutturata in IU Costituita da b bit Da consegnare in t secondi Se

Dettagli

Configurazione moduli I/O serie EX

Configurazione moduli I/O serie EX Configurazione moduli I/O serie EX aggiornamento: 20-12-2014 IEC-line by OVERDIGIT overdigit.com Tabella dei contenuti 1. Moduli di I/O con protocollo Modbus... 3 1.1. Parametri di comunicazione... 4 1.2.

Dettagli

Facoltà di Scienze e Tecnologie

Facoltà di Scienze e Tecnologie Corso di Laurea in Informatica Applicata Estratto da: Tesi di laurea di: Matteo Parlani Anno Accademico 2006-2007 Indice 1. Introduzione 2. Cepstrum Analysis 3. Caso di studio 4. Esperimenti 5. Risultati

Dettagli

4.3 CODIFICA PER ANALISI E SINTESI

4.3 CODIFICA PER ANALISI E SINTESI 4.3 CODIFICA PER ANALISI E SINTESI Gli schemi di codifica di analisi per sintesi presentano alcuni aspetti essenziali che hanno determinato il loro successo: l inserimento tra il modello dell eccitazione

Dettagli

teoresi studi&ricerche

teoresi studi&ricerche UN SISTEMA DI CONTROLLO PER ELICOTTERO Realizzazione con Simulink e Direct3D di M. CARIDI e L. DAGA Dipartimento di Informatica e Sistemistica Università degli Studi di Roma La Sapienza via Eudossiana

Dettagli

Il Concetto di Informazione FORMALIZZAZIONE DELL INFORMAZIONE. Informazione e Codifica. Informazione e Codifica. Regole. Principio di Composizione

Il Concetto di Informazione FORMALIZZAZIONE DELL INFORMAZIONE. Informazione e Codifica. Informazione e Codifica. Regole. Principio di Composizione 2 Il Concetto di Informazione FORMALIZZAZIONE DELL INFORMAZIONE Informatica per le Discipline Umanistiche Informazione e Codifica Informazione e Codifica 3 4 il numero dieci I0 10 de il numero dieci de

Dettagli

Orthogonal Frequency-Division Multiplexing

Orthogonal Frequency-Division Multiplexing Università degli Studi di Firenze Dipartimento di Elettronica e Telecomunicazioni Firenze, 20 Gennaio 2005 Corso di Sistemi Wireless in Area Locale Orthogonal Frequency-Division Multiplexing Un approccio

Dettagli

Nota di Copyright. Leonardo Fanelli Urbino - Ottobre 05

Nota di Copyright. Leonardo Fanelli Urbino - Ottobre 05 Nota di Copyright Questo insieme di trasparenze (detto nel seguito slide) è protetto dalle leggi sul copyright e dalle disposizioni dei trattati internazionali. Il titolo e i copyright relativi alle slides

Dettagli

Codifica Video MPEG. Ing. Francesco Benedetto - Prof. Gaetano Giunta. Laboratorio di Telecomunicazioni (COMLAB) Università degli Studi Roma Tre

Codifica Video MPEG. Ing. Francesco Benedetto - Prof. Gaetano Giunta. Laboratorio di Telecomunicazioni (COMLAB) Università degli Studi Roma Tre Codifica Video MPEG Ing. Francesco Benedetto - Prof. Gaetano Giunta Laboratorio di Telecomunicazioni (COMLAB) Università degli Studi Roma Tre 1 Perché comprimere Si supponga di voler trasmettere 30 fotografie

Dettagli

) *!' " * +! #"#, ( -. - ( 0 0 00. - #

) *!'  * +! ##, ( -. - ( 0 0 00. - # ! " $% & ' ( ) *!' " * +! ", ( -. - /. - 0 0( ( ) $% * ++! " * +, ( -. - ( 0 0 00. - / 12! ) 1 1 3 /4**' $% * 3* 0 5 6 0!56" * 7'! "( - $% ' /. - 0560, 8 * 56 *, * 9$, $% 0560 :+; * " 3 *' $% ' /*, '(

Dettagli

STRUMENTAZIONE E MISURE ELETTRICHE. Condizionamento ed acquisizione del segnale

STRUMENTAZIONE E MISURE ELETTRICHE. Condizionamento ed acquisizione del segnale STRUMENTAZIONE E MISURE ELETTRICHE Condizionamento ed acquisizione del segnale Prof. Salvatore Nuccio salvatore.nuccio@unipa.it, tel.: 0916615270 1 Circuito di condizionamento Un sensore/trasduttore (S/T)

Dettagli

Codifica di sorgente. esempio di sorgente con memoria

Codifica di sorgente. esempio di sorgente con memoria Codifica di sorgente esercitazione su sorgenti markoviane 1 esempio di sorgente con memoria Esempio di sorgente con memoria markoviana a due stati NB: per la simmetria del sistema, i simboli sono equiprobabili

Dettagli

Entropia. Motivazione. ? Quant è l informazione portata dalla sequenza? Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,...

Entropia. Motivazione. ? Quant è l informazione portata dalla sequenza? Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,... Entropia Motivazione Abbiamo una sequenza S di N simboli (campioni audio, pixel, caratteri,... ) s,s 2,s 3,... ognuno dei quali appartiene ad un alfabeto A di M elementi.? Quant è l informazione portata

Dettagli

TEORIA DEI SEGNALI. Introduzione. La Comunicazione

TEORIA DEI SEGNALI. Introduzione. La Comunicazione TEORIA DEI SEGNALI Introduzione L obiettivo principale di un servizio di telecomunicazione è il trasferimento dell'informazione emessa da una sorgente agli utenti cui è destinata, nell'ambito di una particolare

Dettagli

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A. 2007-08. Alberto Perotti, Roberto Garello

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A. 2007-08. Alberto Perotti, Roberto Garello Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Processi casuali A.A. 2007-08 Alberto Perotti, Roberto Garello DELEN-DAUIN Processi casuali Sono modelli probabilistici

Dettagli

Diploma Accademico di primo livello Ordinamentale

Diploma Accademico di primo livello Ordinamentale Diploma Accademico di primo livello Ordinamentale DISCIPLINA: INFORMATICA MUSICALE I-II-III (MUSICA ELETTRONICA) (COME/05) Docente: Prof. Marco Ligabue Durata: 36 ore annuali (Gruppo) CFA: 12 annuali Informatica

Dettagli

Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it

Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it Corso di laurea magistrale in Ingegneria delle Telecomunicazioni Metodi e Strumenti per la Caratterizzazione e la Diagnostica di Trasmettitori Digitali RF ing. Gianfranco Miele g.miele@unicas.it Trasmettitore

Dettagli

Perché Codificare i Dati? Codifica dei Dati. Tecniche di Codifica del Segnale. Cooperazione Trasmettitore- Ricevitore

Perché Codificare i Dati? Codifica dei Dati. Tecniche di Codifica del Segnale. Cooperazione Trasmettitore- Ricevitore Università degli studi di Salerno Laurea in Informatica I semestre 03/04 Codifica dei Dati Prof. Vincenzo Auletta auletta@dia.unisa.it http://www.dia.unisa.it/professori/auletta/ 2 Perché Codificare i

Dettagli

L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E

L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E MODULO 1: MANIPOLAZI ONE DEL SEGNALE AUDI O G.PRESTI - 12/03/2015 - LE ZI ON E 2 1. CONVERSIONE DA ANALOGICO A DIGITALE Convertire un segnale

Dettagli

Linguaggi e Paradigmi di Programmazione

Linguaggi e Paradigmi di Programmazione Linguaggi e Paradigmi di Programmazione Cos è un linguaggio Definizione 1 Un linguaggio è un insieme di parole e di metodi di combinazione delle parole usati e compresi da una comunità di persone. È una

Dettagli

Reti di Telecomunicazioni 1

Reti di Telecomunicazioni 1 Reti di Telecomunicazioni 1 Corso on-line - AA2004/05 Blocco 3 Ing. Stefano Salsano e-mail: stefano.salsano@uniroma2.it 1 Le sorgenti di traffico in una rete di TLC 2 Tipi di flussi di informazione Messaggi

Dettagli

Breve introduzione al Calcolo Evoluzionistico

Breve introduzione al Calcolo Evoluzionistico Breve introduzione al Calcolo Evoluzionistico Stefano Cagnoni Dipartimento di Ingegneria dell Informazione, Università di Parma cagnoni@ce.unipr.it 1 Introduzione Il mondo fisico ed i fenomeni naturali

Dettagli

VideoStreaming su IP

VideoStreaming su IP VideoStreaming su IP Anno Accademico 2007/2008 Agenda Principi di video Streaming Come prevenire gli errori e come mascherarli Appendice Come si realizza la codifica/decodifca Protocollidirete Overview

Dettagli

wave a 44,1 khz, 16 bit, PCM, stereo (standard cd audio) L utilizzo di una risoluzione dipende anche dal supporto che la dovrà ospitare.

wave a 44,1 khz, 16 bit, PCM, stereo (standard cd audio) L utilizzo di una risoluzione dipende anche dal supporto che la dovrà ospitare. Il Suono Digitale Capitolo 3 - Formati e standard digitali dei file audio Il formato Wave, Wave 64, AIFF pag 1 Il Transfert Rate pag 4 Il formato mp3 pag 5 Il trasferimento di file tramite Internet pag

Dettagli

di programmazione quali varargin/varargout, switch, i comandi e salvataggio dei dati. Tutto questo, migliorato da una maggiore

di programmazione quali varargin/varargout, switch, i comandi e salvataggio dei dati. Tutto questo, migliorato da una maggiore COMPILER 2.0 Generazione automatica di C-Mex file e impiego stand-alone. Maggior flessibilità ed efficienza nell esecuzione e nel controllo. La nuova versione del Compiler presenta tali migliorie ed aggiornamenti

Dettagli

Università di Napoli Parthenope Facoltà di Ingegneria

Università di Napoli Parthenope Facoltà di Ingegneria Università di Napoli Parthenope Facoltà di Ingegneria Corso di rasmissione Numerica docente: Prof. Vito Pascazio 18 a Lezione: 13/1/4 19 a Lezione: 14/1/4 Sommario rasmissione di segnali PM numerici su

Dettagli

Svantaggi della Commutazione di Circuito. Commutazione di Pacchetto. Struttura di un Pacchetto

Svantaggi della Commutazione di Circuito. Commutazione di Pacchetto. Struttura di un Pacchetto Università degli studi di Salerno Laurea in Informatica I semestre / Commutazione di Pacchetto Prof. Vincenzo Auletta auletta@dia.unisa.it http://www.dia.unisa.it/professori/auletta/ Svantaggi della Commutazione

Dettagli

Algoritmi e Sistemi di Riconoscimento vocale. Facoltà di Ingegneria Corso di Studi in Ingegneria Informatica

Algoritmi e Sistemi di Riconoscimento vocale. Facoltà di Ingegneria Corso di Studi in Ingegneria Informatica Facoltà di Ingegneria Corso di Studi in Ingegneria Informatica Elaborato finale in Algoritmi e Strutture Dati Algoritmi e Sistemi di Riconoscimento vocale Anno Accademico 2010/2011 Candidato: Claudio Coppola

Dettagli

JMF per applicazioni multimediali in Java

JMF per applicazioni multimediali in Java JMF per applicazioni multimediali in Java Corso di Applicazioni Telematiche A.A. 2006-07 Lezione n. 9 Prof. Roberto Canonico Lezione a cura di Ing. Generoso Paolillo Università degli Studi di Napoli Federico

Dettagli

Codifica Musicale (Standard MPEG)

Codifica Musicale (Standard MPEG) Codifica Musicale (Standard MPEG) Ing. Francesco Benedetto - Prof. Gaetano Giunta Corso di Elaborazione Numerica dei Segnali Dipartimento di Elettronica Applicata Università degli Studi Roma Tre 1 Il segnale

Dettagli

Contenuti. Corso di Laboratorio di Multimedialità. Programma del corso. Programma del corso

Contenuti. Corso di Laboratorio di Multimedialità. Programma del corso. Programma del corso Corso di Laboratorio di Multimedialità Anno Accademico 2002-2003 Docente: Claudio Sacchi PARTE 1: INTRODUZIONE AL CORSO E RIEPILOGO DEI CONCETTI DI BASE Contenuti Programma del corso ed articolazione delle

Dettagli

CONVERSIONE ANALOGICA DIGITALE (ADC)(A/D) CONVERSIONE DIGITALE ANALOGICA (DAC)(D/A)

CONVERSIONE ANALOGICA DIGITALE (ADC)(A/D) CONVERSIONE DIGITALE ANALOGICA (DAC)(D/A) CONVERSIONE ANALOGICA DIGITALE (ADC)(A/D) CONVERSIONE DIGITALE ANALOGICA (DAC)(D/A) ELABORAZIONE ANALOGICA O DIGITALE DEI SEGNALI ELABORAZIONE ANALOGICA ELABORAZIONE DIGITALE Vantaggi dell elaborazione

Dettagli

LAUREA MAGISTRALE INGEGNERIA ELETTRONICA. Acquisizione e Sincronizzazione Iniziale di Codice in Sistemi 3G (UMTS)

LAUREA MAGISTRALE INGEGNERIA ELETTRONICA. Acquisizione e Sincronizzazione Iniziale di Codice in Sistemi 3G (UMTS) LAUREA MAGISTRALE INGEGNERIA ELETTRONICA Anno Accademico 2006/2007 Acquisizione e Sincronizzazione Iniziale di Codice in Sistemi 3G (UMTS) ing. Francesco Benedetto (fbenedet@uniroma3.it) Digital Signal

Dettagli

Comunicazione codifica dei dati. Prof. Francesco Accarino IIS Altiero Spinelli Sesto San Giovanni

Comunicazione codifica dei dati. Prof. Francesco Accarino IIS Altiero Spinelli Sesto San Giovanni Comunicazione codifica dei dati Prof. Francesco Accarino IIS Altiero Spinelli Sesto San Giovanni Trasmissione dati La trasmissione dati,permette di trasmettere a distanza informazioni di tipo digitale

Dettagli

POLITECNICO DI BARI RICONOSCIMENTO DI VOLTI MEDIANTE H.M.M. SUPPORTATO DA RETI NEURALI

POLITECNICO DI BARI RICONOSCIMENTO DI VOLTI MEDIANTE H.M.M. SUPPORTATO DA RETI NEURALI POLITECNICO DI BARI FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA ELETTRONICA TESI DI LAUREA IN CALCOLATORI ELETTRONICI RICONOSCIMENTO DI VOLTI MEDIANTE H.M.M. SUPPORTATO DA RETI NEURALI Relatore:

Dettagli

Tecnologie del parlato

Tecnologie del parlato Tecnologie del parlato La sintesi del parlato Il riconoscimento del parlato 1 La sintesi del parlato (speech synthesis) Text-to-Speech (TTS) programmi in grado di produrre e pronunziare frasi allo scopo

Dettagli

Università degli Studi di Cassino e del Lazio Meridionale. Area Didattica di Ingegneria. Corso di Laurea in Ingegneria Industriale

Università degli Studi di Cassino e del Lazio Meridionale. Area Didattica di Ingegneria. Corso di Laurea in Ingegneria Industriale Università degli Studi di Cassino e del Lazio Meridionale Area Didattica di Ingegneria Corso di Laurea in Ingegneria Industriale Lezioni del Corso di Misure Industriali 1 Università degli Studi di Cassino

Dettagli

Dispense del corso di Elettronica Ls Prof. Guido Masetti

Dispense del corso di Elettronica Ls Prof. Guido Masetti Dispense del corso di Elettronica Ls Prof. Guido Masetti Elaborazione dei segnali 1 Sommario Elaborazione del segnale Sistemi lineari tempo invarianti (LTI), tempocontinui e tempo-discreti Analisi di Fourier

Dettagli

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l Ambiente e il Territorio

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l Ambiente e il Territorio Dipartimento di Ingegneria dell Informazione Università degli Studi di Parma Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l Ambiente e il Territorio Rappresentazione dell Informazione

Dettagli

Sistemi di Telecomunicazione

Sistemi di Telecomunicazione Sistemi di Telecomunicazione Codici di Linea e Sincronizzazione Universita Politecnica delle Marche A.A. 2014-2015 A.A. 2014-2015 Sistemi di Telecomunicazione 1/36 Codici di linea - I I segnali in logica

Dettagli

ECDL Base. ECDL Full Standard

ECDL Base. ECDL Full Standard http://www.nuovaecdl.it/ Modulo ECDL Base ECDL Full Standard ECDL Standard Computer Essentials Sì Sì Sì (1) Online Essentials Sì Sì Sì (1) Word Processing Sì Sì Sì (1) Spreadsheets Sì Sì Sì (1) IT Security

Dettagli

Automi. Sono così esempi di automi una lavatrice, un distributore automatico di bibite, un interruttore, una calcolatrice tascabile,...

Automi. Sono così esempi di automi una lavatrice, un distributore automatico di bibite, un interruttore, una calcolatrice tascabile,... Automi Con il termine automa 1 s intende un qualunque dispositivo o un suo modello, un qualunque oggetto, che esegue da se stesso un particolare compito, sulla base degli stimoli od ordini ricevuti detti

Dettagli

Reti sequenziali e strutturazione firmware

Reti sequenziali e strutturazione firmware Architettura degli Elaboratori, a.a. 25-6 Reti sequenziali e strutturazione firmware Alla parte di corso sulle reti sequenziali è apportata una sensibile semplificazione rispetto a quanto contenuto nel

Dettagli

Prova in itinere - Rete Internet (ing. Giovanni Neglia) Mercoledì 23 Maggio 2007, ore 15.00

Prova in itinere - Rete Internet (ing. Giovanni Neglia) Mercoledì 23 Maggio 2007, ore 15.00 Prova in itinere - Rete Internet (ing. Giovanni Neglia) Mercoledì 23 Maggio 2007, ore 15.00 NB: alcune domande hanno risposta multipla: si richiede di identificare TUTTE le risposte corrette. Cognome:

Dettagli

Le catene di Markov come metodologia utilizzata dai motori di ricerca per classificare le pagine web su internet.

Le catene di Markov come metodologia utilizzata dai motori di ricerca per classificare le pagine web su internet. Università degli Studi di Palermo Facoltà di Economia Dipartimento di Scienze Statistiche e Matematiche S. Vianelli Dottorato di Ricerca in Statistica e Finanza Quantitativa - XXI Ciclo Sergio Salvino

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 8 Support Vector Machines Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

Definizione e Sviluppo di un Ricevitore Software per l Elaborazione dei Segnali GPS e Galileo: Peculiarità e Risultati della Fase di Acquisizione

Definizione e Sviluppo di un Ricevitore Software per l Elaborazione dei Segnali GPS e Galileo: Peculiarità e Risultati della Fase di Acquisizione Tesi di Laurea Specialistica in Ingegneria delle Telecomunicazioni Anno Accademico 26-27 Definizione e Sviluppo di un Ricevitore Software per l Elaborazione dei Segnali GPS e Galileo: Peculiarità e Risultati

Dettagli

La compressione audio

La compressione audio Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Elaborazione di Immagini e Suoni / Riconoscimento e Visioni Artificiali 12 c.f.u. Anno Accademico 2008/2009 Docente: ing. Salvatore

Dettagli

Introduzione all acquisizione Dati

Introduzione all acquisizione Dati Introduzione all acquisizione Dati Laboratorio di Robotica Industriale Evoluzione della strumentazione Introduzione all acquisizione dati - 2 Trend nella strumentazione Introduzione all acquisizione dati

Dettagli

HTTP adaptation layer per generico protocollo di scambio dati

HTTP adaptation layer per generico protocollo di scambio dati HTTP adaptation layer per generico protocollo di scambio dati Sandro Cavalieri Foschini 101786 Emanuele Richiardone 101790 Programmazione in Ambienti Distribuiti I - 01FQT prof. Antonio Lioy A.A. 2002-2003

Dettagli

BOZZA DEL 06/09/2011

BOZZA DEL 06/09/2011 ARTICOLAZIONE: INFORMATICA Disciplina: COMPLEMENTI DI MATEMATICA (C4) Il docente di Complementi di matematica concorre a far conseguire allo studente, al termine del percorso quinquennale, i seguenti risultati

Dettagli

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo Evoluzione In ogni popolazione si verificano delle mutazioni. Intelligenza Artificiale In un ambiente che varia, le mutazioni possono generare individui che meglio si adattano alle nuove condizioni. Questi

Dettagli

Lezione 8. La macchina universale

Lezione 8. La macchina universale Lezione 8 Algoritmi La macchina universale Un elaboratore o computer è una macchina digitale, elettronica, automatica capace di effettuare trasformazioni o elaborazioni su i dati digitale= l informazione

Dettagli

Corso di Laurea Ingegneria Informatica Fondamenti di Informatica

Corso di Laurea Ingegneria Informatica Fondamenti di Informatica Corso di Laurea Ingegneria Informatica Fondamenti di Informatica Dispensa 05 La rappresentazione dell informazione Carla Limongelli Ottobre 2011 http://www.dia.uniroma3.it/~java/fondinf/ La rappresentazione

Dettagli

Capacità di canale in molte salse

Capacità di canale in molte salse Capacità di canale in molte salse. Bernardini 6 maggio 008 Indice 1 Introduzione 1 Modelli di canale 1.1 Matrice di transizione........................................ 1. Funzione aleatoria..........................................

Dettagli

PROGETTAZIONE E SVILUPPO DI UN PROTOTIPO PER LA COMUNICAZIONE SICURA ATTRAVERSO IL CANALE GSM-VOCE

PROGETTAZIONE E SVILUPPO DI UN PROTOTIPO PER LA COMUNICAZIONE SICURA ATTRAVERSO IL CANALE GSM-VOCE PROGETTAZIONE E SVILUPPO DI UN PROTOTIPO PER LA COMUNICAZIONE SICURA ATTRAVERSO IL CANALE GSM-VOCE Corso di Laurea Specialistica in Ingegneria Informatica Tesi di Laurea di: Gianluigi Biancucci Relatore:

Dettagli

ECDL Base. Moduli compresi: Descrizione.

ECDL Base. Moduli compresi: Descrizione. ECDL Base Com'è facilmente deducibile anche dal nome, la certificazione ECDL Base attesta il livello essenziale di competenze informatiche e web del suo titolare, aggiornate alle funzionalità introdotte

Dettagli

Elementi di Informatica e Programmazione

Elementi di Informatica e Programmazione Elementi di Informatica e Programmazione Le Reti di Calcolatori (parte 2) Corsi di Laurea in: Ingegneria Civile Ingegneria per l Ambiente e il Territorio Università degli Studi di Brescia Docente: Daniela

Dettagli

SISTEMI DI TELECOMUNICAZIONI

SISTEMI DI TELECOMUNICAZIONI SISTEMI DI TELECOMUNICAZIONI RETI TELEFONICHE Generalità Nessuna dipendenza dall estensione della rete Copertura locale Interconnessione a lunga distanza Trasporto della voce a commutazione di circuito

Dettagli

INDIRIZZO Informatica e Telecomunicazioni

INDIRIZZO Informatica e Telecomunicazioni ISTRUZIONE TECNICA INDIRIZZO Informatica e Telecomunicazioni L indirizzo Informatica e Telecomunicazioni ha lo scopo di far acquisire allo studente, al termine del percorso quinquennale, specifiche competenze

Dettagli

Progetto di una radio software GPS su periferica USRP. 2 Ottobre 2007

Progetto di una radio software GPS su periferica USRP. 2 Ottobre 2007 Progetto di una radio software GPS su periferica USRP Università degli Studi di Pisa Corso di Laurea Specialistica in Ingegneria Informatica Candidato Relatori Prof. Marco Luise Prof. Luciano Lenzini Ing.

Dettagli

1. Hard Real Time Linux (Laurea VO o specialistica)

1. Hard Real Time Linux (Laurea VO o specialistica) 20/9/06 Elenco Tesi Disponibili Applied Research & Technology Dept. La Società MBDA La MBDA Italia è un azienda leader nella realizzazione di sistemi di difesa che con i suoi prodotti è in grado di soddisfare

Dettagli

Numerazione binaria e rappresentazione delle informazioni

Numerazione binaria e rappresentazione delle informazioni Numerazione binaria e rappresentazione delle informazioni Info Sito del corso: http://home.dei.polimi.it/amigoni/informaticab.html Nicola Basilico, nicola.basilico@gmail.com Problema Abbiamo informazioni

Dettagli

Laboratorio del corso Progettazione di Servizi Web e Reti di Calcolatori Politecnico di Torino AA 2014-15 Prof. Antonio Lioy

Laboratorio del corso Progettazione di Servizi Web e Reti di Calcolatori Politecnico di Torino AA 2014-15 Prof. Antonio Lioy Laboratorio del corso Progettazione di Servizi Web e Reti di Calcolatori Politecnico di Torino AA 2014-15 Prof. Antonio Lioy Soluzioni dell esercitazione n. 2 a cura di Giacomo Costantini 19 marzo 2014

Dettagli

2 - Canali e Multiplazione

2 - Canali e Multiplazione Università degli studi di Bergamo Università degli studi di Bergamo Dipartimento di Ingegneria dell Informazione e Metodi Matematici Reti di Calcolatori prof. F. Martignon 2 - Canali e Multiplazione 1

Dettagli

L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E

L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E L A B O R A T O R I O D I I N F O R M A T I C A M U S I C A L E MODULO 1: MANIPOLAZI ONE DEL SEGNALE AUDI O G.PRESTI - 17/03/2015 - LE ZI ON E 3 1. RISPOSTA IMPULSIVA E CONVOLUZIONE Una descrizione informale

Dettagli

TRASMISSIONE DATI SU RETE TELEFONICA. 1 Fondamenti Segnali e Trasmissione

TRASMISSIONE DATI SU RETE TELEFONICA. 1 Fondamenti Segnali e Trasmissione TRASMISSIONE DATI SU RETE TELEFONICA Fondamenti Segnali e Trasmissione Trasmissione dati su rete telefonica rete telefonica analogica ISP (Internet Service Provider) connesso alla WWW (World Wide Web)

Dettagli

Corso di Fondamenti di Segnali e Trasmissione - Appello del 07 Settembre 2005

Corso di Fondamenti di Segnali e Trasmissione - Appello del 07 Settembre 2005 Corso di Fondamenti di Segnali e Trasmissione - Appello del 07 Settembre 2005 Gli esercizi devono essere risolti solo sui fogli dei colori indicati Per esiti e soluzioni si veda il sito web del corso:

Dettagli

Strato di Col o l l e l g e a g m a e m n e t n o

Strato di Col o l l e l g e a g m a e m n e t n o Strato di Collegamento Romeo Giuliano romeo.giuliano@uniroma2.it 1 Argomenti Principi di funzionamento dello strato di collegamento Rivelazione e correzione degli errori Protocolli data link elementari

Dettagli

Atlantis Land Technical Resources Product: A02-RAV211 Subject: TECNOLOGIA VoIP Language: Italiano

Atlantis Land Technical Resources Product: A02-RAV211 Subject: TECNOLOGIA VoIP Language: Italiano Atlantis Land Technical Resources Product: A02-RAV211 Subject: TECNOLOGIA VoIP Language: Italiano TECNOLOGIA VoIP INTRODUZIONE In questo documento verranno trattati i caratteri principali della tecnologia

Dettagli

Sintesi di Reti Sequenziali Sincrone

Sintesi di Reti Sequenziali Sincrone LABORATORIO DI ARCHITETTURA DEI CALCOLATORI lezione n 9 Prof. Rosario Cerbone rosario.cerbone@uniparthenope.it a.a. 2007-2008 http://digilander.libero.it/rosario.cerbone Sintesi di Reti Sequenziali Sincrone

Dettagli

Tesina esame Programmazione di Sistemi Mobile realizzata da Roberto Giuliani matricola 633688. Sockets e DatagramSocket

Tesina esame Programmazione di Sistemi Mobile realizzata da Roberto Giuliani matricola 633688. Sockets e DatagramSocket Tesina esame Programmazione di Sistemi Mobile realizzata da Roberto Giuliani matricola 633688 Sockets e DatagramSocket Windows Phone prevede un interfaccia di programmazione per garantire agli sviluppatori

Dettagli

Realizzazione di un commutatore ultraveloce di flussi dati ottici basato su effetti non lineari in fibra. Claudia Cantini

Realizzazione di un commutatore ultraveloce di flussi dati ottici basato su effetti non lineari in fibra. Claudia Cantini Realizzazione di un commutatore ultraveloce di flussi dati ottici basato su effetti non lineari in fibra Claudia Cantini 20 Luglio 2004 Ai miei genitori Prefazione La nostra vita di ogni giorno é sempre

Dettagli

ARCHITETTURA DI RETE FOLEGNANI ANDREA

ARCHITETTURA DI RETE FOLEGNANI ANDREA ARCHITETTURA DI RETE FOLEGNANI ANDREA INTRODUZIONE È denominata Architettura di rete un insieme di livelli e protocolli. Le reti sono organizzate gerarchicamente in livelli, ciascuno dei quali interagisce

Dettagli

DISCRETIZZAZIONE DI UN SEGNALE ANALOGICO:

DISCRETIZZAZIONE DI UN SEGNALE ANALOGICO: DISCRETIZZAZIONE DI UN SEGNALE ANALOGICO: nel processo di digitalizzazione che permette di convertire un segnale analogico in modo da poterlo elaborare con dispositivi numerici di calcolo, si operano due

Dettagli

Polarizzazione, dispersione dei modi di polarizzazione e sua compensazione

Polarizzazione, dispersione dei modi di polarizzazione e sua compensazione UNIVERSITA DEGLI STUDI DI TRIESTE Corso di Laurea Triennale in Ingegneria Elettronica Polarizzazione, dispersione dei modi di polarizzazione e sua compensazione Laureando: Danijel Miletic 28/11/2008 1

Dettagli

Reti basate sulla stack di protocolli TCP/IP

Reti basate sulla stack di protocolli TCP/IP Reti basate sulla stack di protocolli TCP/IP Classe V sez. E ITC Pacioli Catanzaro lido 1 Stack TCP/IP Modello TCP/IP e modello OSI Il livello internet corrisponde al livello rete del modello OSI, il suo

Dettagli

Sistemi Web per il turismo - lezione 2 -

Sistemi Web per il turismo - lezione 2 - Sistemi Web per il turismo - lezione 2 - 8 Considerare il computer coma una calcolatrice sembra un po limitativo rispetto a quello che solitamente vediamo succedere sui computer intorno a noi come ad esempio

Dettagli

Tecniche per la garanzia di qualità in reti di telecomunicazioni multiservizi. Token Bucket Dimensioning for Aggregated VoIP Sources

Tecniche per la garanzia di qualità in reti di telecomunicazioni multiservizi. Token Bucket Dimensioning for Aggregated VoIP Sources Programmi di ricerca di rilevante interesse nazionale Tecniche per la garanzia di qualità in reti di telecomunicazioni multiservizi Courmayeur 12-14 Gennaio 2000 Sottotema Sorgenti Token Bucket Dimensioning

Dettagli

Indica la velocità con cui una sorgente numerica emette i bit Per un canale di comunicazione i ne precisa la capacità trasmissiva Si misura in bit/s

Indica la velocità con cui una sorgente numerica emette i bit Per un canale di comunicazione i ne precisa la capacità trasmissiva Si misura in bit/s Precisiamo i innanzitutto it tt DUE NOZIONI 1. Banda a livello 1 2. Bit rate (frequenza di cifra) BANDA (LIVELLO FISICO) È riferita al dominio delle frequenze Si misura in Hz Banda di un segnale Banda

Dettagli

Ausili per disabilità sensoriali

Ausili per disabilità sensoriali Ausili per disabilità sensoriali Sommario 1. Introduzione 2. Ausili informatici 3. Ausili per disabilità visive 4. Ausili per disabilità uditive Studio di Consulenza Stefano Persichino Consulenza, valutazione,

Dettagli