Tecnologie del parlato



Documenti analoghi
Laboratorio: Tecnologie assistive per disabili motori

MODULO 01. Come è fatto un computer

CRITERI DI VALUTAZIONE SCUOLA PRIMARIA SCUOLA PRIMARIA

Cos è il Software Didattico

exe Learning Costruire e modificare oggetti e materiali per l apprendimento

Laboratorio di Pedagogia Sperimentale. Indice

Dislessia e mappe semantiche

Il calcolatore - Applicazioni

DRAGON DICTATE PER MAC 3 MATRICE DELLE FUNZIONI CONFRONTO PER PRODOTTO

Dai 3 anni Bene In parte No Comprende semplici consegne e risponde utilizzando prevalentemente codici extralinguistici

LINGUA COMUNITARIA INGLESE SCUOLA SECONDARIA CLASSE PRIMA

CURRICOLO DISCIPLINARE DI ITALIANO ASCOLTO E PARLATO. Traguardi per lo sviluppo delle competenze. Obiettivi di apprendimento( conoscenze e

Corso di Informatica

Come costruire una presentazione. PowerPoint 1. ! PowerPoint permette la realizzazione di presentazioni video ipertestuali, animate e multimediali

PIANO BIENNALE PER I DIRITTI DELLE PERSONE CON DISABILITÀ

Sintesi della Lingua Italiana dei Segni mediante l utilizzo del Motion Capture e dei metodi procedurali

Lezione 8. La macchina universale

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Sviluppo del linguaggio. Le fasi dello sviluppo del linguaggio

Innovazione e accessibilità: applicazioni vocali e mobile accessibility. Presentazione del software Active Reader

Appunti di Sistemi Elettronici

02 L Informatica oggi. Dott.ssa Ramona Congiu

LA COMUNICAZIONE NON VERBALE DEI DISABILI

Introduzione all analisi dei segnali digitali.

Università degli Studi di Foggia Dipartimento Sistemi Informativi ed Innovazione Tecnologica. Presentazione Portale Vocale Rete di Accesso Wi-Fi

Formazione in rete e apprendimento collaborativo

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Istituto Comprensivo Statale Don Lorenzo Milani Ferrara Curricolo 2014/2015 Infanzia-Primaria-Secondaria di I grado COMPETENZE DIGITALI

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

GUIDA ALL USO 4 STAR PRESENTA LA RUBRICA VOCALE UN SOLO NUMERO PER CHIAMARE CHI VUOI.

La comunicazione e il linguaggio

ShellExcel. Una domanda contiene i riferimenti (#A, #B, #C) alle celle che contengono i dati numerici del

Linguaggi e Paradigmi di Programmazione

COME COMPORTARSI E RAPPORTARSI CON ALLIEVI E GIOCATORI DURANTE LE LEZIONI E GLI ALLENAMENTI.

Guida alla terapia con Gloreha

PROGETTAZIONE FORMATIVA ANNUALE. Tavola di sintesi delle unità di apprendimento da svolgere nel corrente a.s. 2015/16 PROGETTAZIONE ANNUALE DIDATTICA

Excel. A cura di Luigi Labonia. luigi.lab@libero.it


Traguardi per lo sviluppo delle competenze

Correttezza. Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1. Dispensa 10. A. Miola Novembre 2007

GUIDA ALL UTILIZZO DEL SOFTWARE PER SDA. ACCESSO ALLA PIATTAFORMA: WEB-VISUM: semplificazione siti web NVDA: Non Visual Desktop Access

IL CURRICOLO PER IL PRIMO CICLO D ISTRUZIONE SCUOLA PRIMARIA E

COMUNICAZIONE NELLE LINGUE STRANIERE

Stampa dei fermi immagine con una stampante PictBridge

Digital Signal Processing: Introduzione

Scuola Primaria INGLESE OBIETTIVI DI APPRENDIMENTO CLASSE I CLASSE II CLASSE III CLASSE IV CLASSE V

Ricezione orale (ascolto) Ricezione scritta (lettura) ISTITUTO COMPRENSIVO DI CASALBUTTANO - SCUOLA SECONDARIA DI PRIMO GRADO

COS È UN LINGUAGGIO? LINGUAGGI DI ALTO LIVELLO LA NOZIONE DI LINGUAGGIO LINGUAGGIO & PROGRAMMA

INGLESE COMUNICAZIONE NELLE LINGUE STRANIERE. b. Utilizza la lingua inglese nell uso delle tecnologie dell informazione e della comunicazione

Introduzione alla Programmazione

L'esercizio illustrato è da catalogare tra i molti sussidi necessari per dare al bambino salde basi nella conoscenza delle forme grafiche che ogni

TECNOLOGIE INFORMATICHE DELLA COMUNICAZIONE ORE SETTIMANALI 2 TIPO DI PROVA PER GIUDIZIO SOSPESO PROVA DI LABORATORIO

Modulo 6 Strumenti di presentazione

LINGUA INGLESE SCUOLA PRIMARIA

Il computer: un grande amico!

Quick Reference Giornale di Bordo (e-logbook)

SISTEMI MULTIAGENTE. Esercizio

Interesse, sconto, ratei e risconti

Gestione dei segnali analogici nei sistemi di automazione industriale con PLC.

Descrittori di competenze per Francese e Inglese nella scuola secondaria di I grado

InfiXor. il programma facile e versatile per preventivi veloci e completi. il software di preventivazione per produttori e rivenditori di infissi

3 GRUPPO: NUOVA ORGANIZZAZIONE DEI SERVIZI DI SEGRETERIA CHE TENGA CONTO DELLE ESIGENZE DI VALUTAZIONE

Anno scolastico PROGETTO

Modulo 3 - Elaborazione Testi 3.5 Stampa unione

FONETICA: LA PRODUZIONE DEI SUONI

Scheda descrittiva del Laboratorio Didattico

LINGUA INGLESE E SECONDA LINGUA COMUNITARIA

Informatica per la comunicazione" - lezione 7 -

CURSOS AVE CON TUTOR

Dal Profilo dello studente a I discorsi e le parole Inglese e seconda lingua Comunitaria

ISTITUTO COMPRENSIVO SAN VENANZO - TR SCUOLA PRIMARIA INGLESE OBIETTIVI DI APPRENDIMENTO CLASSE I CLASSE II CLASSE III CLASSE IV CLASSE V

Dispositivi di Input. Sono tanti i più comuni sono: Tastiera: Fax Mouse Scanner Strumenti di riconoscimento vocale

IRIFOR BRINDISI LA SCUOLA NELLA TIFLOLOGIA

Modulo informatica di base 1 Linea 2

PRIMA LINGUA COMUNITARIA: INGLESE TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA

Guida alla registrazione on-line di un DataLogger

GUIDA ALL UTILIZZO DEL PORTALE DELLA RETE DEI COMUNI OGLIO PO

Progetto Insegnare ad imparare le strategie metacognitive nei DSA UST Belluno / Associazione Soroptimist

Elementi di informatica

GLI STRUMENTI COMPENSATIVI

Introduzione. Informatica B. Daniele Loiacono

SE LA PIANTIAMO DI FAR A INIZIARE LA LEZIONE

Informatica 1 Lezione 1

PROGETTO PER LA TRASMISSIONE DOCUMENTI RELATIVI ALL APPROVAZIONE DELLE MANIFESTAZIONI IN FORMA DIGITALE

I.Ri.Fo.R. Regionale Toscano Onlus. Analisi dei fabbisogni per la formazione di Trascrittori testi in braille, ingranditi ed elettronici

Dall Archivio al Polo tecnologico dell audiovisivo didattico e documentale per l Alto Lazio

CURRICOLO di ITALIANO classe terza

Giochi nel mondo. Laboratorio di intercultura

GLI ARCHIVI DI DATI. File Un File è una sequenza di informazioni che costituisce una unità logica. Un file è un un contenitore di di informazioni

Unità didattica 2: Ausili specifici per la comunicazione

Risolvere un problema significa individuare un procedimento che permetta di arrivare al risultato partendo dai dati

Prof. Giuseppe Chiumeo. Avete già studiato che qualsiasi algoritmo appropriato può essere scritto utilizzando soltanto tre strutture di base:

TECNOLOGIA - SCUOLA PRIMARIA

DRAMMATURGIA DELLA TELEVISIONE I Seminario

Il Programma... 3 I moduli... 3 Installazione... 3 La finestra di Login... 4 La suite dei programmi... 6 Pannello voci... 10

Realizzazione siti web. I suoni

G iochi con le carte 1

SOFTWARE PER LA RILEVAZIONE DEI TEMPI PER CENTRI DI COSTO

Multimedialità e digitalizzazione

SCUOLA DELL INFANZIA, PRIMARIA E SECONDARIA DI 1 GRADO

Transcript:

Tecnologie del parlato La sintesi del parlato Il riconoscimento del parlato 1 La sintesi del parlato (speech synthesis) Text-to-Speech (TTS) programmi in grado di produrre e pronunziare frasi allo scopo di far interagire linguisticamente in modo naturale la macchina con l uomo a metà degli anni 80, l uso dei segnali digitali che per natura sono più adattabili alla manipolabilità e meglio gestibili dei segnali analogici. 2 1

Modelli TTS 1) modello articolatorio, secondo cui si procede a una simulazione dell apparato fonoarticolatorio umano; 2) modello acustico, secondo cui si cerca di produrre un segnale che riproduca alcuni degli aspetti più rilevanti dell onda sonora (periodicità, forma dello spettro, transizioni delle formanti); 3) modello concatenativo, secondo cui si tenta di combinare porzioni di segnale di parlato umano in maniera da produrre un effetto quanto più naturale e spontaneo. 3 TTS è un applicazione che riceve in input un testo in forma elettronica, lo elabora e in output produce un onda sonora parlata corrispondente al testo inserito. Le odierne applicazioni TTS presentano solitamente un modello seriale, in cui vi sono una serie di livelli di trattamento dell informazione linguistica che sono successivamente sottoposti a diverse fasi di lavorazione (cfr. Dutoit e Stylianou, 2003: 323-338) 4 2

5 fasi 1. pre-trattamento, 2. analisi morfo-sintattica, 3. fonetizzazione, 4. generazione prosodica e 5. sintesi del segnale 5 6 3

Gli usi della sintesi del parlato sviluppo di sistemi di dialogo uomo-macchina (soprattutto nelle telecomunicazioni, ad esempio per richiedere e ricevere servizi di informazioni al telefono, ma anche su uno schermo interattivo parlante). utenti disabili che possono produrre parlato usando una tastiera o un mouse, o ottenere versioni parlate di testi scritti nel caso di utenti non vedenti. L astrofisico Stephen Hawking, colpito da sclerosi laterale amiotrofica, tiene regolarmente lezioni e seminari usando un sintetizzatore vocale che riesce a migliorare sensibilmente le sue interazioni comunicative rendendo possibili attività che altrimenti sarebbero notevolmente limitate educazione linguistica per la predisposizione di strumenti per l apprendimento di una seconda lingua e altre applicazioni sono già presenti in giochi, videogiochi, e nell elaborazione di audio-libri. 7 Il parlato multimodale Il parlato è sempre accompagnato da differenti espressioni del viso, da manifestazioni di emozione nella voce, da movimenti della bocca dei quali ci serviamo per aiutarci a comprendere anche la catena sonora che viene prodotta. teste parlanti animazioni in tre dimensioni 8 4

Holger 9 Il riconoscimento del parlato (speech recognition) applicazioni in grado di identificare le sequenze linguistiche del parlato spontaneo, convertirle in testo elettronico e permettere l interazione con programmi e servizi usando la voce. Tre sono le principali funzioni per le quali il riconoscimento del parlato viene utilizzato: 1) la dettatura di testi, 2) il comando vocale; 3) i sistemi di dialogo uomo-macchina. 10 5

4 fasi input (inserimento del materiale parlato nel sistema), una fase di addestramento (in cui il sistema è sottoposto all esposizione a materiale vocale controllato prodotto dall individuo che sarà il principale utente del sistema), una fase di riconoscimento effettivo (in cui il sistema è sottoposto a input nuovo ed elabora una o più ipotesi di riconoscimento) e l output (costituito dal testo scritto in formato elettronico). L input viene trattato in molti modi diversi. 11 Modello SR INPUT Onda sonora parlata I FASE Addestramento II FASE Riconoscimento OUTPUT testo Elaborazione del segnale Modellizzazione acustica Modellizzazione linguistica 12 6

Problemi per il SR 1) l estrema variabilità individuale delle caratteristiche vocali (legate al genere, alle caratteristiche dell apparato fono-articolatorio, ma anche e soprattutto alle peculiarità di pronunzia del singolo parlante); 2) i fattori di ipoarticolazione tipici del parlato spontaneo (ellissi, esitazioni, caduta di foni e sillabe, coarticolazione, pause piene ecc.); 3) la gestione di diverse tipologie testuali. 13 Gli errori Il tasso di errore oggi risulta, per la lingua inglese, pari a 0,3% per la dettatura di numeri (al telefono per esempio), tra 3-8% circa per il parlato letto (dettato) e spontaneo, molto più alto per la trascrizione di trasmissioni radio o televisive e soprattutto per il parlato dialogico in condizioni spontanee (più del 20-30%). 14 7

Applicazioni 1) telecomunicazioni 2) navigazione vocale online e offline evitando l uso del mouse e della tastiera (utile soprattutto con i cellulari, si pensi al voice-dial, e con dispositivi portatili oltre che nei casi di disabilità); 3) inserimento vocale di dati 4) dettatura ed editing di testi; 5) una varietà di strumenti di scrittura per disabili; 6) lo sviluppo di giochi e videogiochi; 7) in glottodidattica per le applicazioni di apprendimento e verifica. 15 Frontiere del riconoscimento vocale Sistemi multiutente senza addestramento (indipendenti dal parlante); Sistemi multilingue che permettano la dettatura di testi in cui siano presenti lingue diverse; Una maggiore accuratezza nella trascrizione del parlato spontaneo. 16 8