Tecniche di riconoscimento statistico



Похожие документы
Pro e contro delle RNA

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

A intervalli regolari ogni router manda la sua tabella a tutti i vicini, e riceve quelle dei vicini.

SVM. Veronica Piccialli. Roma 11 gennaio Università degli Studi di Roma Tor Vergata 1 / 14

Le reti neurali artificiali. Giacomo Trudu aka Wicker25

Nozione di algoritmo. Gabriella Trucco

Tecniche di riconoscimento statistico

GESTIONE DELLE TECNOLOGIE AMBIENTALI PER SCARICHI INDUSTRIALI ED EMISSIONI NOCIVE LEZIONE 10. Angelo Bonomi

Regressione non lineare con un modello neurale feedforward

Capitolo 4: Ottimizzazione non lineare non vincolata parte II. E. Amaldi DEIB, Politecnico di Milano

MAPPE DI KARNAUGH. Nei capitoli precedenti si è visto che è possibile associare un circuito elettronico o elettrico ad una funzione logica.

MATLAB. Caratteristiche. Dati. Esempio di programma MATLAB. a = [1 2 3; 4 5 6; 7 8 9]; b = [1 2 3] ; c = a*b; c

Automazione Industriale (scheduling+mms) scheduling+mms.

Reti sequenziali. Esempio di rete sequenziale: distributore automatico.

Macchine a stati finiti G. MARSELLA UNIVERSITÀ DEL SALENTO

PREMESSA AUTOMAZIONE E FLESSIBILITA'

Ottimizzazione Multi Obiettivo

La Metodologia adottata nel Corso

Più processori uguale più velocità?

A.A. 2015/2016. Statistica Medica. Corso di. CdL in Fisioterapia CdL in Podologia

METODOLOGIA DI PREVISIONE DELLA DOMANDA ELETTRICA E DELLA

ALGEBRA DELLE PROPOSIZIONI

Reti neurali e loro applicazioni

Alla ricerca dell algoritmo. Scoprire e formalizzare algoritmi.

- la possibilità di monitorare lo stato attuale della macchina - fornire una reportistica sulla base di alcune variabili

Parte I. Prima Parte

SPC e distribuzione normale con Access

Reti sequenziali sincrone

I Problemi e la loro Soluzione. Il Concetto Intuitivo di Calcolatore. Risoluzione di un Problema. Esempio

Il sistema di rilevazione dati per il controllo globale delle macchine di produzione

Cap. 4 Ricostruzione delle tracce con reti neurali

Innovazione continua nella elaborazione di dati telerilevati per la gestione del territorio

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Corso di Informatica

Analisi del Rischio Rapina

Linguaggi di programmazione

CONVERTITORI DIGITALE/ANALOGICO (DAC)

I casi d uso corrispondono ai compiti che l attore (che può essere una persona fisica e non) può svolgere.

POLITECNICO DI TORINO

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

VC-dimension: Esempio

Ricerca di outlier. Ricerca di Anomalie/Outlier

Perché si fanno previsioni?

Corso di DISPOSITIVI E SISTEMI PER LE COMUNICAZIONI IN FIBRA OTTICA

La somma. Esempio: Il prodotto. Esempio:

Che cosa è un VIRUS?

Reti neurali artificiali e analisi dei dati per la ricerca sociale: un nuovo paradigma?

connessioni tra i singoli elementi Hanno caratteristiche diverse e sono presentati con modalità diverse Tali relazioni vengono rappresentate QUINDI

Con il termine Sistema operativo si fa riferimento all insieme dei moduli software di un sistema di elaborazione dati dedicati alla sua gestione.

Artificial Neural Network(ANN)

ISO 9000:2000 Assicurazione della qualità Parte della gestione per la qualità mirata a dare fiducia che i requisiti per la qualità saranno

I sistemi di controllo possono essere distinti in due categorie: sistemi ad anello aperto e sistemi ad anello chiuso:

Macchine a stati finiti. Sommario. Sommario. M. Favalli. 5th June 2007

Liceo Tecnologico. Indirizzo Elettrico Elettronico. Indicazioni nazionali per Piani di Studi Personalizzati

Corso di Informatica

Indice. Introduzione...6. Capitolo 1: Realtà virtuale e computer vision..10. Capitolo 2: Riconoscimento facciale..34

Computational Game Theory

mobile working application

Circuiti sequenziali e elementi di memoria

Macchine a stati finiti. Sommario. Sommario. M. Favalli. Le macchine a stati si utilizzano per modellare di sistemi fisici caratterizzabili mediante:

fit-up), cioè ai problemi che si verificano all atto dell assemblaggio quando non si riescono a montare i diversi componenti del prodotto o quando il

INFORMATICA. Automa TRATTAMENTO AUTOMATICO DELLE INFORMAZIONI

Ventilazione del locale di carica carrelli elevatori

DFD DISPENSA DEL CORSO DI SISTEMI INFORMATIVI UNIVERSITÀ DEGLI STUDI DI VERONA FACOLTÀ DI MM.FF.NN LAUREA SPECIALISTICA IN INFORMATICA

La codifica delle immagini

1. BASI DI DATI: GENERALITÀ

come nasce una ricerca

Breve introduzione al Calcolo Evoluzionistico

Autorità Nazionale Anticorruzione e per la valutazione e la trasparenza delle amministrazioni pubbliche

Architettura hardware

IL SOFTWARE SECONDO LA NORMA UNI EN ISO :2008 (IIA PARTE) 1

La ricerca empirica in educazione

La forza. In movimento Marietti Scuola 2010 De Agostini Scuola S.p.A. Novara

POLIAGE GUIDA RAPIDA

Le parole dell informatica: modello di calcolo, complessità e trattabilità

La propagazione delle onde luminose può essere studiata per mezzo delle equazioni di Maxwell. Tuttavia, nella maggior parte dei casi è possibile

Calcolatori: Algebra Booleana e Reti Logiche

Reti LAN. IZ3MEZ Francesco Canova

1. Distribuzioni campionarie

3DEverywhere S.r.l. sito web:

Le strumentazioni laser scanning oriented per i processi di censimento anagrafico dei patrimoni

IL PROCESSO DI BUDGETING. Dott. Claudio Orsini Studio Cauli, Marmocchi, Orsini & Associati Bologna

Progetto GRIIN Gestione Remota di Illuminazione in edifici INdustriali pubblici - commerciali

PLC Sistemi a Logica Programmabile Il linguaggi di programmazione

I principi di Anffas Onlus sul tema della presa in carico precoce Michele Imperiali comitato tecnico anffas onlus

IL MARKETING E QUELLA FUNZIONE D IMPRESA CHE:

AdmiRail. Future of Humane Machine Interface. Piattaforma IT a supporto della gestione operativa per l ottimizzazione della circolazione ferroviaria

Транскрипт:

On AIR s.r.l. Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 4 Reti neurali per la classificazione Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr A.A. 2014-2015

Origine delle reti neurali Le reti neurali (artificiali) nascono come uno dei campi della intelligenza artificiale (IA) Obiettivo IA: replicare per mezzo di macchine (hw+sw) le attività mentali umane Tesi IA forte: l attività mentale consiste nella esecuzione di qualche sequenza ben definita di operazioni di manipolazione di simboli (algoritmo) La complessità del cervello umano come computer appare ancora aggi irraggiungibile!

Il neurone biologico Un neurone è composto da tre parti: coro (soma), dendriti ed assone La comunicazione avviene tramite segnali emessi dall assone e ricevuti dalle dendriti di altri neuroni tramite interfacce (sinapsi)

Attivazione del neurone Il corpo del neurone integra le migliaia di segnali elettrici microscopici provenienti dalle dendriti Se l integrazione produce una effetto globale superiore ad una soglia di attivazione, un impulso elettrico viene propagato lungo l assone L impulso viene ricevuto da un altro neurone, che può quindi modificare il suo stato e così via a cascata

Il neurone artificiale Un semplice modello di neurone artificiale emula questa funzionalità di base in termini formali (percettrone di McCulloch-Pitts, 1943) Ingressi ed uscita sono variabili binarie. La funzione di attivazione a è una c.l. degli ingressi. L uscita è determinata da una soglia θ

Neuroni per la classificazione Un singolo neurone può risolvere problemi di classificazione a 2 classi (se linearmente separabili) Per problemi con più classi si possono combinare più neuroni, ciascuno dei quali risolve un problema binario, con logiche booleane tipo AND/OR

Schema di rete multistrato La generalizzazione dell approccio neuronale alla classificazione prevede la realizzazione di strutture a strati, in cui i neuroni di ogni strato ricevono come dato di ingresso, l uscita dello strato inferiore

Struttura locale Ogni nodo della rete multistrato svolge lo stesso tipo di elaborazione Esso dispone di un certo numero di gradi di libertà w ji (pesi delle connessioni) tramite i quali la rete si può adattare ai vari problemi La relazione tra l attivazione a j e l uscita o j è espressa da una specifica funzione f (in generale non lineare) Il modello è noto come MLP (Multi Layer Perceptron)

Apprendimento L apprendimento comporta un processo di stima dei pesi ottimale per ottenere le uscite desiderate sui campioni del training set L obiettivo è in genere quello di minimizzare una funzione di errore Nei problemi di classificazione sarebbe preferibile minimizzare il numero di errori, ma si preferisce una funzione E differenziabile Per problemi a N classi si usano N neuroni di uscita, con funzione f tale da generare valori in [0,1]. In questo modo E risulta simile all errore di classificazione

Algoritmo di apprendimento Viene usata la tecnica della discesa del gradiente Applicando la regola di concatenazione delle derivate si ha

Algoritmo di apprendimento Combinando i risultati si ottiene la regola di apprendimento finale Essa è valida per i neuroni dell ultimo strato, per i quali è disponibile un valore atteso per la variabile di uscita Per i neuroni interni la situazione è più complicata

Algoritmo di apprendimento La quantità da calcolare è Combinando i termini otteniamo finalmente

Back Propagation Vediamo in sintesi il processo di apprendimento noto come back propagation Si inizializzano i pesi della rete a valori qualunque (es. random) Si presenta in ingresso alla rete un campione del training set Si calcolano le uscite dei neuroni nascosti, che forniscono l ingresso per lo strato di uscita Si calcolano i valori di uscita e si confrontano con i valori attesi Si aggiornano i pesi dello strato di uscita Si aggiornano i pesi dello strato nascosto Si ripete per tutti gli elementi del training set Si verifica una condizione di terminazione e, se non è raggiunta, si ripete ancora ripresentando ancora gli stessi campioni (epoca)

Curva di apprendimento All inizio del training, l errore è ovviamente alto, ma al progredire del processo esso cala fino ad un valore asintotico Questo valore dipende da: Caratteristiche intrinseche del training set Numero di campioni Numero di pesi della rete Inizializzazione utilizzata Parametri dell algoritmo La condizione di terminazione non deve essere troppo stringente, per evitare l overtraining

Criterio di terminazione Per garantire la capacità di generalizzazione, si utilizza una parte del training set come insieme di validazione L insieme di validazione non viene usato per aggiornare i pesi ma il suo errore viene comparato con quello ottenuto sui campioni di training.

Regioni di decisione

Problemi realizzativi L approccio neurale risulta vincente nei problemi in cui esistano poche informazioni modellistiche sulle classi ma molti esempi già classificati La costruzione del classificatore comporta comunque diverse scelte, che possono essere condotte solo per tentativi: Funzioni di attivazione (es. sigmoidi) Topologia della rete (quanti strati, quanti nodi) Condizione di terminazione Operazioni di preprocessing sui dati

Evoluzione: deep learning Rappresenta una evoluzione delle macchine MLP con l obiettivo di catturare in modo più profondo il problema dell apprendimento, includendo anche l estrazione delle features Lo schema più diffuso è la rete convolutiva (CNN)

Evoluzione: deep learning Tutto il PR è stato sviluppato separando l estrazione delle features dalla classificazione Le features vengono selezionate spesso in modo del tutto a-priori, spesso per il loro significato antropico Apprendere le features insieme alla classificazione permette la loro integrazione ottimale Questo complica l apprendimento ma, una volta completato, il sistema finale raggiunge prestazioni eccellenti anche in casi difficili