Riconoscimento di cifre manoscritte tramite una rete neurale



Documenti analoghi
Reti neurali applicate al Data mining

Esperienze di Apprendimento Automatico per il corso di Intelligenza Artificiale

Tecniche di Clustering basate sul Machine Learning

POLITECNICO DI BARI RICONOSCIMENTO DI VOLTI MEDIANTE H.M.M. SUPPORTATO DA RETI NEURALI

Software di sistema e software applicativo. I programmi che fanno funzionare il computer e quelli che gli permettono di svolgere attività specifiche

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

Machine Learning -1. Seminari di Sistemi Informatici. F.Sciarrone-Università Roma Tre

Milano 25 marzo Rossana Mazzuferi

Corso di Informatica

INGEGNERIA DEL SOFTWARE

Dispensa di Informatica I.1

Gestione Documentale. Soluzioni integrate per Banche e Finanziarie

Backpropagation in MATLAB

RICONOSCIMENTO DI TARGHE AUTOMOBILISTICHE

Manuale di Aggiornamento BOLLETTINO. Rel H4. DATALOG Soluzioni Integrate a 32 Bit

Che cosa è un VIRUS?

TIMESHARK: Uno strumento per la visualizzazione e l analisi delle supertimelines. Relatore: Federico Grattirio

ACO Archiviazione Elettronica e Conservazione sostitutiva

IL COMPONENTE DATA MINING MODEL DEL PROGETTO

Configuration Management

Corso di Informatica

Presentazione integrazione AdHoc e KarthaDoc

1) Una periferica di input è: A) il mouse B) il monitor C) la stampante

ISTITUTO NAZIONALE DI FISICA NUCLEARE

ANNO SCOLASTICO

Analisi del Rischio Rapina

DOCUMENT MANAGEMENT SYSTEM E VISTE UTILIZZO DEL DMS E DELLE VISTE IN AZIENDA

Ref. Prof.ri TIC e Informatica e Laboratorio A PRESENTAZIONE

Realizzazione di una chat su protocollo HTTP

Tecniche di riconoscimento statistico

Fondamenti di Informatica. Docenti: Prof. Luisa Gargano Prof. Adele Rescigno BENVENUTI!

Appunti del corso di Informatica 1 (IN110 Fondamenti) 4 Linguaggi di programmazione

Indice. Introduzione...6. Capitolo 1: Realtà virtuale e computer vision..10. Capitolo 2: Riconoscimento facciale..34

La codifica delle informazioni

Sistemi informativi secondo prospettive combinate

Esempio di prova di laboratorio

Implementazione di MVC. Gabriele Pellegrinetti

TERM TALK. software per la raccolta dati

Linguaggi e Paradigmi di Programmazione

Corso di Informatica

Codici a barre. Marco Dell Oro. January 4, 2014

Un sistema di Vision Inspection basato su reti neurali

Concetti fondamentali della Tecnologia Dell informazione Parte prima

Teleassistenza mediante PCHelpware

Il sistema informatico di trasmissione e analisi dei dati

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

Informatica per la Comunicazione/ Verdicchio/ 09/07/2015/ Domande / VERSIONE 1 Matricola Cognome Nome

Studio e implementazione di un OCR per auto-tele-lettura dei contatori di gas e acqua

Anno Scolastico: 2014/2015. Indirizzo: Sistemi informativi aziendali. Classe: terza. Disciplina: Informatica. prof. Silvia Tondo

ITI M. FARADAY Programmazione modulare a.s

Maria Aliberti, Sophia Danesino, Aurora Martina, Clotilde Moro, Mario Scovazzi e altri presentano la loro esperienza di DOCENTI COLLABORATIVI

All interno del computer si possono individuare 5 componenti principali: SCHEDA MADRE. MICROPROCESSORE che contiene la CPU MEMORIA RAM MEMORIA ROM

Richiami di informatica e programmazione

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Descrizione generale del sistema SGRI

Alberto Belussi, Mauro Negri e Giuseppe Pelagatti. Politecnico di Milano spatialdbgroup@polimi.it

MetaMAG METAMAG 1 IL PRODOTTO

Introduzione agli Abstract Data Type (ADT)

introduzione I MICROCONTROLLORI

Software Gestionale E.R.P per la PMI

Estrarre dati in formato Excel da stampe AS/400 con Validoc EXTRACT-CSV

Soluzioni informatiche per l'innovazione aziendale. SineKartaMFP. Caratteristiche e funzionalità

Istituto Tecnico Commerciale Indirizzo AFM articolazione SIA PERCHE???

Indice Prefazione Capitolo 1 Tecnologie dell informazione e della comunicazione e sistemi informativi 1.1 Informatica e ICT

Informatica. Scopo della lezione

Istruzioni per l installazione del software per gli esami ICoNExam (Aggiornate al 15/01/2014)

Introduzione alle tecnologie informatiche. Strumenti mentali per il futuro

Grounding transfer di simboli con reti neurali

INFORMATICA, IT e ICT

HELPDESK/TICKETING MANUALE UTENTE

Architetture Applicative

Archiviazione e gestione documenti per studi commercialisti

ISTRUZIONI PER L INVIO TRAMITE PEC (POSTA ELETTRONICA CERTIFICATA) DI ISTANZE, COMUNICAZIONI E DOCUMENTI

Piano Nazionale di Formazione degli Insegnanti sulle Tecnologie dell'informazione e della Comunicazione. Percorso Formativo C1.

MySQL Server e Netbeans

6.2 Modelli per il monossido di carbonio

Data mining: classificazione DataBase and Data Mining Group of Politecnico di Torino

Regressione non lineare con un modello neurale feedforward

Lezioni di Laboratorio sui Data Base

PRINCIPALI NOVITA DELLA VERSIONE 2015

Quantum GIS per la pianificazione urbanistica

Università di Bergamo Facoltà di Ingegneria. Intelligenza Artificiale. Paolo Salvaneschi A1_1 V1.1. Introduzione

Le immagini digitali. Le immagini digitali. Caterina Balletti. Caterina Balletti. Immagini grafiche. Trattamento di immagini digitali.

Guida all installazione di Easy

MODULO STAMPA BOLLETTINO PDF

PowerDIP Software gestione presenze del personale aziendale. - Guida rapida all inserimento dei nominativi e delle timbrature -

RAPPRESENTAZIONE GRAFICA DEGLI ALGORITMI

Utilizzo dei Cookie Cosa sono i cookie? A cosa servono i cookie? cookie tecnici cookie, detti analitici cookie di profilazione

CLAUDIO CAPRARA RICCARDO ROMAGNOLI. Collaboratori, utenti, rivenditori, assistenti. Elenco delle versioni Versione draft TeamSystem 04/03/2014

Learning from Starlight Progettare per comprendere: Mobile learning e tecnologie wireless per insegnare l Astrofisica nelle Scuole

Transcript:

Riconoscimento di cifre manoscritte tramite una rete neurale 3 luglio 2008

Argomenti discussi 1 Il problema 2 Il training set Codifica dei file 3 Soluzione implementata Soluzione ideale Soluzione implementata tramite le FANN Test sull apprendimento 4 Consuntivo ore 5 Bibliografia

Il problema Il problema

Il problema Molte applicazioni pratiche. Alcuni esempi: Sistemi di smistamento automatico della posta cartacea, basato sul riconoscimento del CAP scritto nelle buste delle lettere Inserimento automatico degli importi delle tasse letti dai bollettini Riconoscimento automatico degli input per computer palmari

Il training set Il training set

Il training set Per la fase di training si è usato The MNIST database of handwritten digits : 60 000 esempi di trainig 10 000 esempi per il validation set Figura: Esempio di dati estratti dal database MNIST.

Codifica dei file Codifica dei file Struttura degli esempi: 1 Immagini originali, del NIST, in bianco e nero 2 Normalizzate a 20 20 pixel, in scala di grigi (per l antialiasing) 3 Centrate nel centro di massa dei pixel in un area di 28 28

Codifica dei file Codifica dei file Struttura degli esempi: 1 Immagini originali, del NIST, in bianco e nero 2 Normalizzate a 20 20 pixel, in scala di grigi (per l antialiasing) 3 Centrate nel centro di massa dei pixel in un area di 28 28 Trainig set formato da due file: 1 File con tutte le immagini (codificate come dump dei dati) 2 File con i valori attesi per ciascuna immagine

Soluzioni implementate Soluzioni implementate

Soluzione ideale Soluzione ideale [Russel03] suggerisce una rete neurale con 28 28 = 748 neuroni in input, 300 nascosti e 10 di output.

Soluzione ideale Soluzione ideale [Russel03] suggerisce una rete neurale con 28 28 = 748 neuroni in input, 300 nascosti e 10 di output. Uno schema per la rete è: Figura: Struttura della rete implementata.

Soluzione implementata tramite le FANN Le librerie FANN Software free ed open source per lo sviluppo di reti neurali multilayer. Scritte in C ma con porting in molti linguaggi, fra i quali: PHP, C++,.NET, Ada, Python, Delphi, Octave, Ruby, Prolog Pure Data e Mathematica.

Soluzione implementata tramite le FANN Le librerie FANN Software free ed open source per lo sviluppo di reti neurali multilayer. Scritte in C ma con porting in molti linguaggi, fra i quali: PHP, C++,.NET, Ada, Python, Delphi, Octave, Ruby, Prolog Pure Data e Mathematica. Algoritmi di apprendimento implementati: 1 Backpropagation incrementale 2 Backpropagation batch 3 RPROP 4 Quickprop

Soluzione implementata tramite le FANN Le librerie FANN Software free ed open source per lo sviluppo di reti neurali multilayer. Scritte in C ma con porting in molti linguaggi, fra i quali: PHP, C++,.NET, Ada, Python, Delphi, Octave, Ruby, Prolog Pure Data e Mathematica. Algoritmi di apprendimento implementati: 1 Backpropagation incrementale usato 2 Backpropagation batch usato 3 RPROP 4 Quickprop usato

Soluzione implementata tramite le FANN Programmi che costituiscono il progetto Il progetto è costituito da 5 programmi differenti:

Soluzione implementata tramite le FANN Programmi che costituiscono il progetto Il progetto è costituito da 5 programmi differenti: convert converte le immagini e le etichette in un formato accettabili per la libreria FANN train avvia la sessione di apprendimento per la rete test esegue dei test con degli esempi presi dal validation set bulk-test esege molti test, pescando esempi in maniera casuale dal validation set own-test prende come parametro della linea di comando il nome di un file immagine, che considererà come un esempio da sottoporre alla rete

Test sull apprendimento Dati per l apprendimento Parametri usati per l apprendimento

Test sull apprendimento Dati per l apprendimento Parametri usati per l apprendimento Training set con 30 000 esempi

Test sull apprendimento Dati per l apprendimento Parametri usati per l apprendimento Training set con 30 000 esempi Massimo di 200 epoche di apprendimento

Test sull apprendimento Dati per l apprendimento Parametri usati per l apprendimento Training set con 30 000 esempi Massimo di 200 epoche di apprendimento Test su vari algoritmi: Backpropagation batch Backpropagation incrementale Quickprop Quickprop + Backpropagation batch

Test sull apprendimento Risultati dell apprendimento Algoritmo Tempo MSE Class. Backpropagation batch 1h 5m 0.01315 84% Backpropagation incrementale 17h 0.04699 71% Quickprop 1h 20m 0.01094 88% Algoritmi misti 1h 20m 0.01300 92%

Test sull apprendimento Andamento apprendimento con Backpropagation batch

Test sull apprendimento Andamento apprendimento con Backpropagation incr.

Test sull apprendimento Andamento apprendimento con Quickprop

Test sull apprendimento Andamento apprendimento con algoritmi misti

Test sull apprendimento Esempio pratico... I programmi in azione Esempio pratico...

Consuntivo delle ore impiegate Consuntivo delle ore impiegate

Consuntivo ore lavorate In totale sono state impiegate circa 33 ore, così suddivise: 4 ore per studio problema 10 ore per sperimentazione di alcuni prodotti 10 ore per studio ed implementazione codice tramite FANN 5 ore per collaudo codice, con varie configurazioni 4 ore per redazione documento relazione e presentazione

Bibliografia Bibliografia

Bibliografia Russel03 Stuart Russell, Peter Norvig. Artificial Intelligence: A Modern Approach (second edition). Prentice Hall, 2003 Fann Fast Artificial Neural Network Library (FANN). http://leenissen.dk/fann/ Fahlman88 Scott E. Fahlman. Faster-learning variations on back-propagation: An empirical study. In T. J. Sejnowski G. E. Hinton and D. S. Touretzky, editors, 1988 Connectionist Models Summer School, San Mateo, CA, 1988. Morgan Kaufmann. Mitchell97 Thomas Mitchell. Machine learning. McGraw-Hill Education, 1997 LeCun Yann LeCun, Corinna Cortes. THE MNIST DATABASE of handwritten digits. http://yann.lecun.com/exdb/mnist/