1 INTRODUZIONE 1.1 Computer Vision e Pattern Recognition



Documenti analoghi
Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Modulo: Scarsità e scelta

TECNICHE DI SIMULAZIONE

Capitolo II. La forma del valore. 7. La duplice forma in cui si presenta la merce: naturale e di valore.

PLIDA Progetto Lingua Italiana Dante Alighieri Certificazione di competenza in lingua italiana

Appunti sulla Macchina di Turing. Macchina di Turing

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Fasi di creazione di un programma

Il garage Informazioni per il PD

PowerSchedo. Un sistema di supporto alla decisione nel settore dell'oil&gas. For further information:

Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste

VALORE DELLE MERCI SEQUESTRATE

Strutturazione logica dei dati: i file

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

03. Il Modello Gestionale per Processi

Nota interpretativa. La definizione delle imprese di dimensione minori ai fini dell applicazione dei principi di revisione internazionali

Sistema di diagnosi CAR TEST

PREMESSA AUTOMAZIONE E FLESSIBILITA'

Il sapere tende oggi a caratterizzarsi non più come un insieme di contenuti ma come un insieme di metodi e di strategie per risolvere problemi.

IL CICLO DI VITA DEL PROGETTO. Elementi essenziali di progetto. Fasi e tappe Gli Approcci

L analisi video Gli algoritmi più diffusi e interessanti

Trieste 28 Febbraio 2011

PROCEDURE - GENERALITA

I motori di ricerca. Che cosa sono. Stefania Marrara Corso di Sistemi Informativi

Sistemi video per il monitoraggio

Le fattispecie di riuso

GfK Group Indagine Efpa GfK Eurisko 15 Ottobre Presentazione della ricerca Efpa Italia - GfK Eurisko Nicola Ronchetti GfK Eurisko

L uso della Balanced Scorecard nel processo di Business Planning

SCIENZE E TECNOLOGIA

Corso di Informatica

Progettaz. e sviluppo Data Base

Procedure di lavoro in ambienti confinati Livello specialistico

risulta (x) = 1 se x < 0.

Rapporto dal Questionari Insegnanti

POLITECNICO DI TORINO

ELABORAZIONE DI DATI TRIDIMENSIONALI - RELAZIONE HOMEWORK 2

RIDURRE I COSTI ENERGETICI!

Corso di. Dott.ssa Donatella Cocca

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

Analisi e diagramma di Pareto

Gestione Iter Manuale Sistemista. Gestione Iter Manuale Sistemista

ARCHITETTURA DI RETE FOLEGNANI ANDREA

Calcolo del Valore Attuale Netto (VAN)

Capitolo 2. Operazione di limite

Il Problem-Based Learning dalla pratica alla teoria

COMUNE DI MARIGLIANO Provincia di Napoli REGOLAMENTO PER L INSTALLAZIONE E LA GESTIONE DEGLI IMPIANTI DI VIDEOSORVEGLIANZA

( x) ( x) 0. Equazioni irrazionali

Dispensa di Informatica I.1

1. BASI DI DATI: GENERALITÀ

Automazione Industriale (scheduling+mms) scheduling+mms.

Corso di formazione Modulo aggiuntivo per Preposti

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE

della manutenzione, includa i requisiti relativi ai sottosistemi strutturali all interno del loro contesto operativo.

MODELLISTICA DI IMPIANTI E SISTEMI 2

Generazione Automatica di Asserzioni da Modelli di Specifica

BASE DI DATI: sicurezza. Informatica febbraio ASA

Report di valutazione studiolegalebraggio.it

Capitolo 2 - Teoria della manutenzione: classificazione ABC e analisi di Pareto

Tecniche di riconoscimento statistico

Contabilità generale e contabilità analitica

Progettazione Logica. Progettazione Logica

LE STRATEGIE DI COPING

BANCHE DATI. Informatica e tutela giuridica

La Videosorveglianza Criteri per il dimensionamento dello storage

Il concetto di valore medio in generale

La valutazione nella didattica per competenze

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Alla ricerca dell algoritmo. Scoprire e formalizzare algoritmi.

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente

PIATTAFORMA DOCUMENTALE CRG

Il Digital Signage. Utilizzi. Il Digital Signage

Effetti sull opinione di pazienti riguardo all utilizzo di un computer in uno studio medico nell assistenza ordinaria

Il servizio di registrazione contabile. che consente di azzerare i tempi di registrazione delle fatture e dei relativi movimenti contabili

Necessità della formazione efficace delle figure professionali nel campo della sicurezza negli ambienti di lavoro

Progetto SINTESI - Dominio Provinciale

IL MIO PRIMO SITO: NEWS

Che cos è l intelligenza e come funzionano i test del Q.I.

Project work: Confronto tra metodi di lavoro all interno di due officine meccaniche

Introduzione alla teoria dei database relazionali. Come progettare un database

Export Development Export Development

SCUOLA PRIMARIA Anno Scolastico 2014/2015 CURRICOLO DI TECNOLOGIA OBIETTIVI DI APPRENDIMENTO AL TERMINE DELLA CLASSE TERZA DELLA SCUOLA PRIMARIA

GRUPPO MY- social media solutions / Via G.Dottori 94, Perugia / PI

I libri di testo. Carlo Tarsitani

SCUOLA PRIMARIA SCIENZE NATURALI E SPERIMENTALI. Competenza: 1. Comunicazione efficace Indicatore: 1.1 Comprensione

Ventilazione del locale di carica carrelli elevatori

Dispositivi di rete. Ripetitori. Hub

Progettazione di una base di dati Ufficio della Motorizzazione

UNI EN ISO 9001:2008 Sistemi di Gestione per la Qualità: requisiti e guida per l uso

Come ragiona il computer. Problemi e algoritmi

manifatturiera e per i servizi

Area Marketing. Approfondimento

MANUALE DELLA QUALITÀ Pag. 1 di 6

1 Serie di Taylor di una funzione

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

RICERCA AZIONE STRUMENTI

Transcript:

1 INTRODUZIONE 1.1 Computer Vision e Pattern Recognition Gli studi condotti nel corso del mio Dottorato di Ricerca si possono maggiormente ricondurre a quella branca della scienza che va sotto il nome di Computer Vision (o Machine Vision, o Visione Artificiale). Una descrizione intuitiva di questa disciplina può essere la seguente: la Computer Vision riproduce sui calcolatori elettronici il percorso cognitivo compiuto dall essere umano nell interpretazione della realtà che lo circonda attraverso le immagini che esso percepisce per mezzo degli occhi. In ogni essere umano tale percorso coinvolge anche la mente e, con questa, tutta la serie di esperienze bagaglio culturale della sua storia che, in molti casi, contribuiscono in modo determinante a completare ciò che egli vede ed a generare una interpretazione esaustiva della realtà circostante. Questa caratteristica rende più che ambizioso lo scopo enunciato nella definizione. Ciò diventa maggiormente vero dato che ancor oggi si preferisce, in molti casi, rinunciare al colore ed alla profondità, analizzando immagini in bianco e nero e provenienti da una singola vista. Poche sono infatti quelle applicazioni dove si considerano immagini a colori o stereo ed ancor meno quelle dove si analizzano entrambi questi aspetti. Il motivo di queste semplificazioni risiede nella inadeguatezza della potenza di calcolo rispetto alle informazioni da acquisire e processare. Molti dei problemi di Computer Vision sono classificati come aspetti di Pattern Recognition, la cui traduzione letterale corrispondente non rende giustizia del concetto che identifica questo tipo di problema. Oltretutto la Pattern

Capitolo 1 Recognition non è tipica solo della Computer Vision. Si può pensare di avere a che fare con un problema di Pattern Recognition ogni volta che si intende classificare (applicare una tassonomia a) un oggetto o -in Computer Vision- ad una immagine o un suo dettaglio. Secondo una definizione che ritengo sufficientemente rigorosa, si può asserire che tutti i problemi relazionati con tassonomie si riducono a trovare uno o più invarianti possibilmente complementari fra di loro. La comparazione avviene attraverso una conveniente misura di distanza. Risolvere un problema di Pattern recognition significa allora, dato un modello e una serie di azioni, trovare una invariante per le trasformazioni che le azioni generano sul modello. In genere si dice che risolvere qualsiasi problema si riduce a trovare l invariante, poiché questo è il vero scoglio. Ad esempio, si immagini di voler trovare l immagine del mio volto in un database di immagini. L immagine di me che si ha a disposizione per la ricerca rappresenta il mio profilo destro, è quindi ruotata e magari anche traslata rispetto a quella contenuta nel database (modello). Chiameremo la rotazione e la traslazione azioni sul modello di me contenuto nel database. Il problema di Pattern Recognition consiste nel riconoscere il modello a partire dal profilo a disposizione; per risolverlo bisogna fornire al sistema una invariante. Analizzando il problema, dunque la base di dati, mi rendo conto che tutte le altre immagini ritraggono volti di persone di colore mentre la mia pelle è chiara. Quindi è facile individuare l invariante per riconoscermi: il colore. Posso dichiararmi soddisfatto perchè sono in grado di trovare sempre e comunque la mia immagine, indipendentemente dal tipo di azione (traslazione, rotazione, ecc.) applicata al prototipo. I problemi cominciano quando nel database c è più di un uomo bianco. In questo caso si dice che l invariante non è completa, ovvero manca qualcosa. Molti degli algoritmi e dei sistemi basati su Computer Vision descritti nella presente tesi contengono un problema di Pattern Recognition. 4

INTRODUZIONE 1.2 Utilità e applicazioni della Computer Vision La visione artificiale sta sempre più assumendo il ruolo di supporto nell analisi di immagini e filmati. La quantità di informazione contenuta in una immagine, e ancor di più in un filmato (= sequenza di immagini), fa sì che il compito di analizzarle possa, in molti contesti, risultare pesante per l uomo, per la noiosa attesa di eventi rari o per l elevato sforzo di concentrazione richiesto dal verificarsi di una rapida successione di eventi. Nelle applicazioni industriali per il controllo della qualità, nella raccolta di dati per sistemi automatici o nell analisi di flussi di immagini da telecamere adibite a videosorveglianza, ed in molti altri campi, la visione artificiale consente di limitare (se non eliminare) la necessità di un controllo umano delle informazioni raccolte. Il grado di supporto dipende spesso in gran parte da quanto il tipo di ambiente da cui provengono le immagini possa ritenersi controllato e cioè dalla misura in cui le variazioni delle condizioni di ripresa possano discostarsi dal modello conosciuto dal sistema di visione che lo analizza. Data, in certi casi, l impossibilità di operare in condizioni controllate, l obiettivo principale posto a chi opera ricerca in questo campo è di individuare algoritmi e sistemi il più possibile immuni alle mutazioni rispetto al modello. Tale variabilità è maggiore per immagini provenienti da ambienti all aperto, mentre è più contenuta per quelle provenienti da ambienti chiusi, come può essere il caso di sistemi di ispezione industriale dei quali, ad esempio, esistono esemplari installati su linee di produzione seriale in grado di fornire ottimi risultati. 1.3 Affidabilità Mentre si può asserire che buona parte dei compiti industriali sono di possibile soluzione, la variabilità delle condizioni outdoor pone molti limiti ai sistemi di visione che spesso assolvono un numero limitato di compiti elementari e demandano comunque l analisi finale all operatore umano. Il vantaggio 5

Capitolo 1 principale portato dai sistemi di visione applicati alla videosorveglianza sta nell essere sensibili ad alcune situazioni anomale in modo da allertare l operatore umano risparmiandogli un attenzione continua al flusso di immagini. Va tuttavia considerata una percentuale non trascurabile di falsi allarmi e di eventi perduti. Il fronte attualmente dibattuto in ambito di ricerca su sistemi per videosorveglianza si colloca ad un livello più avanzato rispetto ai sistemi in vendita per gli stessi scopi. Esistono infatti alcuni prototipi di sistemi in grado di individuare la presenza di persone in una scena e distinguerle da altri oggetti presenti. Esistono poi sistemi basati su modelli in grado di individuare persone indipendentemente dal loro moto. Il movimento è infatti spesso usato come prima fonte di informazione per definire una regione di interesse in una immagine. Un sistema che non si basa sul moto (ed ha quindi un modello intrinseco più o meno evoluto di ciò che deve cercare) è da considerarsi più potente di uno che usa il moto come spia sulle zone di interesse. Infatti non sempre il moto indirizza correttamene l attenzione dell algoritmo. Esistono fenomeni di moto continuo come il movimento di foglie di alberi o l intermittenza di lampade o dovuti ad oscillazioni della telecamera, tali per cui il problema immediatamente successivo diventa come separare il moto interessante da quello che rischia di saturare inutilmente le capacità di calcolo del sistema. Il problema appena descritto è meglio conosciuto come l estrazione del background ovvero la definizione di ciò che non interessa prendere in considerazione dell immagine. Anche il filtraggio del moto è un argomento su cui sono stati sviluppati numerosi approcci. 1.4 Applicazioni a traffico e videosorveglianza La visione artificiale conta numerose applicazioni specifiche materia di stima dei parametri del traffico e videosorveglianza che possono essere principalmente divise secondo il livello dell elaborazione (elementare o complessa), il tipo di ambiente in cui vengono impiegate (outdoor, indoor), il tipo di oggetti verso cui rivolgono la loro attenzione (persone, veicoli o più classi di soggetti). 6

INTRODUZIONE Le più semplici richiedono che venga generato un allarme (e spesso registrata una sequenza di immagini) al verificarsi di un cambiamento in una parte predefinita dell immagine ( change detection ovvero una semplice verifica di variazione rispetto ad una immagine definita regolare ). Tale cambiamento è spesso da intendersi rispetto al background definito in quel momento. L immagine di (o le informazioni sul) background infatti può essere statica ed acquisita una volta per tutte, quando la scena si trova nello stato normale oppure, in applicazioni di maggior complessità, tale riferimento può adattarsi in modo continuo ai mutamenti della scena che non coinvolgono gli oggetti di interesse. In altri sistemi è possibile restringere la detection ad un certo numero di zone di interesse ignorando tutto ciò che avviene nel resto dell immagine. Alcuni sistemi hanno il compito di raccogliere dati (numero di utenti in coda ad uno sportello, di passeggeri presenti su un autobus o di veicoli transitati su una strada...) mentre altri cercano di garantire la sicurezza (controllo di accesso a zone proibite, individuazione di oggetti abbandonati, assembramenti inconsueti...). Le applicazioni rivolte al traffico sono generalmente in grado di identificare veicoli, contarli, stabilirne la classe (cioè se trattasi almeno approssimativamente di auto, piccoli furgoni o grandi automezzi) e tenere traccia delle loro traiettorie e del loro moto (velocità, arresto in condizioni di emergenza...). Tali sistemi hanno di norma due campi di applicazione: la raccolta di dati (il numero di veicoli transitati su una carreggiata per la regolazione delle fasi semaforiche, l analisi del livello di congestione del traffico) e l enforcement ovvero la verbalizzazione automatica di sanzioni conseguenti la violazione di alcuni articoli del Codice della Strada (non ci occuperemo del secondo campo di applicazione). Il genere più vario di applicazioni riguarda l uomo. Ve ne sono alcune che stimano solo approssimativamente un volume di persone ed altre che inseguono il singolo individuo fino a riconoscerlo nuovamente dopo una occlusione o sono in grado di identificare se questi interagisce con un altra persona scambiando qualche oggetto. Naturalmente molti sono i limiti a questi tipi di elaborazioni e molte le ipotesi restrittive sotto cui possono funzionare correttamente. Lo stato 7

Capitolo 1 attuale dell arte propone una serie di algoritmi ben lontani da poter essere considerati utili in ogni contesto. Dalla descrizione sin qui condotta si può notare come sia sottile il confine che distingue un sistema per la caratterizzazione di un flusso di traffico da un sistema di videosorveglianza, dal punto di vista dell analisi richiesta al sistema. 1.5 Percorso della ricerca presentata in questa tesi In estrema sintesi, il percorso su cui si sviluppa la ricerca condotta ha origine nello studio della letteratura sui vari sistemi per la stima dei parametri dei flussi di traffico sia autostradale che urbano a fronte del quale si è scelto di sviluppare due filoni, l uno mutuato dalla filosofia dei sensori attualmente in uso e l altro di tipo più generale. Entrambi hanno portato alla sintesi di due algoritmi distinti. Sul primo sono state condotte misure e confronti sperimentali che hanno dimostrato la sua efficacia in termini di migliori prestazioni rispetto ai sistemi esistenti. Il secondo ha contribuito ad ampliare lo spettro della ricerca: esso ha infatti suggerito (stante l ultima considerazione del paragrafo precedente) la generalizzazione del contesto: da questo punto in poi ai veicoli si sono aggiunti altri oggetti di interesse, persone incluse, conferendo così al tipo di ricerca un carattere più affine alla videosorveglianza. Le esperienze nient affatto prive di problematiche, maturate sulle scene relativamente banali di traffico, hanno suggerito un approccio alla videosorveglianza che partisse dallo studio dello stadio di basso livello contenuto in ogni sistema di questo tipo. A seguito di una ulteriore ricerca si sono riprodotti molti degli algoritmi presenti in letteratura. Questo ha portato alla sintesi di nuove soluzioni che sono state confrontate con quelle esistenti. 8