Fondamenti di Elaborazione di Immagini Template Matching. Raffaele Cappelli

Documenti analoghi
Segmentazione di immagini

Dati di tipo video. Indicizzazione e ricerca video

Fondamenti di Visione Artificiale (Seconda Parte) Corso di Robotica Prof.ssa Giuseppina Gini Anno Acc /2007

INTRODUZIONE ALL ESPERIENZA 4: STUDIO DELLA POLARIZZAZIONE MEDIANTE LAMINE DI RITARDO

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

CARATTERISTICHE DEI SEGNALI RANDOM

Capitolo 3 Covarianza, correlazione, bestfit lineari e non lineari

Precisione e Cifre Significative

Il logaritmo discreto in Z p Il gruppo moltiplicativo Z p delle classi resto modulo un primo p è un gruppo ciclico.

Fotogrammetria. O centro di presa. fig.1 Geometria della presa fotogrammetrica

Individuazione di linee e curve. Minimi quadrati. Visione e Percezione. Model fitting: algoritmi per trovare le linee. a = vettore dei parametri

Modello del Gruppo d Acquisto

LA VARIABILITA. IV lezione di Statistica Medica

CORRETTA RAPPRESENTAZIONE DI UN RISULTATO: LE CIFRE SIGNIFICATIVE

Integrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1

Sommatori: Full Adder. Adder. Architetture aritmetiche. Ripple Carry. Sommatori: Ripple Carry [2] Ripple Carry. Ripple Carry

{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo

DBMS multimediali A L B E R T O B E L U S S I B A S I D I D A T I A N N O A C C A D E M I C O /

Corso di Tecniche elettromagnetiche per la localizzazione e il controllo ambientale. Test scritto del 08 / 09 / 2005

RICHIAMI SULLA RAPPRESENTAZIONE IN COMPLEMENTO A 2

Esercizio. Alcuni esercizi su algoritmi e programmazione. Schema a blocchi. Calcolo massimo, minimo e media

Bipoli resistivi. (versione del ) Bipoli resistivi

Circuiti elettrici in regime stazionario

LA CALIBRAZIONE NELL ANALISI STRUMENTALE

Corso di. Dott.ssa Donatella Cocca

Ettore Limoli. Lezioni di Matematica Prof. Ettore Limoli. Sommario. Calcoli di regressione

ESERCIZIO N. 1. b) rendimenti reali dell azienda Gesis e del portafoglio di mercato:

Potenzialità degli impianti

Metodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne

Trigger di Schmitt. e +V t

SERIE STORICHE, TREND, MEDIE MOBILI, REGRESSIONE Andrea Prevete

La soluzione delle equazioni differenziali con il metodo di Galerkin

Modelli descrittivi, statistica e simulazione

Introduzione al Machine Learning

x 0 x 50 x 20 x 100 CASO 1 CASO 2 CASO 3 CASO 4 X n X n X n X n

Circuiti elettrici in regime stazionario

Variabili statistiche - Sommario

B - ESERCIZI: IP e TCP:

PIANIFICAZIONE DEI TRASPORTI

1 La domanda di moneta

5: Strato fisico: limitazione di banda, formula di Nyquist; caratterizzazione del canale in frequenza

* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1

Università degli Studi di Cagliari Dipartimento di Ingegneria Elettrica ed Elettronica CODIFICA BINARIA DELL INFORMAZIONE

Capitolo 6 Risultati pag a) Osmannoro. b) Case Passerini c) Ponte di Maccione

Categorizzazione automatica di immagini mediante algoritmi neurali.

Fig Schema a blocchi di un PMSM isotropo con ingressi ed uscite del controllo digitale.

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

La ripartizione trasversale dei carichi

Analisi ammortizzata. Illustriamo il metodo con due esempi. operazioni su di una pila Sia P una pila di interi con le solite operazioni:

Intorduzione alla teoria delle Catene di Markov

Economia del turismo

6. Catene di Markov a tempo continuo (CMTC)

Le obbligazioni: misure di rendimento e rischio La curva dei rendimenti per scadenze

Capitolo 3. Cap. 3-1

Amplificatori operazionali

CHE COS E LA COMPLESSITA

IL RUMORE NEGLI AMPLIFICATORI

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

Rappresentazione dei numeri PH. 3.1, 3.2, 3.3

Elementi di statistica

Rappresentazione dei numeri

Componenti resistivi

I materiali ferromagnetici sono fortemente non lineari a causa dell'insorgere di fenomeni di saturazione e degli effetti isteretici.

RIPARTIZIONE DELLE FORZE SISMICHE ORIZZONTALI

COMPORTAMENTO DINAMICO DI ASSI E ALBERI

Macchine. 5 Esercitazione 5

UNIVERSITÀ DEGLI STUDI DI BERGAMO. Facoltà di Ingegneria. Corso di Sistemi di Controllo di Gestione SCG-E04

Università degli Studi di Urbino Facoltà di Economia

Architetture aritmetiche. Corso di Organizzazione dei Calcolatori Mariagiovanna Sami

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

Valutazione dei Benefici interni

INTERPOLAZIONE MEDIANTE CURVE SPLINE. '' ( b ) = 0

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum

Relazioni tra variabili: Correlazione e regressione lineare

Questo è il secondo di una serie di articoli, di

CAPITOLO 3 CIRCUITI DI RESISTORI

NUMERI GRANDI DI FIBONACCI come trovare velocemente i loro esatti valori numerici Cristiano Teodoro

Grafi ed equazioni topologiche

Circuiti elettrici in regime stazionario

urto v 2f v 2i e forza impulsiva F r F dt = i t

Ricerca Operativa e Logistica Dott. F.Carrabs e Dott.ssa M.Gentili. Modelli per la Logistica: Single Flow One Level Model Multi Flow Two Level Model

Classificazione di immagini con GRASS

CORSO DI FISICA TECNICA 2 AA 2013/14 ACUSTICA. Lezione n 2:

Lezione 2 le misure di sintesi: le medie

Principi di ingegneria elettrica. Lezione 6 a. Analisi delle reti resistive

DIPARTIMENTO TEMATICO RADIAZIONI Struttura Semplice Radiazioni ionizzanti

x(t) x[n] x q [n] x q [n] Campionamento Quantizzazione Codifica

Campo di applicazione

4.6 Dualità in Programmazione Lineare

Teoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 4

VISUALIZZAZIONE INTERATTIVA DI SUPERFICI CON JAVAVIEW

Definizione di campione

Strutture deformabili torsionalmente: analisi in FaTA-E

Predimensionamento reti chiuse

Sommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?

Corso di laurea in Ingegneria per l Ambiente e il Territorio a.a RETI TOPOGRAFICHE

Sviluppo in serie di Fourier. Introduzione e richiami sulle basi di spazi vettoriali. Serie di Fourier di segnali a supporto illimitato

Modelli decisionali su grafi - Problemi di Localizzazione

Tecniche di Composizione Personalizzata

IL GRUPPO SIMMETRICO S n

Transcript:

Fondament d Elaborazone d Immagn emplate Matchng Raffaele Cappell raffaele.cappell@unbo.t

Contenut Introduzone Confronto dretto fra mmagn e template matchng Panoramca approcc d template matchng Correlazone Defnzone Msure d correlazone normalzzate Anals della complesstà computazonale Approcco mult-rsoluzone Alcun esemp pratc ecnche avanzate d template matchng Cenn ad argoment trattat n Vsone Artfcale e Rconoscmento Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 2

Confronto dretto fra mmagn Ogn mmagne potrebbe essere semplcemente consderata come un punto n uno spazo multdmensonale Un mmagne grayscale corrsponderebbe qund a un vettore con n=wxh dmenson Il confronto dretto d mmagn, medante dstanza fra tal vettor nello spazo, n generale non funzona per una sere d ragon, fra cu: Dfferenze d traslazone, rotazone, scala e prospettva Deformazone e varabltà de pattern Cambament d llumnazone Presenza d rumore nelle mmagn e utlzzo d tecnche d acquszone dverse 4524.84 3990.34 Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 3

emplate matchng Anzché tentare d confrontare drettamente due mmagn, s costruscono uno o pù pattern modello (template) e l s rcerca all nterno dell mmagne, msurandone l grado d somglanza (matchng) n tutte le possbl poszon I 1 2 2 template Immagne d rfermento la poszone (deale) d massma somglanza per due template all nterno dell mmagne Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 4

emplate matchng Panoramca approcc emplate Matchng Rgd emplate Deformable emplate Matchng Matchng Correlaton Hough Free-form Parametrc based transform deformable deformable Analytc-Form based Prototype based Shape learnng Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 5

emplate matchng rgdo Il template è costtuto da un oggetto rgdo Normalmente una pccola mmagne n formato raster: l confronto avvene drettamente fra pxel; tuttava, a seconda dell applcazone, potrebbe essere pù effcace esegure l template matchng dopo aver estratto determnate feature (es. gl edge, oppure l orentazone del gradente) vene sovrapposto a I n tutte le possbl poszon (rspetto agl ass x e y), ma, a seconda dell applcazone, può essere anche necessaro operare delle trasformazon (ad es. ruotarlo e/o scalarlo). Nel seguto s ndcherà con una generca stanza d ottenuta con una data trasformazone. Per ogn stanza, l grado d smlartà vene soltamente calcolato massmzzando la correlazone con la porzone d mmagne I coperta da. Normalmente template hanno dmensone nferore all mmagne Analogamente alla convoluzone, è necessaro decdere come comportars su pxel d bordo (ossa dove non è completamente contenuto n I) Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 6

Correlazone Defnzon Data un mmagne I e un stanza del template, sa I la porzone d mmagne con le stesse dmenson d centrata nel pxel (x,y) Nel seguto, per semplctà d notazone, I e ndcheranno vettor ottenut concatenando le rghe delle due mmagn rettangolar corrspondent SSD e CC Una msura ntutva d dverstà fra I e è la Sum of Squared Dfferences (SSD): SSD 2 2 2 I, I I I I 2 I se le norme d I e fossero costant, mnmzzare la SSD equvarrebbe a massmzzare la Cross Correlaton (CC): CC I, I k I k k Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 7

Correlazone (2) Msure d correlazone normalzzate Necessare, quando I e non sono costant: Dverse regon della stessa mmagne raramente lo sono Istanze dello stesso template dverse tra loro per numero d pxel e lumnostà meda Normalzed SDD (NSDD) e Normalzed CC (NCC) Sono ndpendent dal contrasto d mmagne e template. Infatt pattern a pù elevato contrasto (caratterzzat da ampo range d lvell d grgo) vengono rtenut dalla semplce SSD pù dssml rspetto a pattern con scarso contrasto. Zero-mean NSDD (ZNSDD) e Zero-mean NCC (ZNCC) Rspetto a NSSD e NCC sono nvarant anche per pattern che, a partà d contrasto (stesso range dnamco), presentano lumnostà mede dverse. ZNSSD ZNCC NSSD NCC I I,, I I I I I, NSSD I I, I, NCC I I, 2 Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 8

Correlazone Implementazone d base [...] f (.Wdth *.Heght > nt.maxvalue / (255 * 255)) throw new Excepton("emplate troppo grande per calcolo ntero a 32 bt"); [...] res = new Image<nt>(I.Wdth, I.Heght); nt tw =.Wdth; N.B. Un mplementazone pù effcente dovrebbe evtare l accesso a pxel con [y,x] (utlzzando ndc lnear) e cercare d evtare calcol nutl, ad esempo precalcolando gl offset del template. nt th =.Heght; nt mw2 =.Wdth / 2; nt mh2 =.Heght / 2; nt y1 = mh2; nt y2 = I.Heght - mh2-1; nt x1 = mw2; nt x2 = I.Wdth - mw2-1; // Esegue la correlazone ( bord restano nzalzzat a zero) for (nt y = y1; y <= y2; y++) for (nt x = x1; x <= x2; x++) { nt val = 0; for (nt yt=0;yt<th;yt++) for (nt xt=0;xt<tw;xt++) val += (nt)i[y-mh2+yt,x-mw2+xt] * [yt,xt]; res[y,x] = val; } Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 9

Complesstà computazonale Un esempo: rconoscmento d targhe Immagne: 512x256 emplate: 10 cfre e 26 caratter Rsoluzone 13x20 pxel. Per ogn cfra e per ogn carattere consderamo 9 stanze dovute a varazon d scala (dverse dstanze dalla telecamera) e rotazone. Ogn stanza (324 stanze = 36x9) deve essere sovrapposta all mmagne n tutte le possbl poszon e genera qund ulteror 512x256 stanze (se s trascurano bord). Pertanto occorre stmare crca 42.467.328 = 324x512x256 correlazon, cascuna rchedente almeno 13x20 moltplcazon e altrettante somme (nel caso d semplce CC). In totale crca 11x10 9 moltplcazon (ntere) e altrettante somme. Quanto tempo occorre per processare un mmagne? Almeno 44 second su una macchna capace d esegure 500 mlon d operazon ntere al secondo. Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 10

Correlazone Problematche Complesstà computazonale Il numero d operazon rcheste cresce lnearmente con l numero d stanze e con l numero d pxel d I e (e qund quadratcamente rspetto al lato d I e d ). In pratca, per applcazon real-tme, l approcco d base è raramente applcable. Dffcle gestone d pattern deformabl Esempo: localzzazone d un componente elettronco Necessara nvaranza per poszone, rotazone, scala e aspect rato (lunghezza/altezza). Cò mplca un enorme numero d stanze! Come gestre le varazon d colore? (s potrebbe operare sugl edge e non su pxel) Come gestre le deformazon local (ad esempo pedn pegat o d dversa lunghezza)? Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 11

Correlazone: approcco mult-rsoluzone Obettvo: rdurre la complesstà computazonale Vantagg S segue la rcerca su una gerarcha crescente d rsoluzon Vene creata una pramde d rsoluzon sa per I che per (ad esempo dmezzando la rsoluzone ad ogn lvello) La rcerca vene eseguta nzalmente sulla rsoluzone pù bassa, e a lvell successv vengono analzzate solo le stanze promettent (la cu correlazone al lvello nferore eccedeva una data sogla) Consente d esegure una scrematura a lvell nzal e d perfezonare la localzzazone e fltrare false somglanze a lvell successv Esemplfcando: A metà rsoluzone le operazon s rducono d 16 volte. A 1/4 quarto d rsoluzone d 256 volte. A 1/2 n d rsoluzone d 2 4n volte, ma tpcamente oltre a 3, 4 lvell non è possble operare per mancanza d dettagl Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 12

Approcco mult-rsoluzone Esempo S consder l caso del rconoscmento d targhe vsto n precedenza (mmagne 512x256, 36x9 stanze d template) L applcazone della ZNCC (con un mplementazone medamente effcente n C#) rchede 70.8 second su una CPU a 2.0GHz Applcando l approcco multrsoluzone con 2 lvell e mpostando la sogla n modo da consderare al secondo lvello crca l 1% delle correlazon pù promettent del prmo lvello, temp rsultano essere: 4.3 second per la correlazone al prmo lvello (come era logco fosse!) 1.5 second per la correlazone al secondo lvello (dmenson orgnal) 0.3 second per selezonare le stanze da analzzare al secondo lvello Le poszon selezonate al prmo lvello per una partcolare stanza d un template Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 13

ecnche avanzate d template matchng emplate matchng rgdo Correlazone nel domno delle frequenze Analogamente al caso della convoluzone, è possble utlzzare la trasformata d Fourer per calcolare la correlazone n manera pù effcente [ VAR] rasformata d Hough Nella sua versone orgnale, s tratta d un metodo puttosto robusto per ndvduare lnee rette n un mmagne [ VAR] Può essere generalzzata per rcercare fgure d forma arbtrara n un mmagne (es. crconferenze, ellss,...) Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 14

ecnche avanzate d template matchng (2) emplate matchng deformable Free-form deformable Il template non è vncolato a forme precse. S fa uso d un potental feld, coè d una funzone d energa prodotta dalle feature salent dell mmagne, per gudare l processo verso le deformazon maggormente sgnfcatve. [VAR] Parametrc deformable Il template è parametrco (ad esempo formato da arch, curve splne,...) e regolato da un numero lmtato d parametr, agendo su qual s ottengono deformazon controllate. [VAR] Shape learnng Le possbl varazon della forma del template (e corrspondent grad d lbertà) vengono appres n modo automatco a partre da un nseme d esemp rappresentatv delle possbl varazon dell oggetto che l template deve rappresentare. [VAR] Raffaele Cappell Ingegnera e scenze nformatche Unverstà d Bologna 15