Bridging the Gap between Detection and Tracking for 3D Human Motion Recovery

Documenti analoghi
Design of Thermal Management Control Policies for Multiprocessors Systems on Chip

Performance Evaluation of a Crystal-Enhanced Collimation System for the LHC

Modeling and Tracking Social Walkers

Data Alignment and (Geo)Referencing (sometimes Registration process)

SCENE UNDERSTANDING FOR MOBILE ROBOTS

UNIVERSITÀ DI PISA FACOLTÀ DI INGEGNERIA

Introduzione alla storia dell intelligenza artificiale e della robotica

Learning session: costruiamo insieme un modello per una campagna di marketing

Pubblicazioni COBIT 5

NUMERICAL ANALYSIS OF AXISYMMETRIC FLOWS AND METHODS FOR FLUID-STRUCTURE INTERACTION ARISING IN BLOOD FLOW SIMULATION

Combinazioni serie IL-MIL + MOT

Downloading and Installing Software Socio TIS

Corso di Ottimizzazione MODELLI MATEMATICI PER IL PROBLEMA DELLO YIELD MANAGEMENT FERROVIARIO. G. Di Pillo, S. Lucidi, L. Palagi

IP TV and Internet TV

Anomali Mediterranei 2 Mediterranean Freaks 2

IL GIOVANE HOLDEN FRANNY E ZOOEY NOVE RACCONTI ALZATE LARCHITRAVE CARPENTIERI E SEYMOUR INTRODUZIONE BY JD SALINGER

zpcr in practice Fabio Massimo Ottaviani EPV

Criteri di appropriatezza diagnosticoterapeutica RADIOTERAPIA. prof Giampaolo Biti Università di Firenze

GESTIONE IMMOBILIARE REAL ESTATE

Gruppo di lavoro 1 Metadati e RNDT. Incontro del 22 luglio 2014

Politecnico di Torino. PRAISE & CABLE projects interaction

Implementazione e gestione del transitorio nell introduzione di un sistema ERP: il caso Power-One - Oracle

The Effect of Manual Techniques on Cervical Kinematic. An Innovative Approach using Helical Axis

Summary. Weekly Newsletter 6th November Dear Parents, We have many activities planned over the next few weeks leading to the winter break.

Managing Diversity In MNCS: A Literature Review Of Existing Strategic Models For Managing Diversity And A Roadmap To Transfer Them To The Subsidiaries

Manuale per il collegamento e l uso Installation and operation manual

Arcadja Report Giulio Turcato

UT / RT 1306_C.doc 26/08/04. Pagina 1/8

Computazione per l interazione naturale: macchine che apprendono

10 year of Fairies. 10 Anni di Fatine.

Mod INTERFACCIA USB/KEY USB/KEY INTERFACE. Sch./Ref.1067/003

How to use the WPA2 encrypted connection

GCE. Edexcel GCE Italian(9330) Summer Mark Scheme (Results)

Microscopi polarizzati da laboratorio

I CAMBIAMENTI PROTOTESTO-METATESTO, UN MODELLO CON ESEMPI BASATI SULLA TRADUZIONE DELLA BIBBIA (ITALIAN EDITION) BY BRUNO OSIMO

Arcadja Report Armando Pizzinato

Definizione e principi. Venezia, 20 febbraio 2014

le Isole Espressione e Stile, frutto di una tradizione tutta italiana

STUDIO DELLA BIOMECCANICA DEL MOVIMENTO TRAMITE I SISTEMI OPTOELETTRONICI MARKLERLESS

Il sistema di Lorenz. giovedì 24 novembre 11

AVERE 30 ANNI E VIVERE CON LA MAMMA BIBLIOTECA BIETTI ITALIAN EDITION

U Corso di italiano, Lezione Quattordici

Painting with the palette knife

Il Lean Thinking, un applicazione pratica nella produzione su commessa

BUON GIORNO RAGAZZI! Oggi è il 13 ottobre, 2015

Per i Bambini. For children

Novità versione 10 News release 10

3d geological modelling and education: teaching geological sections and geological mapping with MVE Move

ATTESTATO DELL ATTIVITÀ DI VOLONTARIATO CERTIFICATE OF VOLUNTARY ACTIVITIES

Village for sale in Florence.

Sezione 1 / Section 1. Elementi d identità: il marchio Elements of identity: the logo

Diritto dell'economia e dei consumatori Specifiche economiche

Guida all installazione del prodotto 4600 in configurazione plip

ETA CONSIGLIATA/RECOMMENDED AGE Indica per quale fascia di età è stato pensato il giocattolo. Suggested age group for the ride.

A Solar Energy Storage Pilot Power Plant

Eco-REFITec: Seminary and Training course

Programma II B Liceo Scientifico

Scheda Allarmi Alarm Board MiniHi

Gi-Gi Art User's Guide Istruzioni d'uso

SISTEMI DI PRERISCALDO A GAS

elaboratore di segnale

ECO-FRIENDLY HOME by CHATEAU D AX CONTRACT DIVISION

SAIR ELETTROVENTILATORI CENTRIFUGHI A SEMPLICE ASPIRAZIONE DIRETTAMENTE ACCOPPIATI DIRECT DRIVEN SINGLE INLET CENTRIFUGAL FANS

Mock exam. Cow & Gate

Il Consortium Agreement

/. ^y^cr-^a. Bandwidth and Energy Efficiency. Continuous-Phase Modulation. and Coding for. 2?.g. g& presented by Bixio E. Rimoldi. dipl. El. Ing.

INFORMAZIONE AGLI UTENTI DI APPARECCHIATURE DOMESTICHE O PROFESSIONALI

Airport CDM Malpensa Informazioni Generali

Arcadja Report Michele Cammarano

STATO IMPLEMENTAZIONE ONVIF SU TELECAMERE MUNDUS SECURUS

INDICE nuovi prodotti abbigliamento pelletteria new products clothing leather

Quarantacinque disegni di Alberto Giacometti Edited by Lamberto Vitali, foreword by Jean Leymarie Einaudi, Turin, 1963

Scritto da DEApress Lunedì 14 Aprile :03 - Ultimo aggiornamento Martedì 26 Maggio :34

Metodologie di progettazione

Quando mi collego ad alcuni servizi hosting ricevo un messaggio relativo al certificato di protezione del sito SSL, come mai?

Prove statiche su componenti

formati > formats Esagono 15 15x17 (6 x6.7 ) Esagono 5 5x5,7 (2 x2.2 ) Optical Mod. A 15x17 (6 x6.7 ) Optical Mod. B 15x17 (6 x6.

Circolare n. 61 Perugia, 01 ottobre Agli alunni delle classi seconde terze quarte Ai genitori Al personale ATA Sede

PAPER CUP DISPENSERS

SISTEMI DI INTRATTENIMENTO DI BORDO: HARDWARE ED ALGORITMI

STONE AGE SIMPLICITY IS NOT OVER. Semplicità. L Età della Pietra non è mai finita.

ENGINE COMPONENT DESIGN Cap. 7 AIAA AIRCRAFT ENGINE DESIGN R03-23/10/2013

Università degli Studi di Roma Tor Vergata Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica. Programmazione orientata agli Oggetti

Speech to text at RSI archive

Name on a passport, HANGTAG

Arcadja Report Mario Schifano

CONFIGURATION MANUAL

CORSO DI LAUREA IN SERVIZI SOCIALI E SOCIOLOGIA a.a. 2012/13

We take care of your buildings

Il Futuro. The Future Tense

Ingegneria del Software

IBM Software Demos WebSphere Software Development WSStudio

Lo sniffer. questo sconosciuto! Corso di Reti di Calcolatori Architetture e Servizi A.A. 2010/11. Introduzione allo sniffing TCP

SOLANT: STUDY AND DEVELOPMENT OF PLANAR ANTENNAS INTEGRATING SOLAR CELLS

Feedback and feedforward mechanisms for the control of lower limb posture following anterior cruciate ligament rupture and reconstruction

La devolution nel Regno Unito: un assetto in continua evoluzione

Le nuove piattaforme di distribuzione e i nuovi formati digitali

LA SIMULAZIONE NUMERICA COME STRUMENTO DI ANALISI DEL MOTO ONDOSO SULLE BARRIERE SOFFOLTE

CCTV DIVISION. Guida Alla Lettura del Numero Seriale, Codice Prodotto, Versione Firmware, Versione Software, Codice Libretto

Famiglie di tabelle fatti

Transcript:

Bridging the Gap between Detection and Tracking for 3D Human Motion Recovery THÈSE N O 4699 (2010) PRÉSENTÉE LE 4 JUIN 2010 À LA FACULTÉ INFORMATIQUE ET COMMUNICATIONS LABORATOIRE DE VISION PAR ORDINATEUR PROGRAMME DOCTORAL EN INFORMATIQUE, COMMUNICATIONS ET INFORMATION ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE POUR L'OBTENTION DU GRADE DE DOCTEUR ÈS SCIENCES PAR Andrea FOSSATI acceptée sur proposition du jury: Prof. M. Hasler, président du jury Prof. P. Fua, directeur de thèse Dr R. Boulic, rapporteur Prof. A. Hilton, rapporteur Prof. B. Leibe, rapporteur Suisse 2010

Abstract The aim of this thesis is to build a system able to automatically and robustly track human motion in 3 D starting from monocular input. To this end two approaches are introduced, which tackle two different types of motion: The first is useful to analyze activities for which a characteristic pose, or key-pose, can be detected, as for example in the walking case. On the other hand the second can be used for cases in which such pose is not defined but there is a clear relation between some easily measurable image quantities and the body configuration, as for example in the skating case where the trajectory followed by a subject is highly correlated to how the subject articulates. In the first proposed technique we combine detection and tracking techniques to achieve robust 3D motion recovery of people seen from arbitrary viewpoints by a single and potentially moving camera. We rely on detecting key postures, which can be done reliably, using a motion model to infer 3D poses between consecutive detections, and finally refining them over the whole sequence using a generative model. We demonstrate our approach in the cases of golf motions filmed using a static camera and walking motions acquired using a potentially moving one. We will show that this approach, although monocular, is both metrically accurate because it integrates information over many frames and robust because it can recover from a few misdetections. The second approach is based on the fact that the articulated body models used to represent human motion typically have many degrees of freedom, usually expressed as

joint angles that are highly correlated. The true range of motion can therefore be represented by latent variables that span a low-dimensional space. This has often been used to make motion tracking easier. However, learning the latent space in a problem independent way makes it non trivial to initialize the tracking process by picking appropriate initial values for the latent variables, and thus for the pose. In this thesis, it will be shown that by directly using observable quantities as latent variables, this issues can be eliminated. Index Words: Human Body Detection and Tracking, Motion Models, Low-Dimensional Embedding.

Sommario Lo scopo di questa tesi é di costruire un sistema in grado di tracciare automaticamente e in maniera robusta il movimento umano in 3 dimensioni, a partire da una singola sequenza video. Per questo obiettivo sono introdotti due approcci, che sono volti ad analizzare due differenti tipologie di movimento: Il primo é utile per studiare attivit a per le quali é definibile una posa caratteristica, o posa chiave, come per esempio nel camminare. Il secondo invece puó essere utilizzato per casi nei quali tale posa non é definibile ma vi é una chiara relazione tra alcune quantit á direttamente misurabili nell immagine e la configurazione del corpo, come ad esempio nel caso del pattinaggio nel quale la traiettoria seguita dal soggetto analizzato é strettamente correlata a come muove le sue articolazioni. Nel primo algoritmo proposto vengono combinate tecniche di rilevazione e tracciamento per stimare in maniera robusta il movimento di persone riprese da un punto di vista arbitrario tramite una singola videocamera, eventualmente mobile. Esso si basa sul rilevamento di posture base, che puó essere effettuato in maniera affidabile, e utilizza modelli di movimento per stimare le pose 3 dimensionali tra rilevamenti consecutivi. Queste stime sono infine ottimizzate su tutta la sequenza utilizzando un modello generativo. Il funzionamento di tale approccio é stato dimostrato su sequenze di golf, acquisite tramite una videocamera statica, e su sequenze di persone che camminano, utilizzando una videocamera in movimento. Questa tecnica, seppure non stereo, é sia precisa metricamente, dato che integra informazioni provenienti da molteplici immagini, sia robusta perch e anche in

grado di sopperire a delle eventuali mancate rilevazioni Il secondo approccio é invece basato sul fatto che i modelli articolati che sono in genere utilizati per rappresentare il movimento umano hanno numerosi gradi di libert a, solitamente espressi in termini di angoli delle articolazioni che sono tra loro correlati. Per questo motivo il reale spettro di movimenti pu ó essere rappresentato da variabili di minore dimensionalitá in uno spazio sottodimensionale. Questa soluzione é stata spesso adottata per rendere piú semplice la stima del movimento umano. Tuttavia, l apprendimento di tale rapprensentazione sottodimensionale in maniera indipendente dal tipo di problema rende molto complessa l inizializzazione del processo di tracciamento, in particolare nella selezione dei valori iniziali per le variabili sottodimensionali. In questa tesi verrá invece mostrato come, utilizzando come variabili sottodimensionali delle misure direttamente rilevabili dalle immagini, questo problema possa essere risolto. Parole Chiave: Tracciamento del corpo umano, Modelli di movimento, Rappresentazione sottodimensionale.

Contents List of Abbreviations 18 1 Introduction 19 1.1 Motivation.................................. 21 1.2 Goal and Contributions........................... 22 1.3 Thesis Structure............................... 25 2 State of the Art 27 2.1 Commercial Motion Capture Devices................... 28 2.2 Video-Based Motion Capture........................ 29 2.2.1 Multi-View Human Pose Estimation................ 31 2.2.2 People Detection.......................... 34 2.2.3 People Tracking.......................... 37 2.2.4 Approaches combining Detection and Tracking.......... 41 3 Human Body and Motion Parameterization 45 3.1 HumanBody Model............................ 45 3.2 Pose and Motion Definition......................... 47 3.3 PCA onposes................................ 50 3.4 PCA onsequences............................. 52 4 Bridging the Gap between Detection and Tracking 55 4.1 Approach.................................. 56 4.2 Key-Pose Detection............................. 58 4.3 Linking Detections to obtain 2D Trajectories................ 61 4.4 Interpolation of 3D Poses between Detections............... 67 4.5 Image Likelihood for Refinement...................... 69 4.5.1 Appearance-based Likelihood................... 71 4.5.2 Generalized Expectation Maximization for Limb to Edge Matching 74 4.6 Optimization................................ 82 4.6.1 Frame-Wise Optimization..................... 82 4.6.2 Sequence-Based Optimization................... 82 4.7 Results.................................... 86 4.7.1 Golfing............................... 87 4.7.2 Walking............................... 91 9

5 Observable Subspaces 101 5.1 Framework................................. 102 5.1.1 Motion Representation....................... 103 5.1.2 Gaussian Processes......................... 103 5.1.3 Linear Subspace Motion Model.................. 105 5.1.4 Fitting the Model to Image Data.................. 105 5.2 Experimental Results............................ 109 5.2.1 Obtaining Training Data...................... 110 5.2.2 Retrieving Trajectory Parameters................. 112 5.2.3 Motion Recovery.......................... 112 6 Conclusions 123 10