Catalogazione e ricerca di oggetti tridimensionali RICCARDO SCATENI UNIVERSITÀ DI CAGLIARI
Sommario INTRODUZIONE TESTO IMMAGINI SUONI OGGETTI TRIDIMENSIONALI DESCRITTORI DI FORMA ARCHIVIAZIONE E RICERCA CONCLUSIONI
Introduzione Motivazione di base per avere strumenti di ricerca automatici: dimensione dei dati Esempio: Google Nel 1998, 26 milioni di documenti Nel 2000, supera il miliardo Nel 2008, raggiunge il bilione (mille miliardi) Oggi? Difficile da dire
Ricerca di testo Il tipo di ricerca più comune Semplice da descrivere dal punto di vista delle modalità Confrontare il testo della chiave di ricerca con il testo contenuto nei documenti Cosa rende semplice il procedimento? L ordine alfabetico!
Web di immagini Evoluzione del web: da solo testo a testo più immagini Flickr: nasce nel 2004, nel settembre 2010 supera i 5 miliardi di foto 5 milioni di foto al giorno aggiunte Molto? No, Facebook contiene decine di miliardi di foto e se ne aggiungono centinaia di milioni al giorno! Differiscono in qualità delle immagini Strumento facilitatore: macchina fotografica digitale
Ricerca di immagini Come posso impostare la ricerca di un immagine? Semplice, utilizzando lo stesso principio del testo Scrivo cosa voglio cercare e spero che chi ha generato l immagine l abbia descritta nello stesso modo È una vera ricerca sul contenuto dell immagine? No Si basa sull interpretazione semantica data da chi l ha prodotta o archiviata (la sua descrizione testuale tramite tag o il contesto in cui si trova)
Esempio
Cosa ci piacerebbe? Sketch-based search! MindFinder (Microsoft Research)
Perché è difficile? Problema 1: è abbastanza complesso descrivere nello stesso modo lo sketch che l utente può fare e le immagini Sono due tipi di informazione diversa Grafica vettoriale: collezione di tratti Grafica raster: insieme di pixel colorati
Perché è difficile? Problema 2: come si costruisce un indice? Non esiste il corrispondente dell ordine alfabetico nei descrittori di immagini O perlomeno non è facile farlo esistere! Si risolve costruendo un qualche tipo di descrittore di immagine che possa essere organizzato Possibilmente ordinato! È un problema di ricerca ancora sostanzialmente aperto
Ricerca di suoni Sono molto diffuse delle applicazioni, soprattutto per smartphone, che consentono di identificare una canzone facendola ascoltare al telefono Problema più semplice della ricerca di immagini La traccia sonora è, come il testo, monodimensionale Si può effettuare la ricerca più o meno con gli stessi modelli del testo, solo cambiando l alfabeto Piccoli spezzoni di suono anziché lettere
Esempio: Shazam Semplice app per Iphone che consente di: Ascoltare una canzone Utilizzare il sistema di registrazione del telefono Cercare la canzone sul database di itunes (circa 13-14 milioni di canzoni) Eventualmente acquistare la canzone
Oggetti tridimensionali digitali Ad oggi, non sono ancora presenti, in rete, con diffusione generale, oggetti tridimensionali digitali Se ne trovano solo poche migliaia Ma nel futuro? Laser scanner 3D sono (quasi) alla portata di tutti Con poco più di 2000 euro si può comprare un oggetto che consente di creare una copia digitale di oggetti reali
Lo scanner 3D Lo scanner 3D può essere il facilitatore per la diffusione di modelli come lo è stato la digital camera per le immagini Però È molto più difficile la costruzione del modello Non è sufficiente premere un tasto per ottenere il risultato finale Per arrivare ad una diffusione di massa sarà necessario rendere molto più semplice il procedimento
Rappresentare gli oggetti digitali Archiviare e ricercare oggetti tridimensionali passa attraverso la loro descrizione La scelta più semplice è quella di utilizzare tag o contesto come per le immagini Altrimenti si deve pensare quale possa essere una buona modalità automatica di rappresentazione per costruire indici Questa rappresentazione deve occupare molto meno spazio rispetto al modello originale e contenere, in maniera compatta, più o meno le stesse informazioni dell oggetto di partenza
Descrittori di forme Quali sono le caratteristiche di questo oggetto? Cosa lo distingue in maniera peculiare? Dovremmo cercare di catturare le informazioni essenziali e trasformale in un descrittore di forma Questo, ovviamente, utilizzando la sua rappresentazione digitale e usando dei metodi automatici per calcolarli
Descrittori di forme Il descrittore più comunemente utilizzato, compatto e facile da estrarre in maniera automatica è il cosiddetto scheletro topologico Ha tutte le informazioni minime che consentono di archiviare l oggetto
Come ordinare le informazioni Anche nel caso dei descrittori di forma abbiamo lo stesso problema visto per le immagini Possibilmente ancora più complesso Il testo e i suoni sono monodimensionali Le immagini sono bidimensionali I descrittori di oggetti digitali sono tridimensionali! Come trasformarli in un descrittore lineare è un problema totalmente aperto
Lo scheletro topologico Lo scheletro è importante anche per suddividere l oggetto in porzioni semanticamente significative (segmenti) Il processo di ricerca può basarsi sul trovare altri oggetti che sono composti dalle stesse porzioni collegate nel medesimo modo
Ricerca e comparazione Oggetto con cui si effettua la ricerca Risultato della ricerca
Come affinare il risultato Per evitare di ottenere degli oggetti che sono distanti dall oggetto utilizzato per la ricerca si devono utilizzare informazioni diverse Si devono misurare le dimensioni effettive dell oggetto Si possono utilizzare le sfere massime centrate nei nodi dello scheletro
Conclusioni Gli oggetti tridimensionali digitali possono essere uno dei prossimi contenuti del web La produzione degli oggetti può avvenire utilizzando strumenti di acquisizione o software di modellazione L archiviazione e la ricerca possono utilizzare strumenti simili a quelli utilizzati per le immagini Le attività collegate alla rappresentazione compatta degli oggetti, alla loro interpretazione semantica, all archiviazione ed alla ricerca automatica sono un campo di ricerca aperto