La registrazione di nuvole di punti è un problema fondamentale nei campi della visione artificiale e della robotica, ampiamente utilizzata in applicazioni quali il rilevamento di oggetti ("object detection") e la comprensione della scena ("scene understanding"). Il presente lavoro affronta il problema dell'identificazione e della localizzazione di oggetti noti in uno scenario 2.5D vincolato, in cui è disponibile unicamente una singola immagine di profondità acquisita da una camera a tempo di volo. La nuvola di punti chiamata "target" rappresenta la scena acquisita dalla camera da un'unica prospettiva, mentre i dati "source" consistono in una libreria finita di modelli, uno per ciascun tipo di oggetto (nuvole di punti note). Il numero e la tipologia degli oggetti presenti nella scena non sono noti a priori; non si assume inoltre la disponibilità di un allineamento iniziale, di corrispondenze note o di un rilevatore esterno. Per affrontare questo problema, è stata sviluppata una "pipeline" modulare basata sulla registrazione geometrica. L'approccio proposto scompone il problema di registrazione multi-istanza in sottoproblemi "pairwise" indipendenti, combinando una versione modificata dell'algoritmo "two-stage consensus filtering" per l'allineamento grossolano ("coarse alignment") e un adattamento dell'algoritmo "fast-robust iterative closest point" per il raffinamento ("fine refinement"). Uno stadio dedicato di pre-elaborazione prepara i dati grezzi per l'analisi, mentre una fase di post-elaborazione valuta l'affidabilità della posa stimata tramite criteri di coerenza geometrica personalizzati. Questo stadio prioritizza la "precision" rispetto alla "recall", al fine di minimizzare i falsi positivi. La validazione sperimentale è stata condotta su dati reali acquisiti in condizioni simil-industriali, dimostrando la fattibilità della soluzione proposta e la sua capacità di localizzare accuratamente gli oggetti, nonostante le viste parziali e le limitate informazioni di profondità. Il lavoro, svolto presso E80 Group, rappresenta un prototipo funzionale piuttosto che una soluzione pronta per l'industrializzazione, ma pone solide basi per futuri sviluppi e per l'integrazione in ambienti produttivi.
Point cloud registration is a fundamental task in computer vision and robotics, widely employed in applications such as object detection and scene understanding. This work addresses the problem of detecting and localizing known objects in a constrained 2.5D scenario, where only a single time-of-flight depth image is available. The target point cloud represents a single-view scene acquired by the camera, while the source data consist of a finite library of model point clouds, one per object type. The number and type of objects present in the scene are unknown a priori, and no initial alignment, correspondences, or external detector are assumed. To tackle this problem, a modular pipeline based on geometric registration is developed. The proposed approach decomposes the multi-instance registration task into independent pairwise subproblems, combining a modified two-stage consensus filtering algorithm for coarse alignment and an adapted fast-robust iterative closest point algorithm for fine refinement. A dedicated pre-processing stage prepares the raw data to be analyzed by the pipeline, while a post-processing step evaluates pose reliability through custom geometric consistency criteria, prioritizing precision over recall, in order to minimize false positives. Experimental validation is carried out on real data acquired under industrial-like conditions, demonstrating the feasibility of the proposed pipeline and its capability to accurately localize objects, despite partial views and limited depth information. The work, carried out within E80 Group, represents a functional prototype rather than an industrially deployable solution, yet it provides a solid foundation for future developments and integration into production environments.
Object Detection with Time-of-Flight Cameras: A Point Cloud Registration Approach Rilevazione di Oggetti tramite Camere a Tempo di Volo: Un Approccio Basato su Registrazione di Nuvole di Punti
MALVOLTI, LUCA
2024/2025
Abstract
La registrazione di nuvole di punti è un problema fondamentale nei campi della visione artificiale e della robotica, ampiamente utilizzata in applicazioni quali il rilevamento di oggetti ("object detection") e la comprensione della scena ("scene understanding"). Il presente lavoro affronta il problema dell'identificazione e della localizzazione di oggetti noti in uno scenario 2.5D vincolato, in cui è disponibile unicamente una singola immagine di profondità acquisita da una camera a tempo di volo. La nuvola di punti chiamata "target" rappresenta la scena acquisita dalla camera da un'unica prospettiva, mentre i dati "source" consistono in una libreria finita di modelli, uno per ciascun tipo di oggetto (nuvole di punti note). Il numero e la tipologia degli oggetti presenti nella scena non sono noti a priori; non si assume inoltre la disponibilità di un allineamento iniziale, di corrispondenze note o di un rilevatore esterno. Per affrontare questo problema, è stata sviluppata una "pipeline" modulare basata sulla registrazione geometrica. L'approccio proposto scompone il problema di registrazione multi-istanza in sottoproblemi "pairwise" indipendenti, combinando una versione modificata dell'algoritmo "two-stage consensus filtering" per l'allineamento grossolano ("coarse alignment") e un adattamento dell'algoritmo "fast-robust iterative closest point" per il raffinamento ("fine refinement"). Uno stadio dedicato di pre-elaborazione prepara i dati grezzi per l'analisi, mentre una fase di post-elaborazione valuta l'affidabilità della posa stimata tramite criteri di coerenza geometrica personalizzati. Questo stadio prioritizza la "precision" rispetto alla "recall", al fine di minimizzare i falsi positivi. La validazione sperimentale è stata condotta su dati reali acquisiti in condizioni simil-industriali, dimostrando la fattibilità della soluzione proposta e la sua capacità di localizzare accuratamente gli oggetti, nonostante le viste parziali e le limitate informazioni di profondità. Il lavoro, svolto presso E80 Group, rappresenta un prototipo funzionale piuttosto che una soluzione pronta per l'industrializzazione, ma pone solide basi per futuri sviluppi e per l'integrazione in ambienti produttivi.| File | Dimensione | Formato | |
|---|---|---|---|
|
Malvolti.Luca.pdf
Accesso riservato
Dimensione
16.24 MB
Formato
Adobe PDF
|
16.24 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/4174