La tecnologia di eye-tracking ha registrato un rapido sviluppo negli ultimi anni, affermandosi come componente chiave in numerose applicazioni, tra cui le interfacce human-computer (HCI), il gaming, la realtà aumentata e virtuale (AR/VR) e il monitoraggio dello stato di attenzione del conducente in ambito automotive. L’approccio convenzionale alla stima della direzione dello sguardo si basa su sistemi video. Sebbene la video-oculografia garantisca un’elevata accuratezza, essa è caratterizzata da elevati costi computazionali e da una latenza significativa, che ne limitano l’impiego in applicazioni real-time. Al contrario, l’Elettro-Oculografia (EOG) offre una latenza trascurabile e un ridotto carico computazionale; tuttavia, nei dispositivi di fascia consumer, presenta limitazioni intrinseche quali bassa accuratezza assoluta, deriva del segnale e non linearità a grandi eccentricità. In questo lavoro si presenta la progettazione e l’implementazione di un sistema di eye-tracking ibrido a basso costo, finalizzato a mitigare tali limitazioni hardware mediante una progettazione meccanica e tecniche di fusione multimodale dei sensori. L’acquisizione primaria del segnale EOG è realizzata mediante un front-end analogico AD8232 opportunamente modificato. Al fine di ridurre la variabilità nel posizionamento degli elettrodi, il sistema impiega elettrodi integrati in una maschera realizzata ad hoc. Per compensare la deriva stocastica intrinseca all’EOG, l’architettura proposta introduce un approccio di sensor fusion ibrido che integra l’EOG con il tracciamento della pupilla basato su video. Una camera OV2660 è incorporata nell’interfaccia indossabile al fine di fornire un riferimento spaziale assoluto. Mediante una macchina a stati attivata da saccadi, implementata tramite Psychtoolbox in MATLAB, il sistema sfrutta l’elevata risoluzione temporale dell’EOG per il monitoraggio della cinematica saccadica, attraverso la misura continua del potenziale corneo-retinico. Parallelamente, i dati ottici consentono di stimare la posizione della pupilla, fornendo una coordinata di riferimento (ground truth). Tale riferimento spaziale assoluto consente il ripristino automatico della linea di base dell’EOG e la compensazione degli errori di integrazione accumulati, senza necessità di ricalibrazione esplicita da parte dell’utente. Combinando l’efficienza computazionale e la bassa latenza dell’EOG con l’accuratezza spaziale assoluta della video-oculografia, il sistema proposto dimostra la realizzazione di un’interfaccia robusta, stabile e a basso costo, idonea ad applicazioni di interazione human-computer assistiva.
Eye-tracking technology has seen rapid development in recent years, becoming integral to various applications such as human-computer interfaces (HCI), gaming, augmented and virtual reality (AR/VR), and automotive driver alertness monitoring. The standard approach to gaze estimation relies on video-based systems. While video-oculography guarantees high accuracy, it suffers from high computational costs and elevated latency, limiting its efficiency in real-time use. Conversely, Electro-OculoGraphy (EOG) offers minimal latency and low computational demand. However, consumer-grade, EOG is fundamentally limited by low absolute accuracy, non-stationary baseline drift, and signal non-linearities at large eccentricities. This thesis presents the design and implementation of a low-cost, hybrid eye-tracking system that mitigates these hardware limitations through customized mechanical design and multimodal sensor fusion. Primary EOG acquisition is achieved using a modified AD8232 analog front-end. To reduce operator-dependent placement variability, the system utilizes electrodes integrated with a custom-molded, wearable thermoplastic mask. To resolve the stochastic drift inherent to AC-coupled amplification, the architecture introduces a hybrid sensor-fusion approach combining EOG with video-based pupil tracking. An OV2660 camera is integrated into the wearable interface to provide absolute spatial referencing. Utilizing a saccade-triggered state machine executed via Psychtoolbox in MATLAB, the system leverages the high temporal resolution of the EOG to monitor rapid saccadic kinematics by continuously measuring the corneo-retinal potential. Simultaneously, the optical data captures the pupil position and acts as a ground-truth coordinate. This absolute spatial referencing automatically resets the EOG baseline and nullifies accumulated integration errors without requiring explicit user recalibration. By fusing the computational efficiency and low latency of EOG with the absolute spatial accuracy of video-oculography, this research demonstrates a robust, low-cost, and stable interface suitable for assistive Human-Computer Interaction.
Design and implementation of a Low-cost Wearable Eye Tracker: A Sensor Fusion Approach Combining Electro-OculoGraphy and Pupil Tracking
KAFIA, ATHANAS
2024/2025
Abstract
La tecnologia di eye-tracking ha registrato un rapido sviluppo negli ultimi anni, affermandosi come componente chiave in numerose applicazioni, tra cui le interfacce human-computer (HCI), il gaming, la realtà aumentata e virtuale (AR/VR) e il monitoraggio dello stato di attenzione del conducente in ambito automotive. L’approccio convenzionale alla stima della direzione dello sguardo si basa su sistemi video. Sebbene la video-oculografia garantisca un’elevata accuratezza, essa è caratterizzata da elevati costi computazionali e da una latenza significativa, che ne limitano l’impiego in applicazioni real-time. Al contrario, l’Elettro-Oculografia (EOG) offre una latenza trascurabile e un ridotto carico computazionale; tuttavia, nei dispositivi di fascia consumer, presenta limitazioni intrinseche quali bassa accuratezza assoluta, deriva del segnale e non linearità a grandi eccentricità. In questo lavoro si presenta la progettazione e l’implementazione di un sistema di eye-tracking ibrido a basso costo, finalizzato a mitigare tali limitazioni hardware mediante una progettazione meccanica e tecniche di fusione multimodale dei sensori. L’acquisizione primaria del segnale EOG è realizzata mediante un front-end analogico AD8232 opportunamente modificato. Al fine di ridurre la variabilità nel posizionamento degli elettrodi, il sistema impiega elettrodi integrati in una maschera realizzata ad hoc. Per compensare la deriva stocastica intrinseca all’EOG, l’architettura proposta introduce un approccio di sensor fusion ibrido che integra l’EOG con il tracciamento della pupilla basato su video. Una camera OV2660 è incorporata nell’interfaccia indossabile al fine di fornire un riferimento spaziale assoluto. Mediante una macchina a stati attivata da saccadi, implementata tramite Psychtoolbox in MATLAB, il sistema sfrutta l’elevata risoluzione temporale dell’EOG per il monitoraggio della cinematica saccadica, attraverso la misura continua del potenziale corneo-retinico. Parallelamente, i dati ottici consentono di stimare la posizione della pupilla, fornendo una coordinata di riferimento (ground truth). Tale riferimento spaziale assoluto consente il ripristino automatico della linea di base dell’EOG e la compensazione degli errori di integrazione accumulati, senza necessità di ricalibrazione esplicita da parte dell’utente. Combinando l’efficienza computazionale e la bassa latenza dell’EOG con l’accuratezza spaziale assoluta della video-oculografia, il sistema proposto dimostra la realizzazione di un’interfaccia robusta, stabile e a basso costo, idonea ad applicazioni di interazione human-computer assistiva.| File | Dimensione | Formato | |
|---|---|---|---|
|
MsC_Thesis_KAFIA (1) (1).pdf
accesso aperto
Dimensione
3.78 MB
Formato
Adobe PDF
|
3.78 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/5419