La navigazione autonoma in ambienti complessi richiede sistemi capaci di evitare ostacoli garantendo contemporaneamente un alto livello di efficienza per la traiettoria intrapresa. I metodi Artificial Potential Field (APF) classici offrono computazione real-time ma soffrono di limitazioni quali minimi locali e parametrizzazione specifica per l’ambiente considerato. Questa tesi presenta un sistema ibrido che integra il metodo di pianificazione APF con il Deep Reinforcement Learning, specificamente il Deep Deterministic Policy Gradient (DDPG), per apprendere automaticamente parametri adattivi dei campi di potenziale. Il sistema utilizza 27 parametri che controllano tre campi attrattivi verso il goal, tre campi repulsivi dagli ostacoli e tre campi vortex tangenziali per ridurre l’occorrenza di minimi locali. Una rete neurale Actor-Critic apprende politiche di navigazione attraverso curriculum learning progressivo con domain randomization. I risultati di simulazione dimostrano un tasso di successo di circa il 70% su scenari con ostacoli geometrici complessi nella versione statica, e circa l’80.5% con ostacoli in movimento. Il confronto con il tuning manuale evidenzia miglioramenti del 40% nel tasso di successo e una riduzione del 65% negli step necessari. L’estensione a robot uniciclo con footprint rettangolare ha previsto l’inserimento di alcune modifiche per il porting fisico e migliorie al sistema, portando all’86, 5% il tasso di successo in ambienti dinamici e al 80,5% nel caso di ambienti statici. Si mostrano infine i test su robot fisico per validare l’approccio e analizzare i risultati.
Ottimizzazione adattativa del metodo dei potenziali artificiali mediante Deep Reinforcement Learning
SIMEONE, KELVIN
2024/2025
Abstract
La navigazione autonoma in ambienti complessi richiede sistemi capaci di evitare ostacoli garantendo contemporaneamente un alto livello di efficienza per la traiettoria intrapresa. I metodi Artificial Potential Field (APF) classici offrono computazione real-time ma soffrono di limitazioni quali minimi locali e parametrizzazione specifica per l’ambiente considerato. Questa tesi presenta un sistema ibrido che integra il metodo di pianificazione APF con il Deep Reinforcement Learning, specificamente il Deep Deterministic Policy Gradient (DDPG), per apprendere automaticamente parametri adattivi dei campi di potenziale. Il sistema utilizza 27 parametri che controllano tre campi attrattivi verso il goal, tre campi repulsivi dagli ostacoli e tre campi vortex tangenziali per ridurre l’occorrenza di minimi locali. Una rete neurale Actor-Critic apprende politiche di navigazione attraverso curriculum learning progressivo con domain randomization. I risultati di simulazione dimostrano un tasso di successo di circa il 70% su scenari con ostacoli geometrici complessi nella versione statica, e circa l’80.5% con ostacoli in movimento. Il confronto con il tuning manuale evidenzia miglioramenti del 40% nel tasso di successo e una riduzione del 65% negli step necessari. L’estensione a robot uniciclo con footprint rettangolare ha previsto l’inserimento di alcune modifiche per il porting fisico e migliorie al sistema, portando all’86, 5% il tasso di successo in ambienti dinamici e al 80,5% nel caso di ambienti statici. Si mostrano infine i test su robot fisico per validare l’approccio e analizzare i risultati.| File | Dimensione | Formato | |
|---|---|---|---|
|
Simeone.Kelvin.pdf.pdf
Accesso riservato
Dimensione
3.63 MB
Formato
Adobe PDF
|
3.63 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/5780