Ottimizzazione adattativa del metodo dei potenziali artificiali mediante Deep Reinforcement Learning

La navigazione autonoma in ambienti complessi richiede sistemi capaci di evitare ostacoli garantendo contemporaneamente un alto livello di efficienza per la traiettoria intrapresa. I metodi Artificial Potential Field (APF) classici offrono computazione real-time ma soffrono di limitazioni quali minimi locali e parametrizzazione specifica per l’ambiente considerato. Questa tesi presenta un sistema ibrido che integra il metodo di pianificazione APF con il Deep Reinforcement Learning, specificamente il Deep Deterministic Policy Gradient (DDPG), per apprendere automaticamente parametri adattivi dei campi di potenziale. Il sistema utilizza 27 parametri che controllano tre campi attrattivi verso il goal, tre campi repulsivi dagli ostacoli e tre campi vortex tangenziali per ridurre l’occorrenza di minimi locali. Una rete neurale Actor-Critic apprende politiche di navigazione attraverso curriculum learning progressivo con domain randomization. I risultati di simulazione dimostrano un tasso di successo di circa il 70% su scenari con ostacoli geometrici complessi nella versione statica, e circa l’80.5% con ostacoli in movimento. Il confronto con il tuning manuale evidenzia miglioramenti del 40% nel tasso di successo e una riduzione del 65% negli step necessari. L’estensione a robot uniciclo con footprint rettangolare ha previsto l’inserimento di alcune modifiche per il porting fisico e migliorie al sistema, portando all’86, 5% il tasso di successo in ambienti dinamici e al 80,5% nel caso di ambienti statici. Si mostrano infine i test su robot fisico per validare l’approccio e analizzare i risultati.

Ottimizzazione adattativa del metodo dei potenziali artificiali mediante Deep Reinforcement Learning

SIMEONE, KELVIN

2024/2025

Abstract

La navigazione autonoma in ambienti complessi richiede sistemi capaci di evitare ostacoli garantendo contemporaneamente un alto livello di efficienza per la traiettoria intrapresa. I metodi Artificial Potential Field (APF) classici offrono computazione real-time ma soffrono di limitazioni quali minimi locali e parametrizzazione specifica per l’ambiente considerato. Questa tesi presenta un sistema ibrido che integra il metodo di pianificazione APF con il Deep Reinforcement Learning, specificamente il Deep Deterministic Policy Gradient (DDPG), per apprendere automaticamente parametri adattivi dei campi di potenziale. Il sistema utilizza 27 parametri che controllano tre campi attrattivi verso il goal, tre campi repulsivi dagli ostacoli e tre campi vortex tangenziali per ridurre l’occorrenza di minimi locali. Una rete neurale Actor-Critic apprende politiche di navigazione attraverso curriculum learning progressivo con domain randomization. I risultati di simulazione dimostrano un tasso di successo di circa il 70% su scenari con ostacoli geometrici complessi nella versione statica, e circa l’80.5% con ostacoli in movimento. Il confronto con il tuning manuale evidenzia miglioramenti del 40% nel tasso di successo e una riduzione del 65% negli step necessari. L’estensione a robot uniciclo con footprint rettangolare ha previsto l’inserimento di alcune modifiche per il porting fisico e migliorie al sistema, portando all’86, 5% il tasso di successo in ambienti dinamici e al 80,5% nel caso di ambienti statici. Si mostrano infine i test su robot fisico per validare l’approccio e analizzare i risultati.

Scheda breve

Scheda completa

Scheda completa (DC)

	Facoltà/Dipartimento
	
				Dipartimento di Scienze e Metodi dell'Ingegneria
			
	Corso di studio
	
				Ingegneria meccatronica
			
	Anno Accademico
	
				2024
			
	Parola chiave
	
				APF algorithm
DeepRL
DDPG
python
ROS2
			
	Relatore
	
				SECCHI, CRISTIAN
			
	Controrelatore
	
				PUPA, ANDREA
			
	Appare nelle tipologie:
	
				Lauree Magistrali

File in questo prodotto:

File	Dimensione	Formato
Simeone.Kelvin.pdf.pdf Accesso riservato Dimensione 3.63 MB Formato Adobe PDF	3.63 MB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/5780