L’interazione uomo-robot (Human-Robot Interaction, HRI) sta evolvendo verso modalità più naturali e accessibili grazie ai recenti progressi nei modelli linguistici di grandi dimensioni (Large Language Models, LLM). In ambito industriale, l’integrazione dei LLM nel controllo robotico è ancora in fase esplorativa, ma rappresenta una prospettiva promettente per superare le limitazioni dei linguaggi di programmazione tradizionali. Persistono tuttavia criticità rilevanti: ambiguità semantiche, assenza di verificabilità formale e rischio di comportamenti non conformi. La presente tesi propone RobotGPT, un’architettura modulare che integra le capacità linguistiche di ChatGPT con l’infrastruttura distribuita di ROS 2 (Robot Operating System 2), con l’obiettivo di abilitare un’interazione naturale tra operatore e robot, formalmente strutturata e semanticamente controllata. Il sistema è composto da nodi ROS 2 che svolgono funzioni distinte ma coordinate per acquisire comandi, generare piani d’azione interpretabili, verificarne la coerenza sintattica e semantica, e gestire l’esecuzione delle primitive robotiche in ambienti reali e simulati. La validazione è stata condotta sul robot collaborativo UR5 e in simulazione con RoboDK, confermando la piena operatività del sistema. I test hanno permesso di misurare la coerenza dei piani generati, la correttezza sintattica delle istruzioni e la robustezza del comportamento in fase esecutiva. Un approfondimento sperimentale ha riguardato il prompt engineering, evidenziando il suo ruolo centrale nella generazione di piani d’azione coerenti e operativi. Nello specifico, è stato dimostrato che l’inclusione di esempi contribuisce a migliorare la precisione semantica e la stabilità delle risposte. Dal punto di vista gestionale, RobotGPT si configura come una proposta no-code orientata a semplificare l’interazione uomo-robot. La possibilità di impartire comandi in linguaggio naturale riduce i tempi di formazione, facilita l’adozione di soluzioni automatizzate e contribuisce all’incremento della produttività. In prospettiva, il sistema presenta potenziali benefici in termini di contenimento dei costi, miglioramento dell’ergonomia operativa e accessibilità tecnologica per profili non tecnici.

RobotGPT: progettazione e sviluppo di un framework modulare in ROS 2 per il controllo robotico mediante ChatGPT

ZOLLO, SARA
2024/2025

Abstract

L’interazione uomo-robot (Human-Robot Interaction, HRI) sta evolvendo verso modalità più naturali e accessibili grazie ai recenti progressi nei modelli linguistici di grandi dimensioni (Large Language Models, LLM). In ambito industriale, l’integrazione dei LLM nel controllo robotico è ancora in fase esplorativa, ma rappresenta una prospettiva promettente per superare le limitazioni dei linguaggi di programmazione tradizionali. Persistono tuttavia criticità rilevanti: ambiguità semantiche, assenza di verificabilità formale e rischio di comportamenti non conformi. La presente tesi propone RobotGPT, un’architettura modulare che integra le capacità linguistiche di ChatGPT con l’infrastruttura distribuita di ROS 2 (Robot Operating System 2), con l’obiettivo di abilitare un’interazione naturale tra operatore e robot, formalmente strutturata e semanticamente controllata. Il sistema è composto da nodi ROS 2 che svolgono funzioni distinte ma coordinate per acquisire comandi, generare piani d’azione interpretabili, verificarne la coerenza sintattica e semantica, e gestire l’esecuzione delle primitive robotiche in ambienti reali e simulati. La validazione è stata condotta sul robot collaborativo UR5 e in simulazione con RoboDK, confermando la piena operatività del sistema. I test hanno permesso di misurare la coerenza dei piani generati, la correttezza sintattica delle istruzioni e la robustezza del comportamento in fase esecutiva. Un approfondimento sperimentale ha riguardato il prompt engineering, evidenziando il suo ruolo centrale nella generazione di piani d’azione coerenti e operativi. Nello specifico, è stato dimostrato che l’inclusione di esempi contribuisce a migliorare la precisione semantica e la stabilità delle risposte. Dal punto di vista gestionale, RobotGPT si configura come una proposta no-code orientata a semplificare l’interazione uomo-robot. La possibilità di impartire comandi in linguaggio naturale riduce i tempi di formazione, facilita l’adozione di soluzioni automatizzate e contribuisce all’incremento della produttività. In prospettiva, il sistema presenta potenziali benefici in termini di contenimento dei costi, miglioramento dell’ergonomia operativa e accessibilità tecnologica per profili non tecnici.
2024
RobotGPT
ChatGPT
Prompt engineering
HRI
ROS 2
File in questo prodotto:
File Dimensione Formato  
Zollo.Sara.pdf

accesso aperto

Dimensione 7.22 MB
Formato Adobe PDF
7.22 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/4089