L’elaborato descrive il lavoro svolto durante il tirocinio presso la divisione Orsi Innotech di Orsi Academy (Melle, Belgio), uno dei principali centri europei di training per la chirurgia robotica. L’obiettivo del tirocinio è analizzare e mitigare il problema del domain shift nella Surgical Phase Recognition (SPR), ovvero il riconoscimento delle fasi chirurgiche, applicata a dataset di Robot-Assisted Radical Prostatectomy (RARP), ovvero prostatectomia radicale robot-assistita, con l’intento di migliorare la capacità di generalizzazione dei modelli tra piattaforme robotiche eterogenee. Questo aspetto risulta cruciale per lo sviluppo di sistemi affidabili e generalizzabili, rappresentando un passo fondamentale verso l’automazione e l’autonomia in chirurgia robotica. A tal fine, sono stati utilizzati dataset di video di interventi RARP, provenienti da diverse piattaforme robotiche e acquisiti in differenti centri clinici, caratterizzati da variazioni in termini di qualità visiva, strumenti e protocolli chirurgici. Questa eterogeneità li rende particolarmente adatti allo studio del domain shift. Per affrontare questo problema, è stata definita una pipeline sperimentale articolata in diverse fasi, che comprende la selezione e valutazione di architetture backbone, l’addestramento su dati provenienti da più piattaforme robotiche, l’integrazione di tecniche di metric learning e modellazione temporale, nonché l’applicazione di strategie di preprocessing e postprocessing. I risultati ottenuti mostrano che le tecniche proposte contribuiscono a migliorare le prestazioni e la robustezza dei modelli in scenari cross-robot. In particolare, l’utilizzo di dati multi-piattaforma e l’integrazione di tecniche di metric learning favoriscono la costruzione di rappresentazioni più generalizzabili, mentre l’introduzione di vincoli temporali, come moduli LSTM e il decoding di Viterbi, consente di ottenere predizioni più stabili e coerenti nel tempo. Dall’analisi sperimentale emerge inoltre che il domain shift non dipende esclusivamente dalle differenze tra piattaforme robotiche o tra centri clinici, ma è influenzato anche da fattori legati al paziente e allo stile operatorio del chirurgo, che introducono ulteriore variabilità nei dati. Nonostante i miglioramenti ottenuti, il problema del domain shift non risulta completamente risolto, evidenziando la necessità di ulteriori studi per sviluppare soluzioni più efficaci e generalizzabili.

Automated Surgical Phase Recognition (SPR) is a cornerstone for the development of intelligent, context-aware systems in robotic surgery. By automatically identifying the procedural context within surgical videos, SPR supports both retrospective and real-time applications. In offline settings, it enables structured workflow analysis, efficient information retrieval, objective performance assessment, and systematic review of complex or suboptimal cases. In online scenarios, phase awareness can facilitate intraoperative decision support, context-aware assistance, and improved operating room coordination; furthermore, it is a prerequisite for the development of autonomous robotic systems. Despite this potential, building robust SPR systems remains challenging. Robotic surgery is characterized by heterogeneity across robotic platforms, annotation protocols, surgical approaches, institutional practices, surgeon-specific techniques, and patient anatomy. These factors introduce significant distributional discrepancies between training and deployment environments, leading to the problem of domain shift. Consequently, models trained on data from a single robotic system or clinical center often experience significant performance degradation when applied to unseen domains, limiting their clinical scalability. In this thesis, a comprehensive investigation of domain shift in robotic SPR is conducted using five datasets of Robot-Assisted Radical Prostatectomy (RARP) acquired from four different robotic platforms, including both multi-port and single-port systems and data collected across multiple clinical centers. This experimental setting enables the examination of cross-robot and cross-center generalization under varying degrees of domain discrepancy. Rather than proposing a single architectural solution, a structured experimental strategy is adopted to analyze the problem from multiple perspectives. Cross-platform performance degradation is first quantified across different visual backbones to establish a strong baseline. Subsequently, the impact of multi-domain supervision, metric learning for feature space structuring, temporal modeling of surgical workflows, Viterbi-based postprocessing, and style-transfer-based preprocessing on cross-robot generalization is systematically evaluated. This progressive framework isolates and clarifies the contribution of each component to robustness under domain shift. The results provide a detailed empirical analysis of the sources of domain shift in robotic SPR and evaluate how visual representations, multi-domain supervision, metric learning, and temporal modeling contribute to mitigate cross-platform performance degradation.

A Multi-Center Evaluation of Cross-Robot Domain Shift in Surgical Phase Recognition for Robot-Assisted Radical Prostatectomy

DALLARI, MARTINA
2024/2025

Abstract

L’elaborato descrive il lavoro svolto durante il tirocinio presso la divisione Orsi Innotech di Orsi Academy (Melle, Belgio), uno dei principali centri europei di training per la chirurgia robotica. L’obiettivo del tirocinio è analizzare e mitigare il problema del domain shift nella Surgical Phase Recognition (SPR), ovvero il riconoscimento delle fasi chirurgiche, applicata a dataset di Robot-Assisted Radical Prostatectomy (RARP), ovvero prostatectomia radicale robot-assistita, con l’intento di migliorare la capacità di generalizzazione dei modelli tra piattaforme robotiche eterogenee. Questo aspetto risulta cruciale per lo sviluppo di sistemi affidabili e generalizzabili, rappresentando un passo fondamentale verso l’automazione e l’autonomia in chirurgia robotica. A tal fine, sono stati utilizzati dataset di video di interventi RARP, provenienti da diverse piattaforme robotiche e acquisiti in differenti centri clinici, caratterizzati da variazioni in termini di qualità visiva, strumenti e protocolli chirurgici. Questa eterogeneità li rende particolarmente adatti allo studio del domain shift. Per affrontare questo problema, è stata definita una pipeline sperimentale articolata in diverse fasi, che comprende la selezione e valutazione di architetture backbone, l’addestramento su dati provenienti da più piattaforme robotiche, l’integrazione di tecniche di metric learning e modellazione temporale, nonché l’applicazione di strategie di preprocessing e postprocessing. I risultati ottenuti mostrano che le tecniche proposte contribuiscono a migliorare le prestazioni e la robustezza dei modelli in scenari cross-robot. In particolare, l’utilizzo di dati multi-piattaforma e l’integrazione di tecniche di metric learning favoriscono la costruzione di rappresentazioni più generalizzabili, mentre l’introduzione di vincoli temporali, come moduli LSTM e il decoding di Viterbi, consente di ottenere predizioni più stabili e coerenti nel tempo. Dall’analisi sperimentale emerge inoltre che il domain shift non dipende esclusivamente dalle differenze tra piattaforme robotiche o tra centri clinici, ma è influenzato anche da fattori legati al paziente e allo stile operatorio del chirurgo, che introducono ulteriore variabilità nei dati. Nonostante i miglioramenti ottenuti, il problema del domain shift non risulta completamente risolto, evidenziando la necessità di ulteriori studi per sviluppare soluzioni più efficaci e generalizzabili.
2024
Automated Surgical Phase Recognition (SPR) is a cornerstone for the development of intelligent, context-aware systems in robotic surgery. By automatically identifying the procedural context within surgical videos, SPR supports both retrospective and real-time applications. In offline settings, it enables structured workflow analysis, efficient information retrieval, objective performance assessment, and systematic review of complex or suboptimal cases. In online scenarios, phase awareness can facilitate intraoperative decision support, context-aware assistance, and improved operating room coordination; furthermore, it is a prerequisite for the development of autonomous robotic systems. Despite this potential, building robust SPR systems remains challenging. Robotic surgery is characterized by heterogeneity across robotic platforms, annotation protocols, surgical approaches, institutional practices, surgeon-specific techniques, and patient anatomy. These factors introduce significant distributional discrepancies between training and deployment environments, leading to the problem of domain shift. Consequently, models trained on data from a single robotic system or clinical center often experience significant performance degradation when applied to unseen domains, limiting their clinical scalability. In this thesis, a comprehensive investigation of domain shift in robotic SPR is conducted using five datasets of Robot-Assisted Radical Prostatectomy (RARP) acquired from four different robotic platforms, including both multi-port and single-port systems and data collected across multiple clinical centers. This experimental setting enables the examination of cross-robot and cross-center generalization under varying degrees of domain discrepancy. Rather than proposing a single architectural solution, a structured experimental strategy is adopted to analyze the problem from multiple perspectives. Cross-platform performance degradation is first quantified across different visual backbones to establish a strong baseline. Subsequently, the impact of multi-domain supervision, metric learning for feature space structuring, temporal modeling of surgical workflows, Viterbi-based postprocessing, and style-transfer-based preprocessing on cross-robot generalization is systematically evaluated. This progressive framework isolates and clarifies the contribution of each component to robustness under domain shift. The results provide a detailed empirical analysis of the sources of domain shift in robotic SPR and evaluate how visual representations, multi-domain supervision, metric learning, and temporal modeling contribute to mitigate cross-platform performance degradation.
Phase Recognition
Domain Shift
RARP
Robotic Surgery
Medical Systems
File in questo prodotto:
File Dimensione Formato  
Dallari.Martina.pdf

embargo fino al 08/04/2029

Dimensione 50.95 MB
Formato Adobe PDF
50.95 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/5322