Recenti studi hanno evidenziato come la composizione del microbiota intestinale possa influenzare la risposta terapeutica nei pazienti oncologici. L'identificazione di potenziali biomarcatori microbici predittivi di tale risposta rappresenta una sfida scientifica di grande interesse. Il presente lavoro di tesi, che si pone come estensione e approfondimento di una pipeline preesistente finalizzata alla valutazione predittiva della risposta terapeutica, ha come obiettivo l'identificazione di possibili variabili biologiche maggiormente rilevanti nella risposta all'immunoterapia. Il dataset analizzato comprende 569 campioni e 4630 specie microbiche, ognuna delle quali può essere ricondotta ad una catena tassonomica gerarchica del tipo: f_Family →g_Genus →s_Species. La metodologia adottata si basa sul confronto di tre modelli di machine learning (Random Forest, Extra Trees e XGBoost) e sull'applicazione di tecniche di Explainable AI per interpretarne il comportamento. In particolare, al fine di analizzare il contributo delle variabili biologiche e rendere più comprensibili i modelli considerati "balck-box", è stato adottato un framework di interpretabilità su tre livelli: SHAP (SHapley Additive exPlanations) per la stima del contributo delle feature, la Permutation Feature Importance per la valutazione della loro indispensabilità e la Feature Ablation per l'analisi della rilevanza strutturale. I risultati mostrano che alcuni taxa microbici emergono come potenziali biomarcatori della risposta all’immunoterapia, risultando consistenti tra diversi modelli e tecniche di interpretabilità. In particolare, l'analisi evidenzia come la risposta terapeutica sia associata a pattern complessi di abbondanza microbica piuttosto che alla presenza di singole specie isolate.

Analisi comparativa di metodi di Explainable AI per l’identificazione delle variabili biologiche rilevanti nella risposta all’immunoterapia

BONICELLI, BEATRICE
2024/2025

Abstract

Recenti studi hanno evidenziato come la composizione del microbiota intestinale possa influenzare la risposta terapeutica nei pazienti oncologici. L'identificazione di potenziali biomarcatori microbici predittivi di tale risposta rappresenta una sfida scientifica di grande interesse. Il presente lavoro di tesi, che si pone come estensione e approfondimento di una pipeline preesistente finalizzata alla valutazione predittiva della risposta terapeutica, ha come obiettivo l'identificazione di possibili variabili biologiche maggiormente rilevanti nella risposta all'immunoterapia. Il dataset analizzato comprende 569 campioni e 4630 specie microbiche, ognuna delle quali può essere ricondotta ad una catena tassonomica gerarchica del tipo: f_Family →g_Genus →s_Species. La metodologia adottata si basa sul confronto di tre modelli di machine learning (Random Forest, Extra Trees e XGBoost) e sull'applicazione di tecniche di Explainable AI per interpretarne il comportamento. In particolare, al fine di analizzare il contributo delle variabili biologiche e rendere più comprensibili i modelli considerati "balck-box", è stato adottato un framework di interpretabilità su tre livelli: SHAP (SHapley Additive exPlanations) per la stima del contributo delle feature, la Permutation Feature Importance per la valutazione della loro indispensabilità e la Feature Ablation per l'analisi della rilevanza strutturale. I risultati mostrano che alcuni taxa microbici emergono come potenziali biomarcatori della risposta all’immunoterapia, risultando consistenti tra diversi modelli e tecniche di interpretabilità. In particolare, l'analisi evidenzia come la risposta terapeutica sia associata a pattern complessi di abbondanza microbica piuttosto che alla presenza di singole specie isolate.
2024
Microbiota umano
Explainable AI
SHAP
Feature Importance
Random Forest
File in questo prodotto:
File Dimensione Formato  
Bonicelli.Beatrice.pdf

accesso aperto

Dimensione 2.91 MB
Formato Adobe PDF
2.91 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/5770