Negli ultimi anni, l’adozione crescente di modelli standardizzati per la rappresentazione dei dati clinici, come l’OMOP-CDM (Observational Medical Outcomes Partnership – Common Data Model), ha permesso un’analisi comparativa di grandi quantità di Electronic Health Records (EHR), provenienti da fonti eterogenee. Tuttavia, uno dei principali ostacoli in questo ambito è rappresentato dalla difficoltà di confrontare semanticamente i contenuti clinici, spesso descritti in modo diverso ma riferiti a concetti simili. Una componente centrale dell’OMOP-CDM è costituita dai vocabolari standardizzati o terminologie mediche, che consentono l’organizzazione e la standardizzazione dei termini medici da utilizzare nei vari domini clinici e permettono analisi standardizzate. Una fase fondamentale è quella di annotare i dataset di EHR rispetto a tali terminologie mediche; a tale scopo sono stati realizzati in letteratura vari strumenti, tra cui MedCAT e BioPortal, che sono gli strumenti utilizzati per la presente tesi. La tesi si occupa infatti dell’annotazione semantica rispetto a tali terminologie mediche degli schemi dei dati utilizzati per memorizzare gli EHR, in particolare dello stesso schema standard OMOP-CDM e di tre dataset molto noti in letteratura. Tali schemi verranno annotati automaticamente utilizzando i due strumenti MedCAT e BioPortal, al variare di diversi parametri, usando come input dal semplice nome degli attributi alla loro descrizione completa; il risultato ottenuto verrà quindi confrontato con un gold standard disponibile in letteratura, effettuando una valutazione di tali strumenti di annotazione. Nella parte finale della tesi verrà discussa una classica applicazione dell’annotazione, ovvero la realizzazione di un metodo di schema matching basato sull’annotazione e sul concetto di similarità tra concetti delle terminologie mediche.

Annotazione semantica basata su terminologie mediche: valutazione di strumenti e applicazioni

CONTE, GABRIELE COSTANTINO
2024/2025

Abstract

Negli ultimi anni, l’adozione crescente di modelli standardizzati per la rappresentazione dei dati clinici, come l’OMOP-CDM (Observational Medical Outcomes Partnership – Common Data Model), ha permesso un’analisi comparativa di grandi quantità di Electronic Health Records (EHR), provenienti da fonti eterogenee. Tuttavia, uno dei principali ostacoli in questo ambito è rappresentato dalla difficoltà di confrontare semanticamente i contenuti clinici, spesso descritti in modo diverso ma riferiti a concetti simili. Una componente centrale dell’OMOP-CDM è costituita dai vocabolari standardizzati o terminologie mediche, che consentono l’organizzazione e la standardizzazione dei termini medici da utilizzare nei vari domini clinici e permettono analisi standardizzate. Una fase fondamentale è quella di annotare i dataset di EHR rispetto a tali terminologie mediche; a tale scopo sono stati realizzati in letteratura vari strumenti, tra cui MedCAT e BioPortal, che sono gli strumenti utilizzati per la presente tesi. La tesi si occupa infatti dell’annotazione semantica rispetto a tali terminologie mediche degli schemi dei dati utilizzati per memorizzare gli EHR, in particolare dello stesso schema standard OMOP-CDM e di tre dataset molto noti in letteratura. Tali schemi verranno annotati automaticamente utilizzando i due strumenti MedCAT e BioPortal, al variare di diversi parametri, usando come input dal semplice nome degli attributi alla loro descrizione completa; il risultato ottenuto verrà quindi confrontato con un gold standard disponibile in letteratura, effettuando una valutazione di tali strumenti di annotazione. Nella parte finale della tesi verrà discussa una classica applicazione dell’annotazione, ovvero la realizzazione di un metodo di schema matching basato sull’annotazione e sul concetto di similarità tra concetti delle terminologie mediche.
2024
Annot. semantiche
Terminologie mediche
OMOP-CDM
Bioportal
MedCAT
File in questo prodotto:
File Dimensione Formato  
Conte.GabrieleCostantino.pdf

Accesso riservato

Dimensione 792.83 kB
Formato Adobe PDF
792.83 kB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/3523