Negli ultimi anni, l’adozione crescente di modelli standardizzati per la rappresentazione dei dati clinici, come l’OMOP-CDM (Observational Medical Outcomes Partnership – Common Data Model), ha permesso un’analisi comparativa di grandi quantità di Electronic Health Records (EHR), provenienti da fonti eterogenee. Tuttavia, uno dei principali ostacoli in questo ambito è rappresentato dalla difficoltà di confrontare semanticamente i contenuti clinici, spesso descritti in modo diverso ma riferiti a concetti simili. Una componente centrale dell’OMOP-CDM è costituita dai vocabolari standardizzati o terminologie mediche, che consentono l’organizzazione e la standardizzazione dei termini medici da utilizzare nei vari domini clinici e permettono analisi standardizzate. Una fase fondamentale è quella di annotare i dataset di EHR rispetto a tali terminologie mediche; a tale scopo sono stati realizzati in letteratura vari strumenti, tra cui MedCAT e BioPortal, che sono gli strumenti utilizzati per la presente tesi. La tesi si occupa infatti dell’annotazione semantica rispetto a tali terminologie mediche degli schemi dei dati utilizzati per memorizzare gli EHR, in particolare dello stesso schema standard OMOP-CDM e di tre dataset molto noti in letteratura. Tali schemi verranno annotati automaticamente utilizzando i due strumenti MedCAT e BioPortal, al variare di diversi parametri, usando come input dal semplice nome degli attributi alla loro descrizione completa; il risultato ottenuto verrà quindi confrontato con un gold standard disponibile in letteratura, effettuando una valutazione di tali strumenti di annotazione. Nella parte finale della tesi verrà discussa una classica applicazione dell’annotazione, ovvero la realizzazione di un metodo di schema matching basato sull’annotazione e sul concetto di similarità tra concetti delle terminologie mediche.
Annotazione semantica basata su terminologie mediche: valutazione di strumenti e applicazioni
CONTE, GABRIELE COSTANTINO
2024/2025
Abstract
Negli ultimi anni, l’adozione crescente di modelli standardizzati per la rappresentazione dei dati clinici, come l’OMOP-CDM (Observational Medical Outcomes Partnership – Common Data Model), ha permesso un’analisi comparativa di grandi quantità di Electronic Health Records (EHR), provenienti da fonti eterogenee. Tuttavia, uno dei principali ostacoli in questo ambito è rappresentato dalla difficoltà di confrontare semanticamente i contenuti clinici, spesso descritti in modo diverso ma riferiti a concetti simili. Una componente centrale dell’OMOP-CDM è costituita dai vocabolari standardizzati o terminologie mediche, che consentono l’organizzazione e la standardizzazione dei termini medici da utilizzare nei vari domini clinici e permettono analisi standardizzate. Una fase fondamentale è quella di annotare i dataset di EHR rispetto a tali terminologie mediche; a tale scopo sono stati realizzati in letteratura vari strumenti, tra cui MedCAT e BioPortal, che sono gli strumenti utilizzati per la presente tesi. La tesi si occupa infatti dell’annotazione semantica rispetto a tali terminologie mediche degli schemi dei dati utilizzati per memorizzare gli EHR, in particolare dello stesso schema standard OMOP-CDM e di tre dataset molto noti in letteratura. Tali schemi verranno annotati automaticamente utilizzando i due strumenti MedCAT e BioPortal, al variare di diversi parametri, usando come input dal semplice nome degli attributi alla loro descrizione completa; il risultato ottenuto verrà quindi confrontato con un gold standard disponibile in letteratura, effettuando una valutazione di tali strumenti di annotazione. Nella parte finale della tesi verrà discussa una classica applicazione dell’annotazione, ovvero la realizzazione di un metodo di schema matching basato sull’annotazione e sul concetto di similarità tra concetti delle terminologie mediche.| File | Dimensione | Formato | |
|---|---|---|---|
|
Conte.GabrieleCostantino.pdf
Accesso riservato
Dimensione
792.83 kB
Formato
Adobe PDF
|
792.83 kB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/3523