La presente tesi è stata sviluppata nell’ambito di un tirocinio aziendale presso DataRiver S.r.l. e si concentra su due aspetti principali. Il primo riguarda la piattaforma MyHealth, un sistema software progettato e sviluppato da DataRiver per la raccolta e la gestione dei dati delle sperimentazioni cliniche, in conformità agli standard e alle linee guida internazionali. MyHealth consente di integrare e armonizzare dati eterogenei provenienti da diverse fonti, offrendo una visione unificata e completa delle informazioni relative ai pazienti arruolati in studi clinici su farmaci e dispositivi medici. Nell’ambito del tirocinio, l’obiettivo è stato l’estensione di alcune funzionalità della piattaforma, in collaborazione con il team di sviluppo, al fine di organizzare e gestire in modo più efficiente servizi di supporto dedicati ai pazienti più vulnerabili. La seconda area di attività si è concentrata sul sistema MOMIS, normalmente utilizzato nei progetti MyHealth per l’integrazione dei dati. In particolare, l’analisi si è focalizzata sull’esecuzione di query di FULL JOIN adottate nel sistema MOMIS per effettuare il merge dei dati e sulle ottimizzazioni automatiche adottate da Trino, come Join Reordering, Predicate Pushdown e Join Simplification. I risultati sperimentali hanno evidenziato un miglioramento significativo delle prestazioni, sia in termini di tempi di esecuzione sia di volumi di dati elaborati. È stato inoltre osservato che la presenza di Data Transformation Functions non compromette l’efficacia delle ottimizzazioni. Infine, sono stati analizzati anche i limiti di Trino, in particolare rispetto all’ottimizzazione di Join Elimination.
Gestione ed Integrazione di dati clinici: estensione funzionale di MyHealth e ottimizzazione delle interrogazioni in MOMIS con Trino
BUIUC BALANESCU, DARIA ANDREEA
2024/2025
Abstract
La presente tesi è stata sviluppata nell’ambito di un tirocinio aziendale presso DataRiver S.r.l. e si concentra su due aspetti principali. Il primo riguarda la piattaforma MyHealth, un sistema software progettato e sviluppato da DataRiver per la raccolta e la gestione dei dati delle sperimentazioni cliniche, in conformità agli standard e alle linee guida internazionali. MyHealth consente di integrare e armonizzare dati eterogenei provenienti da diverse fonti, offrendo una visione unificata e completa delle informazioni relative ai pazienti arruolati in studi clinici su farmaci e dispositivi medici. Nell’ambito del tirocinio, l’obiettivo è stato l’estensione di alcune funzionalità della piattaforma, in collaborazione con il team di sviluppo, al fine di organizzare e gestire in modo più efficiente servizi di supporto dedicati ai pazienti più vulnerabili. La seconda area di attività si è concentrata sul sistema MOMIS, normalmente utilizzato nei progetti MyHealth per l’integrazione dei dati. In particolare, l’analisi si è focalizzata sull’esecuzione di query di FULL JOIN adottate nel sistema MOMIS per effettuare il merge dei dati e sulle ottimizzazioni automatiche adottate da Trino, come Join Reordering, Predicate Pushdown e Join Simplification. I risultati sperimentali hanno evidenziato un miglioramento significativo delle prestazioni, sia in termini di tempi di esecuzione sia di volumi di dati elaborati. È stato inoltre osservato che la presenza di Data Transformation Functions non compromette l’efficacia delle ottimizzazioni. Infine, sono stati analizzati anche i limiti di Trino, in particolare rispetto all’ottimizzazione di Join Elimination.| File | Dimensione | Formato | |
|---|---|---|---|
|
Buiuc.Daria.pdf
Accesso riservato
Dimensione
3.82 MB
Formato
Adobe PDF
|
3.82 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/3902