La Tesi è incentrata sul tema dell’Entity Matching, la sua letteratura, i suoi sviluppi e la sua applicazione al contesto di SCF Italia. Quest’ultima è una società che gestisce i diritti connessi dei produttori discografici per la diffusione pubblica di musica registrata. Il processo centrale verte sull’associazione di brani contenuti nei rendiconti inviati dagli utilizzatori (radio, TV, bar, negozi) con i corrispondenti presenti nel catalogo centrale. Un corretto abbianamento è fondamentale per garantire la giusta distribuzione dei compensi ai titolari dei diritti. L’ Entity Matching, in questo contesto, risulta ottimale per risolvere alcune problematiche che altre tecniche provate fino ad oggi, come la distanza di Levenshtein o le logiche fuzzy, non riescono a risolvere (abbreviazioni, caratteri speciali, versioni alternative). L’obiettivo della tesi è, quindi, quello di descrivere uno stato dell’arte esaustivo sull’argomento centrale per poi raccontare in dettaglio il progetto portato avanti dalla candidata durante il suo tirocinio. Esso ha apportato la creazione di un algoritmo avanzato di entity matching che integra fasi di data cleaning, blocking e un primo test di ricerca e valutazione per migliorare l’efficienza del processo, ridurre gli errori e garantire soluzioni più rapide. La tesi si articola in sei capitoli: Il primo, prettamente introduttivo, presenta l’azienda centrale dell’elaborato, spiegando il Diritto d’Autore, legge centrale per cui lavora l’azienda stessa. Il secondo capitolo enuncia il problema presente in essa, descrivendo le tecniche utilizzate attualmente e delucidando, successivamente, quelle proposte dalla candidata. Il terzo non è altro che lo stato dell’arte sull’argomento centrale dell’elaborato: l’Entity Matching. Sono individuate le fasi principali e alcune tecniche studiate negli anni. Il quarto capitolo, il fulcro dell’elaborato, descrive in dettaglio tutti i passaggi seguiti durante i mesi di tirocinio. Vi sono riportati ragionamenti, codici, soluzioni e problematiche da migliorare. Il quinto capitolo riporta in breve i risultati ottenuti alla fine del progetto mentre, il sesto, presenta considerazioni finali su di esso e sull’ Entity Matching in generale. Si analizzano le implementazioni proposte e le nuove tecnologie che si possono applicare in futuro.
Entity Matching per la gestione dei diritti connessi nel settore discografico
PREVITERO, ANASTASIA
2024/2025
Abstract
La Tesi è incentrata sul tema dell’Entity Matching, la sua letteratura, i suoi sviluppi e la sua applicazione al contesto di SCF Italia. Quest’ultima è una società che gestisce i diritti connessi dei produttori discografici per la diffusione pubblica di musica registrata. Il processo centrale verte sull’associazione di brani contenuti nei rendiconti inviati dagli utilizzatori (radio, TV, bar, negozi) con i corrispondenti presenti nel catalogo centrale. Un corretto abbianamento è fondamentale per garantire la giusta distribuzione dei compensi ai titolari dei diritti. L’ Entity Matching, in questo contesto, risulta ottimale per risolvere alcune problematiche che altre tecniche provate fino ad oggi, come la distanza di Levenshtein o le logiche fuzzy, non riescono a risolvere (abbreviazioni, caratteri speciali, versioni alternative). L’obiettivo della tesi è, quindi, quello di descrivere uno stato dell’arte esaustivo sull’argomento centrale per poi raccontare in dettaglio il progetto portato avanti dalla candidata durante il suo tirocinio. Esso ha apportato la creazione di un algoritmo avanzato di entity matching che integra fasi di data cleaning, blocking e un primo test di ricerca e valutazione per migliorare l’efficienza del processo, ridurre gli errori e garantire soluzioni più rapide. La tesi si articola in sei capitoli: Il primo, prettamente introduttivo, presenta l’azienda centrale dell’elaborato, spiegando il Diritto d’Autore, legge centrale per cui lavora l’azienda stessa. Il secondo capitolo enuncia il problema presente in essa, descrivendo le tecniche utilizzate attualmente e delucidando, successivamente, quelle proposte dalla candidata. Il terzo non è altro che lo stato dell’arte sull’argomento centrale dell’elaborato: l’Entity Matching. Sono individuate le fasi principali e alcune tecniche studiate negli anni. Il quarto capitolo, il fulcro dell’elaborato, descrive in dettaglio tutti i passaggi seguiti durante i mesi di tirocinio. Vi sono riportati ragionamenti, codici, soluzioni e problematiche da migliorare. Il quinto capitolo riporta in breve i risultati ottenuti alla fine del progetto mentre, il sesto, presenta considerazioni finali su di esso e sull’ Entity Matching in generale. Si analizzano le implementazioni proposte e le nuove tecnologie che si possono applicare in futuro.| File | Dimensione | Formato | |
|---|---|---|---|
|
Previtero.Anastasia.pdf
accesso aperto
Dimensione
1.84 MB
Formato
Adobe PDF
|
1.84 MB | Adobe PDF | Visualizza/Apri |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/3877