La Tesi è incentrata sul tema dell’Entity Matching, la sua letteratura, i suoi sviluppi e la sua applicazione al contesto di SCF Italia. Quest’ultima è una società che gestisce i diritti connessi dei produttori discografici per la diffusione pubblica di musica registrata. Il processo centrale verte sull’associazione di brani contenuti nei rendiconti inviati dagli utilizzatori (radio, TV, bar, negozi) con i corrispondenti presenti nel catalogo centrale. Un corretto abbianamento è fondamentale per garantire la giusta distribuzione dei compensi ai titolari dei diritti. L’ Entity Matching, in questo contesto, risulta ottimale per risolvere alcune problematiche che altre tecniche provate fino ad oggi, come la distanza di Levenshtein o le logiche fuzzy, non riescono a risolvere (abbreviazioni, caratteri speciali, versioni alternative). L’obiettivo della tesi è, quindi, quello di descrivere uno stato dell’arte esaustivo sull’argomento centrale per poi raccontare in dettaglio il progetto portato avanti dalla candidata durante il suo tirocinio. Esso ha apportato la creazione di un algoritmo avanzato di entity matching che integra fasi di data cleaning, blocking e un primo test di ricerca e valutazione per migliorare l’efficienza del processo, ridurre gli errori e garantire soluzioni più rapide. La tesi si articola in sei capitoli: Il primo, prettamente introduttivo, presenta l’azienda centrale dell’elaborato, spiegando il Diritto d’Autore, legge centrale per cui lavora l’azienda stessa. Il secondo capitolo enuncia il problema presente in essa, descrivendo le tecniche utilizzate attualmente e delucidando, successivamente, quelle proposte dalla candidata. Il terzo non è altro che lo stato dell’arte sull’argomento centrale dell’elaborato: l’Entity Matching. Sono individuate le fasi principali e alcune tecniche studiate negli anni. Il quarto capitolo, il fulcro dell’elaborato, descrive in dettaglio tutti i passaggi seguiti durante i mesi di tirocinio. Vi sono riportati ragionamenti, codici, soluzioni e problematiche da migliorare. Il quinto capitolo riporta in breve i risultati ottenuti alla fine del progetto mentre, il sesto, presenta considerazioni finali su di esso e sull’ Entity Matching in generale. Si analizzano le implementazioni proposte e le nuove tecnologie che si possono applicare in futuro.

Entity Matching per la gestione dei diritti connessi nel settore discografico

PREVITERO, ANASTASIA
2024/2025

Abstract

La Tesi è incentrata sul tema dell’Entity Matching, la sua letteratura, i suoi sviluppi e la sua applicazione al contesto di SCF Italia. Quest’ultima è una società che gestisce i diritti connessi dei produttori discografici per la diffusione pubblica di musica registrata. Il processo centrale verte sull’associazione di brani contenuti nei rendiconti inviati dagli utilizzatori (radio, TV, bar, negozi) con i corrispondenti presenti nel catalogo centrale. Un corretto abbianamento è fondamentale per garantire la giusta distribuzione dei compensi ai titolari dei diritti. L’ Entity Matching, in questo contesto, risulta ottimale per risolvere alcune problematiche che altre tecniche provate fino ad oggi, come la distanza di Levenshtein o le logiche fuzzy, non riescono a risolvere (abbreviazioni, caratteri speciali, versioni alternative). L’obiettivo della tesi è, quindi, quello di descrivere uno stato dell’arte esaustivo sull’argomento centrale per poi raccontare in dettaglio il progetto portato avanti dalla candidata durante il suo tirocinio. Esso ha apportato la creazione di un algoritmo avanzato di entity matching che integra fasi di data cleaning, blocking e un primo test di ricerca e valutazione per migliorare l’efficienza del processo, ridurre gli errori e garantire soluzioni più rapide. La tesi si articola in sei capitoli: Il primo, prettamente introduttivo, presenta l’azienda centrale dell’elaborato, spiegando il Diritto d’Autore, legge centrale per cui lavora l’azienda stessa. Il secondo capitolo enuncia il problema presente in essa, descrivendo le tecniche utilizzate attualmente e delucidando, successivamente, quelle proposte dalla candidata. Il terzo non è altro che lo stato dell’arte sull’argomento centrale dell’elaborato: l’Entity Matching. Sono individuate le fasi principali e alcune tecniche studiate negli anni. Il quarto capitolo, il fulcro dell’elaborato, descrive in dettaglio tutti i passaggi seguiti durante i mesi di tirocinio. Vi sono riportati ragionamenti, codici, soluzioni e problematiche da migliorare. Il quinto capitolo riporta in breve i risultati ottenuti alla fine del progetto mentre, il sesto, presenta considerazioni finali su di esso e sull’ Entity Matching in generale. Si analizzano le implementazioni proposte e le nuove tecnologie che si possono applicare in futuro.
2024
Algoritmo
Ottimizzazione
Diritti Connessi
Casa Discografica
Matching
File in questo prodotto:
File Dimensione Formato  
Previtero.Anastasia.pdf

accesso aperto

Dimensione 1.84 MB
Formato Adobe PDF
1.84 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/3877