La categorizzazione delle transazioni rappresenta un’attività centrale nel banking data-driven, in quanto abilita processi di customer profiling, micro-segmentazione e sviluppo di strategie di marketing personalizzato. Tuttavia, gli strumenti esterni di categorizzazione presentano spesso limiti in termini di trasparenza, coerenza e accuratezza classificatoria. Questa tesi presenta la progettazione e l’implementazione di una Proof of Concept di un sistema proprietario per la categorizzazione delle transazioni, sviluppato in un contesto bancario reale. La soluzione proposta integra, all’interno di una pipeline unitaria, approcci complementari di data cleaning, categorizzazione basata su MCC, raffinamento rule-based e matching tramite dizionario ed enrichment esterno mediante Google Maps Places APIs. Il sistema è stato progettato per operare su sorgenti bancarie eterogenee, quali carte di credito, carte di debito internazionali, carte di debito e conti correnti, caratterizzate da diversi livelli di struttura e qualità informativa. Un contributo specifico del lavoro riguarda l’integrazione delle Google Maps APIs come ultimo livello di categorizzazione per le transazioni che non risultano classificabili attraverso gli stadi di categorizzazione iniziali della pipeline. La valutazione sperimentale mostra che la soluzione proposta supera il benchmark esterno. L’accuracy complessiva passa infatti dal 67.26% al 77.99%, confermando l’efficacia dell’approccio sviluppato e il suo potenziale nel migliorare la qualità del dato e supportare applicazioni analitiche avanzate in ambito bancario.
Transaction categorization plays a key role in data-driven banking, as it enables customer profiling, micro-segmentation, and the development of personalized marketing strategies. However, external categorization tools often show limitations in terms of transparency, consistency, and classification accuracy. This thesis presents the design and implementation of a Proof of Concept for an in-house transaction categorization system developed in a real banking context. The proposed solution combines multiple complementary approaches within a single pipeline, including data cleaning, MCC-based categorization, rule-based refinement, dictionary-based matching, and external enrichment through Google Maps Places APIs. The system was designed to operate on heterogeneous banking data sources, such as credit cards, international debit cards, debit cards, and current accounts, each characterized by different levels of informational quality and structure. A specific contribution of the work concerns the integration of Google Maps APIs as a final categorization layer for transactions that remain unresolved after the internal stages of the pipeline. The experimental evaluation shows that the proposed solution outperforms the external benchmark. Overall accuracy increases from 67.26% to 77.99%, confirming the effectiveness of the proposed approach and its potential value for improving data quality and supporting downstream analytical applications in the banking domain.
Design and Implementation of a Banking Transaction Categorization System: A Rule-Based Cleaning and API Integration Approach Progettazione e Implementazione di un Sistema di Categorizzazione delle Transazioni Bancarie: un Approccio Basato su Regole per la Pulizia dei Dati e l’Integrazione di API
ACCORINTI, BENITO ANTONIO
2024/2025
Abstract
La categorizzazione delle transazioni rappresenta un’attività centrale nel banking data-driven, in quanto abilita processi di customer profiling, micro-segmentazione e sviluppo di strategie di marketing personalizzato. Tuttavia, gli strumenti esterni di categorizzazione presentano spesso limiti in termini di trasparenza, coerenza e accuratezza classificatoria. Questa tesi presenta la progettazione e l’implementazione di una Proof of Concept di un sistema proprietario per la categorizzazione delle transazioni, sviluppato in un contesto bancario reale. La soluzione proposta integra, all’interno di una pipeline unitaria, approcci complementari di data cleaning, categorizzazione basata su MCC, raffinamento rule-based e matching tramite dizionario ed enrichment esterno mediante Google Maps Places APIs. Il sistema è stato progettato per operare su sorgenti bancarie eterogenee, quali carte di credito, carte di debito internazionali, carte di debito e conti correnti, caratterizzate da diversi livelli di struttura e qualità informativa. Un contributo specifico del lavoro riguarda l’integrazione delle Google Maps APIs come ultimo livello di categorizzazione per le transazioni che non risultano classificabili attraverso gli stadi di categorizzazione iniziali della pipeline. La valutazione sperimentale mostra che la soluzione proposta supera il benchmark esterno. L’accuracy complessiva passa infatti dal 67.26% al 77.99%, confermando l’efficacia dell’approccio sviluppato e il suo potenziale nel migliorare la qualità del dato e supportare applicazioni analitiche avanzate in ambito bancario.| File | Dimensione | Formato | |
|---|---|---|---|
|
Accorinti.Benito.pdf
Accesso riservato
Dimensione
1.48 MB
Formato
Adobe PDF
|
1.48 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/5782