Pulizia e analisi dati in ambito enterprise: studio comparativo tra Copilot Analyst e soluzioni Python

Negli ultimi anni i modelli di linguaggio di grandi dimensioni, i Large Language Models (LLM), hanno trasformato in maniera radicale il modo in cui persone e organizzazioni interagiscono con le tecnologie digitali. Il loro impatto non si limita alla generazione di testo, questi sistemi sono ormai capaci di analizzare dati, ragionare su problemi complessi, interpretare contesti operativi e supportare attività decisionali. La diffusione di strumenti come Copilot, disponibili all’interno delle piattaforme di produttività di Microsoft, ha reso queste capacità accessibili a un pubblico sempre più ampio, aprendo scenari del tutto nuovi per l’automazione e l’ottimizzazione dei processi aziendali. Il presente elaborato esplora il funzionamento degli LLM, le loro potenzialità e i loro limiti, analizzando sia gli aspetti tecnici sia quelli applicativi. La prima parte introduce l’architettura dei transformer, con particolare attenzione ai modelli decoder only, base della maggior parte degli LLM moderni. Vengono descritti i meccanismi fondamentali (tokenizzazione, embeddings, self attention, reti feed forward), insieme alle dinamiche di addestramento e ai principi emergenti che guidano il comportamento linguistico dei modelli. Successivamente, vengono esaminate le principali sfide degli LLM, come allucinazioni, bias e problemi di affidabilità, insieme alle tecniche di mitigazione attualmente in uso. All’interno di questo contesto si inserisce l’ecosistema Copilot, analizzato sia nella sua architettura (Copilot Stack, Prometheus) sia nella declinazione in agenti intelligenti capaci di operare in modo autonomo e orientato agli obiettivi. La seconda parte del lavoro è dedicata al prompt engineering, disciplina essenziale per indirizzare correttamente il comportamento degli LLM. Sono approfonditi approcci, tecniche di base e avanzate, l’integrazione con sistemi RAG, il design dei prompt per agenti e, in particolare, per Copilot. Vengono inoltre presentati strumenti e framework per la valutazione dei modelli e viene introdotto il tema del prompt hacking, rilevante per la sicurezza e l’affidabilità dei sistemi. La terza parte descrive l’azienda ospitante, System Logistics S.p.A., e il reparto avamprogetto, contesto operativo entro cui è stata condotta l’analisi comparativa tra soluzioni Python tradizionali e l’agente Copilot Analyst. Il quarto capitolo illustra in dettaglio tale confronto: viene descritta la pipeline analitica sviluppata, i controlli di coerenza, la creazione delle tabelle di analisi e lo studio dei flussi logistici, evidenziando differenze, vantaggi e limiti dei due approcci. Chiudono il lavoro una discussione critica sulle direzioni future e le appendici contenenti prompt e codice utilizzati. L’obiettivo complessivo è fornire una visione completa e strutturata sia degli aspetti teorici degli LLM sia della loro applicazione pratica nel contesto aziendale, mostrando come strumenti come Copilot possano rappresentare un supporto concreto e innovativo nei processi di analisi e progettazione.

Pulizia e analisi dati in ambito enterprise: studio comparativo tra Copilot Analyst e soluzioni Python

MARTINO, LARA

2024/2025

Abstract

Negli ultimi anni i modelli di linguaggio di grandi dimensioni, i Large Language Models (LLM), hanno trasformato in maniera radicale il modo in cui persone e organizzazioni interagiscono con le tecnologie digitali. Il loro impatto non si limita alla generazione di testo, questi sistemi sono ormai capaci di analizzare dati, ragionare su problemi complessi, interpretare contesti operativi e supportare attività decisionali. La diffusione di strumenti come Copilot, disponibili all’interno delle piattaforme di produttività di Microsoft, ha reso queste capacità accessibili a un pubblico sempre più ampio, aprendo scenari del tutto nuovi per l’automazione e l’ottimizzazione dei processi aziendali. Il presente elaborato esplora il funzionamento degli LLM, le loro potenzialità e i loro limiti, analizzando sia gli aspetti tecnici sia quelli applicativi. La prima parte introduce l’architettura dei transformer, con particolare attenzione ai modelli decoder only, base della maggior parte degli LLM moderni. Vengono descritti i meccanismi fondamentali (tokenizzazione, embeddings, self attention, reti feed forward), insieme alle dinamiche di addestramento e ai principi emergenti che guidano il comportamento linguistico dei modelli. Successivamente, vengono esaminate le principali sfide degli LLM, come allucinazioni, bias e problemi di affidabilità, insieme alle tecniche di mitigazione attualmente in uso. All’interno di questo contesto si inserisce l’ecosistema Copilot, analizzato sia nella sua architettura (Copilot Stack, Prometheus) sia nella declinazione in agenti intelligenti capaci di operare in modo autonomo e orientato agli obiettivi. La seconda parte del lavoro è dedicata al prompt engineering, disciplina essenziale per indirizzare correttamente il comportamento degli LLM. Sono approfonditi approcci, tecniche di base e avanzate, l’integrazione con sistemi RAG, il design dei prompt per agenti e, in particolare, per Copilot. Vengono inoltre presentati strumenti e framework per la valutazione dei modelli e viene introdotto il tema del prompt hacking, rilevante per la sicurezza e l’affidabilità dei sistemi. La terza parte descrive l’azienda ospitante, System Logistics S.p.A., e il reparto avamprogetto, contesto operativo entro cui è stata condotta l’analisi comparativa tra soluzioni Python tradizionali e l’agente Copilot Analyst. Il quarto capitolo illustra in dettaglio tale confronto: viene descritta la pipeline analitica sviluppata, i controlli di coerenza, la creazione delle tabelle di analisi e lo studio dei flussi logistici, evidenziando differenze, vantaggi e limiti dei due approcci. Chiudono il lavoro una discussione critica sulle direzioni future e le appendici contenenti prompt e codice utilizzati. L’obiettivo complessivo è fornire una visione completa e strutturata sia degli aspetti teorici degli LLM sia della loro applicazione pratica nel contesto aziendale, mostrando come strumenti come Copilot possano rappresentare un supporto concreto e innovativo nei processi di analisi e progettazione.

Scheda breve

Scheda completa

Scheda completa (DC)

	Facoltà/Dipartimento
	
				Dipartimento di Ingegneria "Enzo Ferrari"
			
	Corso di studio
	
				Ingegneria informatica
			
	Anno Accademico
	
				2024
			
	Parola chiave
	
				Copilot Analyst
Prompt Engineering
Python
Analisi dati
Logistica
			
	Relatore
	
				BENEVENTANO, DOMENICO
			
	Appare nelle tipologie:
	
				Lauree Magistrali

File in questo prodotto:

File	Dimensione	Formato
Martino.Lara.pdf Accesso riservato Dimensione 2.4 MB Formato Adobe PDF	2.4 MB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14251/4634