Negli ultimi anni i modelli di linguaggio di grandi dimensioni, i Large Language Models (LLM), hanno trasformato in maniera radicale il modo in cui persone e organizzazioni interagiscono con le tecnologie digitali. Il loro impatto non si limita alla generazione di testo, questi sistemi sono ormai capaci di analizzare dati, ragionare su problemi complessi, interpretare contesti operativi e supportare attività decisionali. La diffusione di strumenti come Copilot, disponibili all’interno delle piattaforme di produttività di Microsoft, ha reso queste capacità accessibili a un pubblico sempre più ampio, aprendo scenari del tutto nuovi per l’automazione e l’ottimizzazione dei processi aziendali. Il presente elaborato esplora il funzionamento degli LLM, le loro potenzialità e i loro limiti, analizzando sia gli aspetti tecnici sia quelli applicativi. La prima parte introduce l’architettura dei transformer, con particolare attenzione ai modelli decoder only, base della maggior parte degli LLM moderni. Vengono descritti i meccanismi fondamentali (tokenizzazione, embeddings, self attention, reti feed forward), insieme alle dinamiche di addestramento e ai principi emergenti che guidano il comportamento linguistico dei modelli. Successivamente, vengono esaminate le principali sfide degli LLM, come allucinazioni, bias e problemi di affidabilità, insieme alle tecniche di mitigazione attualmente in uso. All’interno di questo contesto si inserisce l’ecosistema Copilot, analizzato sia nella sua architettura (Copilot Stack, Prometheus) sia nella declinazione in agenti intelligenti capaci di operare in modo autonomo e orientato agli obiettivi. La seconda parte del lavoro è dedicata al prompt engineering, disciplina essenziale per indirizzare correttamente il comportamento degli LLM. Sono approfonditi approcci, tecniche di base e avanzate, l’integrazione con sistemi RAG, il design dei prompt per agenti e, in particolare, per Copilot. Vengono inoltre presentati strumenti e framework per la valutazione dei modelli e viene introdotto il tema del prompt hacking, rilevante per la sicurezza e l’affidabilità dei sistemi. La terza parte descrive l’azienda ospitante, System Logistics S.p.A., e il reparto avamprogetto, contesto operativo entro cui è stata condotta l’analisi comparativa tra soluzioni Python tradizionali e l’agente Copilot Analyst. Il quarto capitolo illustra in dettaglio tale confronto: viene descritta la pipeline analitica sviluppata, i controlli di coerenza, la creazione delle tabelle di analisi e lo studio dei flussi logistici, evidenziando differenze, vantaggi e limiti dei due approcci. Chiudono il lavoro una discussione critica sulle direzioni future e le appendici contenenti prompt e codice utilizzati. L’obiettivo complessivo è fornire una visione completa e strutturata sia degli aspetti teorici degli LLM sia della loro applicazione pratica nel contesto aziendale, mostrando come strumenti come Copilot possano rappresentare un supporto concreto e innovativo nei processi di analisi e progettazione.
Pulizia e analisi dati in ambito enterprise: studio comparativo tra Copilot Analyst e soluzioni Python
MARTINO, LARA
2024/2025
Abstract
Negli ultimi anni i modelli di linguaggio di grandi dimensioni, i Large Language Models (LLM), hanno trasformato in maniera radicale il modo in cui persone e organizzazioni interagiscono con le tecnologie digitali. Il loro impatto non si limita alla generazione di testo, questi sistemi sono ormai capaci di analizzare dati, ragionare su problemi complessi, interpretare contesti operativi e supportare attività decisionali. La diffusione di strumenti come Copilot, disponibili all’interno delle piattaforme di produttività di Microsoft, ha reso queste capacità accessibili a un pubblico sempre più ampio, aprendo scenari del tutto nuovi per l’automazione e l’ottimizzazione dei processi aziendali. Il presente elaborato esplora il funzionamento degli LLM, le loro potenzialità e i loro limiti, analizzando sia gli aspetti tecnici sia quelli applicativi. La prima parte introduce l’architettura dei transformer, con particolare attenzione ai modelli decoder only, base della maggior parte degli LLM moderni. Vengono descritti i meccanismi fondamentali (tokenizzazione, embeddings, self attention, reti feed forward), insieme alle dinamiche di addestramento e ai principi emergenti che guidano il comportamento linguistico dei modelli. Successivamente, vengono esaminate le principali sfide degli LLM, come allucinazioni, bias e problemi di affidabilità, insieme alle tecniche di mitigazione attualmente in uso. All’interno di questo contesto si inserisce l’ecosistema Copilot, analizzato sia nella sua architettura (Copilot Stack, Prometheus) sia nella declinazione in agenti intelligenti capaci di operare in modo autonomo e orientato agli obiettivi. La seconda parte del lavoro è dedicata al prompt engineering, disciplina essenziale per indirizzare correttamente il comportamento degli LLM. Sono approfonditi approcci, tecniche di base e avanzate, l’integrazione con sistemi RAG, il design dei prompt per agenti e, in particolare, per Copilot. Vengono inoltre presentati strumenti e framework per la valutazione dei modelli e viene introdotto il tema del prompt hacking, rilevante per la sicurezza e l’affidabilità dei sistemi. La terza parte descrive l’azienda ospitante, System Logistics S.p.A., e il reparto avamprogetto, contesto operativo entro cui è stata condotta l’analisi comparativa tra soluzioni Python tradizionali e l’agente Copilot Analyst. Il quarto capitolo illustra in dettaglio tale confronto: viene descritta la pipeline analitica sviluppata, i controlli di coerenza, la creazione delle tabelle di analisi e lo studio dei flussi logistici, evidenziando differenze, vantaggi e limiti dei due approcci. Chiudono il lavoro una discussione critica sulle direzioni future e le appendici contenenti prompt e codice utilizzati. L’obiettivo complessivo è fornire una visione completa e strutturata sia degli aspetti teorici degli LLM sia della loro applicazione pratica nel contesto aziendale, mostrando come strumenti come Copilot possano rappresentare un supporto concreto e innovativo nei processi di analisi e progettazione.| File | Dimensione | Formato | |
|---|---|---|---|
|
Martino.Lara.pdf
Accesso riservato
Dimensione
2.4 MB
Formato
Adobe PDF
|
2.4 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14251/4634