Jacopo Corrias
Generative AI per la gestione di Contratti: Sviluppo di un framework per la lettura, estrazione e classificazione di dati in contesto enterprise = Generative AI for Contract Management: Development of a Framework for Reading, Extracting, and Classifying Data in an Enterprise Context.
Rel. Daniele Apiletti, Emanuele Dall'Ospedale. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2025
| Abstract: |
La gestione dei contratti rappresenta una sfida cruciale per le organizzazioni moderne, poiché questi documenti contengono informazioni economiche, legali e operative di elevata importanza. La loro eterogeneità strutturale, il linguaggio tecnico-legale e la presenza di allegati o scansioni rendono l’analisi manuale un processo complesso, dispendioso e soggetto a errori. Questa tesi presenta lo sviluppo di un framework, realizzato in collaborazione con Sprint Reply, che sfrutta tecniche di Generative Artificial Intelligence per la classificazione e l’estrazione automatica di entità da diverse tipologie contrattuali. Il sistema integra Large Language Models multimodali, capaci di combinare input testuali e visivi, e adotta un’architettura modulare e configurabile, compatibile con provider quali OpenAI, Azure, Google e soluzioni open-source. Il framework implementa tre funzionalità principali: parsing e normalizzazione di documenti, originariamente in formato PDF e DOCX, classificazione in categorie contrattuali e estrazione strutturata di entità chiave. I dati prodotti possono essere impiegati sia per finalità analitiche, ad esempio, indicatori economici e cruscotti di monitoraggio , sia come input a sistemi di Retrieval-Augmented Generation per la ricerca semantica e l’interrogazione intelligente dei contratti. I risultati sperimentali, ottenuti su un set di contratti anonimizzati, mostrano un’accuratezza media elevata nell’estrazione delle entità, validata tramite confronto con dati etichettati manualmente e misurata con la similarità di Levenshtein. L’analisi evidenzia l’efficacia dell’approccio proposto, pur riconoscendo limiti legati alle allucinazioni dei modelli e alla complessità dei layout contrattuali. |
|---|---|
| Relatori: | Daniele Apiletti, Emanuele Dall'Ospedale |
| Anno accademico: | 2025/26 |
| Tipo di pubblicazione: | Elettronica |
| Numero di pagine: | 65 |
| Informazioni aggiuntive: | Tesi secretata. Fulltext non presente |
| Soggetti: | |
| Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
| Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
| Aziende collaboratrici: | SPRINT REPLY S.R.L. CON UNICO SOCIO |
| URI: | http://webthesis.biblio.polito.it/id/eprint/38612 |
![]() |
Modifica (riservato agli operatori) |



Licenza Creative Commons - Attribuzione 3.0 Italia