polito.it
Politecnico di Torino (logo)

Generative AI per la gestione di Contratti: Sviluppo di un framework per la lettura, estrazione e classificazione di dati in contesto enterprise = Generative AI for Contract Management: Development of a Framework for Reading, Extracting, and Classifying Data in an Enterprise Context

Jacopo Corrias

Generative AI per la gestione di Contratti: Sviluppo di un framework per la lettura, estrazione e classificazione di dati in contesto enterprise = Generative AI for Contract Management: Development of a Framework for Reading, Extracting, and Classifying Data in an Enterprise Context.

Rel. Daniele Apiletti, Emanuele Dall'Ospedale. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2025

Abstract:

La gestione dei contratti rappresenta una sfida cruciale per le organizzazioni moderne, poiché questi documenti contengono informazioni economiche, legali e operative di elevata importanza. La loro eterogeneità strutturale, il linguaggio tecnico-legale e la presenza di allegati o scansioni rendono l’analisi manuale un processo complesso, dispendioso e soggetto a errori. Questa tesi presenta lo sviluppo di un framework, realizzato in collaborazione con Sprint Reply, che sfrutta tecniche di Generative Artificial Intelligence per la classificazione e l’estrazione automatica di entità da diverse tipologie contrattuali. Il sistema integra Large Language Models multimodali, capaci di combinare input testuali e visivi, e adotta un’architettura modulare e configurabile, compatibile con provider quali OpenAI, Azure, Google e soluzioni open-source. Il framework implementa tre funzionalità principali: parsing e normalizzazione di documenti, originariamente in formato PDF e DOCX, classificazione in categorie contrattuali e estrazione strutturata di entità chiave. I dati prodotti possono essere impiegati sia per finalità analitiche, ad esempio, indicatori economici e cruscotti di monitoraggio , sia come input a sistemi di Retrieval-Augmented Generation per la ricerca semantica e l’interrogazione intelligente dei contratti. I risultati sperimentali, ottenuti su un set di contratti anonimizzati, mostrano un’accuratezza media elevata nell’estrazione delle entità, validata tramite confronto con dati etichettati manualmente e misurata con la similarità di Levenshtein. L’analisi evidenzia l’efficacia dell’approccio proposto, pur riconoscendo limiti legati alle allucinazioni dei modelli e alla complessità dei layout contrattuali.

Relatori: Daniele Apiletti, Emanuele Dall'Ospedale
Anno accademico: 2025/26
Tipo di pubblicazione: Elettronica
Numero di pagine: 65
Informazioni aggiuntive: Tesi secretata. Fulltext non presente
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: SPRINT REPLY S.R.L. CON UNICO SOCIO
URI: http://webthesis.biblio.polito.it/id/eprint/38612
Modifica (riservato agli operatori) Modifica (riservato agli operatori)