polito.it
Politecnico di Torino (logo)

Applicazione di modelli di linguaggio naturale per la progettazione e interrogazione di database = Application of Natural Language Models for Database Design and Querying

Bilal Hounaifi

Applicazione di modelli di linguaggio naturale per la progettazione e interrogazione di database = Application of Natural Language Models for Database Design and Querying.

Rel. Alessandro Fiori, Silvia Anna Chiusano. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2024

Abstract:

I modelli di linguaggio di grandi dimensioni (LLM) hanno conosciuto una rapida e ampia diffusione, influenzando profondamente sia il mondo del lavoro che l’istruzione. La necessità di sfruttare al meglio questi strumenti ha dato origine a una nuova disciplina: la prompt engineering. Questa disciplina consente lo sviluppo e l’ottimizzazione dei prompt, ovvero gli input iniziali forniti a un modello di linguaggio per generare risposte, massimizzando così le potenzialità del modello stesso. In questo contesto, la tesi si propone di esplorare l’integrazione tra LLM e database relazionali per automatizzare la generazione di query SQL a partire da domande formulate in linguaggio naturale. L’obiettivo principale è sviluppare un framework che sfrutti le potenzialità degli LLM per semplificare l’interazione con i database, permettendo a utenti non tecnici di accedere e interrogare i dati senza dover scrivere manualmente complesse query SQL. Il progetto, quindi, prevede la progettazione di un modello relazionale del database tramite la piattaforma DesignER e la creazione di un database popolato con dati fittizi generati automaticamente per riflettere scenari realistici. Questo processo di popolamento consente di simulare diversi contesti di utilizzo, migliorando la validità dei test sul framework e supportando una valutazione accurata delle performance degli LLM. Successivamente, si procede alla valutazione di diversi modelli di linguaggio, tra cui ChatGPT, Gemini e Llama, per verificare le loro capacità di risolvere esercizi SQL con difficoltà crescente. Attraverso l’analisi comparativa di questi modelli, la tesi mira a valutare le capacità e i limiti degli LLM nell’elaborazione di query SQL complesse, contribuendo così a migliorare l’automazione, l’accessibilità e la facilità d’uso dei database relazionali per un pubblico più ampio.

Relators: Alessandro Fiori, Silvia Anna Chiusano
Academic year: 2024/25
Publication type: Electronic
Additional Information: Tesi secretata. Fulltext non presente
Subjects:
Corso di laurea: Corso di laurea magistrale in Ingegneria Matematica
Classe di laurea: New organization > Master science > LM-44 - MATHEMATICAL MODELLING FOR ENGINEERING
Aziende collaboratrici: UNSPECIFIED
URI: http://webthesis.biblio.polito.it/id/eprint/33415
Modify record (reserved for operators) Modify record (reserved for operators)