Bilal Hounaifi
Applicazione di modelli di linguaggio naturale per la progettazione e interrogazione di database = Application of Natural Language Models for Database Design and Querying.
Rel. Alessandro Fiori, Silvia Anna Chiusano. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2024
Abstract: |
I modelli di linguaggio di grandi dimensioni (LLM) hanno conosciuto una rapida e ampia diffusione, influenzando profondamente sia il mondo del lavoro che l’istruzione. La necessità di sfruttare al meglio questi strumenti ha dato origine a una nuova disciplina: la prompt engineering. Questa disciplina consente lo sviluppo e l’ottimizzazione dei prompt, ovvero gli input iniziali forniti a un modello di linguaggio per generare risposte, massimizzando così le potenzialità del modello stesso. In questo contesto, la tesi si propone di esplorare l’integrazione tra LLM e database relazionali per automatizzare la generazione di query SQL a partire da domande formulate in linguaggio naturale. L’obiettivo principale è sviluppare un framework che sfrutti le potenzialità degli LLM per semplificare l’interazione con i database, permettendo a utenti non tecnici di accedere e interrogare i dati senza dover scrivere manualmente complesse query SQL. Il progetto, quindi, prevede la progettazione di un modello relazionale del database tramite la piattaforma DesignER e la creazione di un database popolato con dati fittizi generati automaticamente per riflettere scenari realistici. Questo processo di popolamento consente di simulare diversi contesti di utilizzo, migliorando la validità dei test sul framework e supportando una valutazione accurata delle performance degli LLM. Successivamente, si procede alla valutazione di diversi modelli di linguaggio, tra cui ChatGPT, Gemini e Llama, per verificare le loro capacità di risolvere esercizi SQL con difficoltà crescente. Attraverso l’analisi comparativa di questi modelli, la tesi mira a valutare le capacità e i limiti degli LLM nell’elaborazione di query SQL complesse, contribuendo così a migliorare l’automazione, l’accessibilità e la facilità d’uso dei database relazionali per un pubblico più ampio. |
---|---|
Relatori: | Alessandro Fiori, Silvia Anna Chiusano |
Anno accademico: | 2024/25 |
Tipo di pubblicazione: | Elettronica |
Informazioni aggiuntive: | Tesi secretata. Fulltext non presente |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Matematica |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-44 - MODELLISTICA MATEMATICO-FISICA PER L'INGEGNERIA |
Aziende collaboratrici: | NON SPECIFICATO |
URI: | http://webthesis.biblio.polito.it/id/eprint/33415 |
Modifica (riservato agli operatori) |