polito.it
Politecnico di Torino (logo)

Text-to-SQL for Fact Extraction and Verification Over Tabular Data

Ali Yassine

Text-to-SQL for Fact Extraction and Verification Over Tabular Data.

Rel. Luca Cagliero, Simone Papicchio. Politecnico di Torino, Corso di laurea magistrale in Data Science And Engineering, 2024

[img] PDF (Tesi_di_laurea) - Tesi
Accesso riservato a: Solo utenti staff fino al 31 Ottobre 2025 (data di embargo).
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (882kB)
Abstract:

This thesis presents an integrated approach for extracting and validating facts from tabular data sourced from the Feverous dataset, which comprises Wikipedia pages. Beyond translating natural language queries into SQL statements optimized for dataset structures, this methodology integrates a retriever component to efficiently identify relevant data entries. The study evaluates the efficacy of this integrated approach in accurately extracting and validating facts from tabular data. Furthermore, the research explores the application of retrieval models, followed by sequence-to-sequence (seq2seq) models and language model (LLM) prompts for constructing knowledge bases, extracting information, and implementing query answering systems.

Relatori: Luca Cagliero, Simone Papicchio
Anno accademico: 2024/25
Tipo di pubblicazione: Elettronica
Numero di pagine: 59
Soggetti:
Corso di laurea: Corso di laurea magistrale in Data Science And Engineering
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: Politecnico di Torino
URI: http://webthesis.biblio.polito.it/id/eprint/33097
Modifica (riservato agli operatori) Modifica (riservato agli operatori)