Ali Yassine
Text-to-SQL for Fact Extraction and Verification Over Tabular Data.
Rel. Luca Cagliero, Simone Papicchio. Politecnico di Torino, Corso di laurea magistrale in Data Science And Engineering, 2024
PDF (Tesi_di_laurea)
- Tesi
Accesso riservato a: Solo utenti staff fino al 31 Ottobre 2025 (data di embargo). Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (882kB) |
Abstract: |
This thesis presents an integrated approach for extracting and validating facts from tabular data sourced from the Feverous dataset, which comprises Wikipedia pages. Beyond translating natural language queries into SQL statements optimized for dataset structures, this methodology integrates a retriever component to efficiently identify relevant data entries. The study evaluates the efficacy of this integrated approach in accurately extracting and validating facts from tabular data. Furthermore, the research explores the application of retrieval models, followed by sequence-to-sequence (seq2seq) models and language model (LLM) prompts for constructing knowledge bases, extracting information, and implementing query answering systems. |
---|---|
Relatori: | Luca Cagliero, Simone Papicchio |
Anno accademico: | 2024/25 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 59 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Data Science And Engineering |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
Aziende collaboratrici: | Politecnico di Torino |
URI: | http://webthesis.biblio.polito.it/id/eprint/33097 |
Modifica (riservato agli operatori) |