polito.it
Politecnico di Torino (logo)

Generation of product descriptions based on structured data using an NLG approach

Andrea Avignone

Generation of product descriptions based on structured data using an NLG approach.

Rel. Alessandro Fiori. Politecnico di Torino, Corso di laurea magistrale in Ict For Smart Societies (Ict Per La Società Del Futuro), 2022

Abstract:

Permettere la comunicazione tra uomo e computer è da sempre una delle sfide più affascinanti nel mondo della ricerca scientifica. La diffusione dei sistemi di Natural Language Processing (NLP) ha poi messo le basi per l'implementazione di applicazioni innovative per la comprensione del linguaggio naturale. Con il recente sviluppo delle tecniche di deep learning e Natural Language Generation (NLG) in particolare, è stata fornita alle macchine la capacità di scrivere e parlare, superando i limiti dei tradizionali modelli predefiniti e rendendo l'intelligenza artificiale ancora più umana. Tuttavia, implementare modelli sofisticati per un uso pratico è decisamente impegnativo, soprattutto nei contesti aziendali in cui la qualità del risultato finale ha un impatto diretto sulla resa economica del servizio. Il lavoro di tesi proposto si occupa di sviluppare un framework specifico per la generazione di testi partendo da dati strutturati (conosciuto come data-to-text), basato principalmente sul modello linguistico pre-addestrato GPT-2 e su popolari procedure NLP. L'obiettivo finale è quello di generare descrizioni dettagliate di prodotti tecnologici in modo autonomo, partendo dalle specifiche tecniche, al fine di promuovere l'automazione e ridurre il contributo umano. Piuttosto che riportare semplicemente le caratteristiche del prodotto, il sistema crea in maniera indipendente una struttura coesa, interpretando le informazioni che riceve. In questo modo, è in grado di formulare considerazioni logicamente sensate e motivare i possibili benefici, cercando di rimanere coerente con le informazioni di partenza. I risultati ottenuti presentano un'interessante tendenza a riprodurre correttamente lo stile semantico, lessicale e linguistico del contesto studiato.

Relatori: Alessandro Fiori
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 104
Informazioni aggiuntive: Tesi secretata. Fulltext non presente
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ict For Smart Societies (Ict Per La Società Del Futuro)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-27 - INGEGNERIA DELLE TELECOMUNICAZIONI
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/22829
Modifica (riservato agli operatori) Modifica (riservato agli operatori)