polito.it
Politecnico di Torino (logo)

Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration

Davide Maietta

Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration.

Rel. Maurizio Morisio, Giuseppe Rizzo, Davide Allavena. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (1MB) | Preview
Abstract:

Sviluppo di una metodologia per annotazione automatica di documenti della pubblica amministrazione: Nell'ambito della Named Entity Recognition si è avuto un enorme progresso grazie alle tecnologie di Machine Learning, ma ancora tante sono le applicazioni industriali che usano pratiche di programmazione tradizionali e adoperano Regular Expression. Il nostro obiettivo è provare i due approcci tecnologici - Regular Expression e Machine Learning- e, constatati i relativi punti di forza e debolezza, esaminare un uso combinato di entrambe le tecnologie. Delineiamo poi uno schema Human In the Loop in cui iterativamente si applicano le due tecnologie e l'interazione dell'essere umano con il resto del loop. Il lavoro di estrazione dei dati si basa su documenti della pubblica amministrazione contenenti dati di bandi pubblici.

Relatori: Maurizio Morisio, Giuseppe Rizzo, Davide Allavena
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 43
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: Synapta Srl
URI: http://webthesis.biblio.polito.it/id/eprint/21742
Modifica (riservato agli operatori) Modifica (riservato agli operatori)