polito.it
Politecnico di Torino (logo)

Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration

Davide Maietta

Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration.

Rel. Maurizio Morisio, Giuseppe Rizzo, Davide Allavena. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (1MB) | Preview
Abstract:

Sviluppo di una metodologia per annotazione automatica di documenti della pubblica amministrazione: Nell'ambito della Named Entity Recognition si è avuto un enorme progresso grazie alle tecnologie di Machine Learning, ma ancora tante sono le applicazioni industriali che usano pratiche di programmazione tradizionali e adoperano Regular Expression. Il nostro obiettivo è provare i due approcci tecnologici - Regular Expression e Machine Learning- e, constatati i relativi punti di forza e debolezza, esaminare un uso combinato di entrambe le tecnologie. Delineiamo poi uno schema Human In the Loop in cui iterativamente si applicano le due tecnologie e l'interazione dell'essere umano con il resto del loop. Il lavoro di estrazione dei dati si basa su documenti della pubblica amministrazione contenenti dati di bandi pubblici.

Relators: Maurizio Morisio, Giuseppe Rizzo, Davide Allavena
Academic year: 2021/22
Publication type: Electronic
Number of Pages: 43
Subjects:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: New organization > Master science > LM-32 - COMPUTER SYSTEMS ENGINEERING
Aziende collaboratrici: Synapta Srl
URI: http://webthesis.biblio.polito.it/id/eprint/21742
Modify record (reserved for operators) Modify record (reserved for operators)