Davide Maietta
Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration.
Rel. Maurizio Morisio, Giuseppe Rizzo, Davide Allavena. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021
|
Preview |
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract
Sviluppo di una metodologia per annotazione automatica di documenti della pubblica amministrazione: Nell'ambito della Named Entity Recognition si è avuto un enorme progresso grazie alle tecnologie di Machine Learning, ma ancora tante sono le applicazioni industriali che usano pratiche di programmazione tradizionali e adoperano Regular Expression. Il nostro obiettivo è provare i due approcci tecnologici - Regular Expression e Machine Learning- e, constatati i relativi punti di forza e debolezza, esaminare un uso combinato di entrambe le tecnologie. Delineiamo poi uno schema Human In the Loop in cui iterativamente si applicano le due tecnologie e l'interazione dell'essere umano con il resto del loop.
Il lavoro di estrazione dei dati si basa su documenti della pubblica amministrazione contenenti dati di bandi pubblici.
Relatori
Anno Accademico
Tipo di pubblicazione
Numero di pagine
Corso di laurea
Classe di laurea
Aziende collaboratrici
URI
![]() |
Modifica (riservato agli operatori) |
