Davide Maietta
Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration.
Rel. Maurizio Morisio, Giuseppe Rizzo, Davide Allavena. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract: |
Sviluppo di una metodologia per annotazione automatica di documenti della pubblica amministrazione: Nell'ambito della Named Entity Recognition si è avuto un enorme progresso grazie alle tecnologie di Machine Learning, ma ancora tante sono le applicazioni industriali che usano pratiche di programmazione tradizionali e adoperano Regular Expression. Il nostro obiettivo è provare i due approcci tecnologici - Regular Expression e Machine Learning- e, constatati i relativi punti di forza e debolezza, esaminare un uso combinato di entrambe le tecnologie. Delineiamo poi uno schema Human In the Loop in cui iterativamente si applicano le due tecnologie e l'interazione dell'essere umano con il resto del loop. Il lavoro di estrazione dei dati si basa su documenti della pubblica amministrazione contenenti dati di bandi pubblici. |
---|---|
Relatori: | Maurizio Morisio, Giuseppe Rizzo, Davide Allavena |
Anno accademico: | 2021/22 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 43 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
Aziende collaboratrici: | Synapta Srl |
URI: | http://webthesis.biblio.polito.it/id/eprint/21742 |
Modifica (riservato agli operatori) |