Davide Maietta
Estrazione di entità da testi della Pubblica Amministrazione = Extraction of entities from texts of the Public Administration.
Rel. Maurizio Morisio, Giuseppe Rizzo, Davide Allavena. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract: |
Sviluppo di una metodologia per annotazione automatica di documenti della pubblica amministrazione: Nell'ambito della Named Entity Recognition si è avuto un enorme progresso grazie alle tecnologie di Machine Learning, ma ancora tante sono le applicazioni industriali che usano pratiche di programmazione tradizionali e adoperano Regular Expression. Il nostro obiettivo è provare i due approcci tecnologici - Regular Expression e Machine Learning- e, constatati i relativi punti di forza e debolezza, esaminare un uso combinato di entrambe le tecnologie. Delineiamo poi uno schema Human In the Loop in cui iterativamente si applicano le due tecnologie e l'interazione dell'essere umano con il resto del loop. Il lavoro di estrazione dei dati si basa su documenti della pubblica amministrazione contenenti dati di bandi pubblici. |
---|---|
Relators: | Maurizio Morisio, Giuseppe Rizzo, Davide Allavena |
Academic year: | 2021/22 |
Publication type: | Electronic |
Number of Pages: | 43 |
Subjects: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
Classe di laurea: | New organization > Master science > LM-32 - COMPUTER SYSTEMS ENGINEERING |
Aziende collaboratrici: | Synapta Srl |
URI: | http://webthesis.biblio.polito.it/id/eprint/21742 |
Modify record (reserved for operators) |