Gabriele Degola
Approaches for Domain Adaptive Object Detection in Production Environments.
Rel. Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Data Science And Engineering, 2022
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial Share Alike. Download (16MB) | Preview |
Abstract: |
Al giorno d'oggi, la computer vision si basa quasi esclusivamente su metodi di deep learning. La ricerca negli ultimi anni ha migliorato sempre di più le prestazioni delle reti neurali convoluzionali su svariati task fondamentali, come la classificazione, il riconoscimento e la segmentazione di immagini. Tuttavia, questi metodi richiedono grandi quantità di dati annotati per essere addestrati adeguatamente, i quali non sono sempre disponibili. Per questo motivo, i metodi di domain adaptation sono stati abbondantemente studiati e sviluppati. L'obiettivo è trasferire la conoscenza acquisita da un modello di machine learning addestrato su dati annotati, a dati di altri domini per i quali le annotazioni non sono disponibili o solo parzialmente. Un caso emblematico è il trasferimento da dati sintetici (facilmente generabili in grandi quantità) a dati reali (difficili da ottenere e annotare). Questo lavoro si concentra sulla domain adaptation per il riconoscimento di oggetti, con l'obiettivo di identificare metodi che possano essere applicati in ambienti di produzione. Partendo da una panoramica dei metodi fondamentali e di alcuni metodi recentemente proposti, esplora un approccio semplice alla domain adaptation, senza la necessità di introdurre complesse modifiche alle architetture di rete impiegate più comunemente. Allo stesso tempo, tenta di risolvere alcuni problemi dei metodi di domain adaptation più popolari per il riconoscimento di oggetti, che possono ostacolare il loro uso nelle applicazioni reali. Gli esperimenti condotti mostrano che il metodo può essere facilmente applicato dagli ingegneri per ottenere risultati soddisfacenti in progetti reali, laddove risulti complesso procurarsi immagini annotate. |
---|---|
Relatori: | Paolo Garza |
Anno accademico: | 2021/22 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 76 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Data Science And Engineering |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
Ente in cotutela: | INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE (INPG) - ENSIMAG (FRANCIA) |
Aziende collaboratrici: | NEOVISION |
URI: | http://webthesis.biblio.polito.it/id/eprint/22642 |
Modifica (riservato agli operatori) |