polito.it
Politecnico di Torino (logo)

Approaches for Domain Adaptive Object Detection in Production Environments

Gabriele Degola

Approaches for Domain Adaptive Object Detection in Production Environments.

Rel. Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Data Science And Engineering, 2022

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial Share Alike.

Download (16MB) | Preview
Abstract:

Al giorno d'oggi, la computer vision si basa quasi esclusivamente su metodi di deep learning. La ricerca negli ultimi anni ha migliorato sempre di più le prestazioni delle reti neurali convoluzionali su svariati task fondamentali, come la classificazione, il riconoscimento e la segmentazione di immagini. Tuttavia, questi metodi richiedono grandi quantità di dati annotati per essere addestrati adeguatamente, i quali non sono sempre disponibili. Per questo motivo, i metodi di domain adaptation sono stati abbondantemente studiati e sviluppati. L'obiettivo è trasferire la conoscenza acquisita da un modello di machine learning addestrato su dati annotati, a dati di altri domini per i quali le annotazioni non sono disponibili o solo parzialmente. Un caso emblematico è il trasferimento da dati sintetici (facilmente generabili in grandi quantità) a dati reali (difficili da ottenere e annotare). Questo lavoro si concentra sulla domain adaptation per il riconoscimento di oggetti, con l'obiettivo di identificare metodi che possano essere applicati in ambienti di produzione. Partendo da una panoramica dei metodi fondamentali e di alcuni metodi recentemente proposti, esplora un approccio semplice alla domain adaptation, senza la necessità di introdurre complesse modifiche alle architetture di rete impiegate più comunemente. Allo stesso tempo, tenta di risolvere alcuni problemi dei metodi di domain adaptation più popolari per il riconoscimento di oggetti, che possono ostacolare il loro uso nelle applicazioni reali. Gli esperimenti condotti mostrano che il metodo può essere facilmente applicato dagli ingegneri per ottenere risultati soddisfacenti in progetti reali, laddove risulti complesso procurarsi immagini annotate.

Relatori: Paolo Garza
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 76
Soggetti:
Corso di laurea: Corso di laurea magistrale in Data Science And Engineering
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Ente in cotutela: INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE (INPG) - ENSIMAG (FRANCIA)
Aziende collaboratrici: NEOVISION
URI: http://webthesis.biblio.polito.it/id/eprint/22642
Modifica (riservato agli operatori) Modifica (riservato agli operatori)