polito.it
Politecnico di Torino (logo)

Valutazione delle prestazioni delle Reti Neurali Convoluzionali su immagini affette da distorsione = Performance analysis of Convolutional Neural Network applied on distorted images

Ignazio Barraco

Valutazione delle prestazioni delle Reti Neurali Convoluzionali su immagini affette da distorsione = Performance analysis of Convolutional Neural Network applied on distorted images.

Rel. Enrico Masala. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2019

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (39MB) | Preview
Abstract:

Il percorso di questa tesi di ricerca ha messo in risalto l'utilizzo delle reti neurali nel contesto di immagini e video e ha mostrato tutte le possibili applicazioni che si possono sviluppare attraverso l’utilizzo delle tecniche di intelligenza artificiale, che sempre più stanno diventando di utilizzo comune nella nostra quotidianità. Così, a partire dai primi capitoli, si è cercato dapprima di fornire delle conoscenze tecnico-matematiche che dessero un buon background su quello che si sarebbe visto in termini applicativi, e poi si è cercato di fornire delle nozioni in merito allo stato dell'arte quali Framework, Dataset, API e possibili applicazioni pratiche, delineando due task principali di analisi: Classificazione di soggetti/oggetti nelle immagini e localizzazione dei soggetti/oggetti in immagini. Altri task secondari analizzati sono stati Segmentazione dei soggetti/oggetti nelle immagini e Tracking dei soggetti nei video. Sviluppando delle piccole "applicazioni" sui diversi framework analizzati, si è cercato di studiare i pattern comportamentali delle reti neurali convolutive(CNN) al variare dell’input quindi immagini, fossero esse in condizione originale o che avessero subito delle distorsioni: applicando blur, noise, variazione di contrasto, riduzione della qualità JPEG, si è cercato di evidenziare determinati pattern comportamentali di una rete con prestazioni elevate. I risultati hanno mostrato che alcune distorsioni impattano maggiormente le prestazioni predittive di una rete, piuttosto che altre, e che possono intervenire anche altri fattori specifici a determinare il risultato predittivo di una rete ;in particolare anche la variazione del task ha portato ad evidenziare dei cambiamenti comportamentali interessanti. Nello specifico, blur e noise, sono maggiormente impattanti per la classificazione di elementi in immagini, intesa come etichettatura dell'elemento in una categoria definita a priori, mentre variazione di contrasto e riduzione di qualità affliggono molto meno le percentuali di predizione; per quanto riguarda la localizzazione degli oggetti, blur, noise e variazione di contrasto mantengono lo stesso comportamento mentre la riduzione della qualità mostra delle leggere variazioni nei pattern. La distorsione delle immagini quindi impatta in maniera consistente e differente il comportamento delle CNN pur non essendo l'unico elemento che interagisce variandone l'accuratezza di predizione.

Relatori: Enrico Masala
Anno accademico: 2019/20
Tipo di pubblicazione: Elettronica
Numero di pagine: 139
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/13125
Modifica (riservato agli operatori) Modifica (riservato agli operatori)