Ignazio Barraco
Valutazione delle prestazioni delle Reti Neurali Convoluzionali su immagini affette da distorsione = Performance analysis of Convolutional Neural Network applied on distorted images.
Rel. Enrico Masala. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2019
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (39MB) | Preview |
Abstract: |
Il percorso di questa tesi di ricerca ha messo in risalto l'utilizzo delle reti neurali nel contesto di immagini e video e ha mostrato tutte le possibili applicazioni che si possono sviluppare attraverso l’utilizzo delle tecniche di intelligenza artificiale, che sempre più stanno diventando di utilizzo comune nella nostra quotidianità. Così, a partire dai primi capitoli, si è cercato dapprima di fornire delle conoscenze tecnico-matematiche che dessero un buon background su quello che si sarebbe visto in termini applicativi, e poi si è cercato di fornire delle nozioni in merito allo stato dell'arte quali Framework, Dataset, API e possibili applicazioni pratiche, delineando due task principali di analisi: Classificazione di soggetti/oggetti nelle immagini e localizzazione dei soggetti/oggetti in immagini. Altri task secondari analizzati sono stati Segmentazione dei soggetti/oggetti nelle immagini e Tracking dei soggetti nei video. Sviluppando delle piccole "applicazioni" sui diversi framework analizzati, si è cercato di studiare i pattern comportamentali delle reti neurali convolutive(CNN) al variare dell’input quindi immagini, fossero esse in condizione originale o che avessero subito delle distorsioni: applicando blur, noise, variazione di contrasto, riduzione della qualità JPEG, si è cercato di evidenziare determinati pattern comportamentali di una rete con prestazioni elevate. I risultati hanno mostrato che alcune distorsioni impattano maggiormente le prestazioni predittive di una rete, piuttosto che altre, e che possono intervenire anche altri fattori specifici a determinare il risultato predittivo di una rete ;in particolare anche la variazione del task ha portato ad evidenziare dei cambiamenti comportamentali interessanti. Nello specifico, blur e noise, sono maggiormente impattanti per la classificazione di elementi in immagini, intesa come etichettatura dell'elemento in una categoria definita a priori, mentre variazione di contrasto e riduzione di qualità affliggono molto meno le percentuali di predizione; per quanto riguarda la localizzazione degli oggetti, blur, noise e variazione di contrasto mantengono lo stesso comportamento mentre la riduzione della qualità mostra delle leggere variazioni nei pattern. La distorsione delle immagini quindi impatta in maniera consistente e differente il comportamento delle CNN pur non essendo l'unico elemento che interagisce variandone l'accuratezza di predizione. |
---|---|
Relatori: | Enrico Masala |
Anno accademico: | 2019/20 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 139 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
Aziende collaboratrici: | NON SPECIFICATO |
URI: | http://webthesis.biblio.polito.it/id/eprint/13125 |
Modifica (riservato agli operatori) |