polito.it
Politecnico di Torino (logo)

Anomaly detection mediante Contrastive Learning: applicazioni su dati veicolari =  Anomaly detection based on contrastive learning: application to vehicle usage data

Marianna Del Corso

Anomaly detection mediante Contrastive Learning: applicazioni su dati veicolari =  Anomaly detection based on contrastive learning: application to vehicle usage data.

Rel. Francesco Vaccarino, Luca Cagliero. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2022

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (5MB) | Preview
Abstract:

Le serie temporali giocano un ruolo sempre più importante in una moltitudine di ambiti, tra cui il monitoraggio e la manutenzione di macchine industriali. La diffusione dell’Internet of Things ha aumentato la facilità con cui è possibile reperire dati temporali e allo stesso tempo ha evidenziato l’importanza di sviluppare nuovi sistemi in grado di sfruttare l’enorme quantità di informazioni contenuta in tali dati. Uno dei campi maggiormente interessanti nel Machine Learning è l’Anomaly Detection, ossia l’identificazione dell’inaspettato. L’anomaly detection viene applicata in molti contesti, come la sicurezza online, il controllo dei processi industriali o l’analisi del comportamento dei clienti. Nel caso specifico di questa tesi i dati analizzati sono metriche di servizi online e dati provenienti da dispositivi IoT installati su veicoli industriali. Essere in grado di rilevare efficacemente le anomalie in modo automatico è un argomento di grande interesse economico per le aziende. Nel caso della manutenzione di macchine industriali, è estremamente importante essere in grado di individuare e riparare i guasti nel minor tempo possibile, maggiore è il ritardo e maggiore sarà la perdita economica. Le anomalie possono essere di diverso tipo e i comuni sistemi per il loro rilevamento non sono tipicamente in grado di gestire efficacemente tutte le tipologie. Tra le tecniche di machine learning allo stato dell'arte spiccano quelle basate sull'apprendimento auto supervisionato. Quest'ultimo, più noto come self-supervised learning, consente di aumentare la quantità di dati a disposizione adottando strategie di data augmentation ed è in grado di apprendere una rappresentazione dai dati non etichettati sfruttando un compito ausiliario. Questa tesi affronta il problema di anomaly detection sfruttando il Contrastive Learning, una tecnica di apprendimento auto supervisionato basata sul confronto. Il compito ausiliario del contrastive learning consiste nel creare copie alterate di ogni dato. Il modello impara a distinguere quali copie sono state ottenute a partire dallo stesso campione, raggruppandole tra loro e distinguendole da tutti gli altri dati. La risoluzione del task ausiliario forza il modello ad apprendere una rappresentazione migliore dei dati, utilizzabile facilmente per la risoluzione di compiti più complessi come il rilevamento delle anomalie. Il lavoro inizialmente si focalizza sul testing e ottimizzazione di un'architettura per il contrastive learning allo stato dell'arte, il framework TS2Vec, in presenza di anomalie puntuali e di contesto. Un ulteriore contributo del lavoro di tesi è l'analisi e la comparazione delle tecniche di anomaly detection allo stato dell'arte su dati acquisiti da veicoli industriali. L'obiettivo è riconoscere in anticipo l'invio di un Diagnostic Message che segnala una possibile avaria o criticità di particolare rilevanza. I test vengono condotti su dati provenienti da quattro dataset contenenti misurazioni normali e anomale etichettate. I risultati ottenuti hanno evidenziato quanto sia difficile sviluppare un sistema di anomaly detection in grado di funzionare in ambiti diversi e con anomalie di tipo diverso. Il contesto applicativo costituisce un aspetto fondamentale nella scelta degli strumenti di analisi. Per alleviare le criticità riscontrate è necessario ottimizzare ulteriormente l’architettura di base aggiungendo dei componenti che si concentrino maggiormente sul contesto.

Relatori: Francesco Vaccarino, Luca Cagliero
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 76
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/23449
Modifica (riservato agli operatori) Modifica (riservato agli operatori)