polito.it
Politecnico di Torino (logo)

Analisi multivariata di serie temporali mediante contrastive learning = Multivariate time series analysis based on contrastive learning

Nicola Braile

Analisi multivariata di serie temporali mediante contrastive learning = Multivariate time series analysis based on contrastive learning.

Rel. Luca Cagliero, Francesco Vaccarino. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2022

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (4MB) | Preview
Abstract:

Nella società odierna la produzione di dati temporali è estremamente diffusa. Questo formato dei dati è comune in molti ambiti, a partire da dati finanziari, IoT, sensori in ambito industriale, monitoraggio della salute fino a dati di profilazione dei clienti. La serie sono composte da letture eseguite ad intervalli regolari di una o piu variabili e si distinguono in due categorie: se è presente un'unica variabile si parla di serie univariata altrimenti si tratta di serie multivariata. Nel caso univariato la variabile in osservazione dipende soltanto dai valori passati mentre nel caso multivariato la dipendenza si estende anche alle altre variabili. Le serie temporali multivariate derivano da fenomeni complessi che non possono essere descritti soltanto da modelli univariati. Infatti questi ultimi non possiedono la capacità di catturare le dipendenze tra le diverse variabili che compongono la serie. I modelli multivariati, considerando le relazioni tra le variabili indipendenti, riescono a trarre conclusioni più accurate e vicine alla realtà. Una delle tecniche di apprendimento auto supervisionato allo stato dell'arte nel rapresentation learning applicato alle serie temporali è il Contrastive Learning. Nell’apprendimento auto supervisionato si cerca di imparare la struttura dei dati attraverso l’uso di un task ausiliario. Nel contrastive learning il task è quello del confronto tra un dato ed una versione aumentata dello stesso. Se la rete è in grado di avvicinare queste coppie ed allontanarle da tutte le altre allora dimostra di saper estrarre delle caratteristiche che sono indipendenti dalla trasformazione applicata e quindi ottenere una rappresentazione che racchiude una semantica. Nello svolgimento di questo lavoro è stato utilizzato il framework TS2Vec, che propone una variante del Contrastive Learning capace di estrarre una rappresentazione della serie temporale a diversi livelli di semantica, confrontando in modo gerarchico lungo la dimensione del tempo e delle istanze. La tesi inizialmente si focalizza sull'esplorazione delle performance di TS2Vec in diversi scenari, tra cui classificazione di serie temporali e anomaly detection. Poichè si tratta di una soluzione poco flessibile nella gestione di serie multivariate , sono state proposte e valutate tre soluzioni alternative sempre basate sul Contrastive Learning. Tutti i test di classificazione sono stati condotti sulla collezione di dataset UCR ed UEA mentre i test di anomaly detection sono stati condotti sui dataset Yahoo e KPI. Le tre architetture proposte presentano performance di classificazione migliori rispetto al modello TS2Vec in un'alta percentuale dei dataset multivariati mentre presentano performance comparabili o di poco superiori nel caso univariato. Per quanto riguarda l'anomaly detection i risultati sono inferiori alle aspettative.

Relatori: Luca Cagliero, Francesco Vaccarino
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 86
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/23446
Modifica (riservato agli operatori) Modifica (riservato agli operatori)