polito.it
Politecnico di Torino (logo)

Implementazione ed integrazione di modelli non supervisionati e predittivi per la rilevazione di anomalie nelle metriche di performance di una base dati. = Implementation and integration of unsupervised and predictive models for the detection of anomalies in the performance metrics of a database.

Daniela De Angelis

Implementazione ed integrazione di modelli non supervisionati e predittivi per la rilevazione di anomalie nelle metriche di performance di una base dati. = Implementation and integration of unsupervised and predictive models for the detection of anomalies in the performance metrics of a database.

Rel. Tania Cerquitelli, Antonio Greco, Graziano Fracasso. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (10MB) | Preview
Abstract:

In seguito alla continua crescita del settore IT in ambito economico-aziendale, la gestione dei malfunzionamenti assume un ruolo sempre più significativo e rilevante nel mercato odierno. In particolare, diverse imprese si trovano a gestire e mantenere molteplici applicazioni in un ambiente IT condiviso e composto da diverse componenti interdipendenti, rendendo ardua la manutenzione dei servizi. Di conseguenza, è necessario che l’infrastruttura tecnologica venga monitorata e mantenuta, mediante dei servizi specifici. L’obiettivo di questa tesi consiste nella realizzazione di una struttura di base per uno strumento di supporto all’attività di monitoraggio, in grado di garantire una valutazione tempestiva delle problematiche e l’individuazione e visualizzazione puntuale delle metriche di performance di una base di dati che presentano anomalie. Tale soluzione è stata ideata per essere integrata negli strumenti di monitoraggio esistenti in una azienda, con lo scopo di prevenire gli eventi bloccanti mediante identificazione di comportamenti anomali nella base di dati, garantire una più rapida ed efficiente rilevazione e risoluzione dei problemi, diminuire i costi aziendali ed aumentare il livello di credibilità e affidabilità dell’azienda nei confronti del cliente. Il progetto proposto si focalizza sull’analisi e selezione delle metriche di performance più significative della base di dati in esame, e successiva individuazione e confronto delle più opportune metodologie data driven di rilevazione delle anomalie. In particolare, si esegue una selezione delle metriche di performance, basata sull’applicazione iterativa di algoritmi di clustering partizionale e analisi di correlazione basate sul coefficiente di correlazione di Pearson. In seguito, vengono implementati e confrontati due differenti metodi per la rilevazione delle anomalie. Il primo si basa sull’utilizzo di modelli di serie temporali, mentre il secondo sfrutta modelli di apprendimento automatico non supervisionato. Confrontando i due metodi, è emerso che non vi è un metodo nettamente più performante di un altro. Questo a causa delle caratteristiche intrinseche del segnale, che possono inficiare l'efficienza del metodo stesso. Conseguentemente, è stato proposto un modello combinato dei due metodi, che potesse sfruttare i vantaggi di entrambi. Il modello combinato ha fornito dei risultati ottimali in questo lavoro di tesi. In prospettiva futura, tale modello verrà ulteriormente migliorato e utilizzato in altri campi applicativi, per comprenderne le potenzialità e gli aspetti innovativi.

Relatori: Tania Cerquitelli, Antonio Greco, Graziano Fracasso
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 105
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: Mediamente Consulting srl
URI: http://webthesis.biblio.polito.it/id/eprint/21079
Modifica (riservato agli operatori) Modifica (riservato agli operatori)