polito.it
Politecnico di Torino (logo)

Modelli di Anomaly Detection per il monitoraggio di una base di dati in Oracle = Anomaly Detection for Oracle Database monitoring

Ilaria Varacalli

Modelli di Anomaly Detection per il monitoraggio di una base di dati in Oracle = Anomaly Detection for Oracle Database monitoring.

Rel. Tania Cerquitelli. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Gestionale, 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview
Abstract:

Il lavoro di ricerca, svolto all'interno della business unit di Infrastruttura Tecnologica dell'azienda Mediamente Consulting Srl, si inserisce nell’ottica di una sempre più accurata ottimizzazione dei processi aziendali per la gestione delle infrastrutture informatiche, in cui il monitoraggio dei sistemi informatici ne costituisce uno dei punti di valore. L’idea di partenza di questa ricerca è l’integrazione ai tradizionali sistemi di monitoraggio di uno strumento di supporto che semplifichi tale attività. In questo senso il lavoro svolto è nato con l’obiettivo di proseguire l’indagine, già iniziata in azienda attraverso altre tesi precedenti, sulle potenzialità e sulle applicazioni del data mining ai sistemi di monitoraggio dell’infrastruttura. Nello specifico, il caso oggetto di studio va alla ricerca di metriche, anche appartenenti a categorie diverse, con un andamento similare e indaga sulle possibilità di distinguere i momenti di stress per il database dal normale funzionamento. Per fare ciò è stato creato un ambiente costituito da un'istanza di base dati sulla quale sono stati eseguiti dei test mirati e simulativi di un contesto reale, tramite l'utilizzo dei benchmarks Order Entry e Sales History di Swingbench in parallelo anche ad uno stress test personalizzato. Per la fase di analisi sono state prese in considerazione quelle metriche ritenute significative ai fini della descrizione dello stato del sistema, in particolare le metriche riguardanti il carico del database, le risorse interne ed esterne utilizzate, l'utilizzo della CPU, le prestazioni del disco e del suo sottoinsieme di I/O e eventi di attesa. I dati sono stati, quindi, catalogati e sottoposti a diversi modelli matematici (Kmeans, DBSCAN, Decision Tree, Random Forest e XGBoost) dopo una fase di preprocessing. Il lavoro si è orientato verso la ricerca di un modello da preferire nell’ambito della classificazione e del clustering. In termini di accuratezza, precision e recall si è notato che, tra gli algoritmi supervisionati analizzati, XGBoost riesce a classificare meglio i momenti di stress distinguendoli dal funzionamento base. Tra gli algoritmi non supervisionati, invece, in termini di densità dei cluster e valori del coefficiente di Silhouette, il Kmeans risulta più performante.

Relatori: Tania Cerquitelli
Anno accademico: 2020/21
Tipo di pubblicazione: Elettronica
Numero di pagine: 85
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Gestionale
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-31 - INGEGNERIA GESTIONALE
Aziende collaboratrici: Mediamente Consulting srl
URI: http://webthesis.biblio.polito.it/id/eprint/19063
Modifica (riservato agli operatori) Modifica (riservato agli operatori)