polito.it
Politecnico di Torino (logo)

Modelli di Anomaly Detection in Real Time su piani di esecuzione e metriche di performance di un Database = Real Time Anomaly Detection Models on Execution Plans and Database Performance Metrics

Sonia Regis

Modelli di Anomaly Detection in Real Time su piani di esecuzione e metriche di performance di un Database = Real Time Anomaly Detection Models on Execution Plans and Database Performance Metrics.

Rel. Tania Cerquitelli. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Gestionale, 2022

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview
Abstract:

Questo elaborato ha come obiettivo l’identificazione di modelli di Anomaly Detection in Real Time nell’ambito della gestione dei Database. Un outlier rappresenta un punto che si discosta in maniera considerevole dal resto dei punti appartenenti ad un dataset, di conseguenza con Anomaly Detection si intende la capacità di individuare questi valori anomali. Fulcro centrale dell’elaborato è la Real Time Analytics, ovvero la capacità di rilevare degli insight in tempo reale, che rappresentano delle intuizioni caratterizzate dalla velocità con cui le informazioni vengono fornite una volta raccolti i dati. La trattazione copre l’intero processo di vita dei dati: Data Collection, Ingestion, Extraction, Enrichment and Visualization. Nello specifico è stato effettuato un approfondimento teorico sull’Oracle Database, il contesto principale in cui si sviluppa questa trattazione, e la relativa architettura. Successivamente, grazie all’utilizzo di alcune viste di sistema fornite da Oracle, sono state sviluppate le tematiche dell’Anomaly Detection in tempo reale sui piani di esecuzione e dell’analisi delle metriche di performance di un Database. Si precisa, inoltre, che tutte le analisi effettuate sono relative a basi di dati di produzione di società esistenti collegate alla realtà lavorativa di Mediamente Consulting. Per quanto concerne la valutazione delle performance di un Database, sono state sviluppate delle procedure che monitorano il continuo controllo di parametri rilevanti, del loro raggruppamento per determinare macro-gruppi con comportamenti affini e la rilevazione di valori fuori dalla norma. Successivamente è stato effettuato un approfondimento sulle dinamiche di creazione di nuovi piani di esecuzione per una query, e la conseguente creazione di un nuovo child; questo può portare, sotto un punto di vista pratico, ad una possibile anomalia, il cui rilevamento è determinato dal monitoraggio del tempo di esecuzione del piano. In seguito, valuta se questo abbia generato un peggioramento sul piano delle performance, in termini di tempo e, infine, ne determina le motivazioni alla base. Nel complesso ciò che è stato raggiunto è una situazione di continuo monitoraggio del funzionamento del Database, la capacità di notare eventuali criticità, capirne le cause e agire in maniera più tempestiva rispetto a prima. Infine, si sottolinea l’importanza dell’implementazione di tutte queste funzionalità illustrate e sviluppate nel framework di partenza dell’azienda.

Relatori: Tania Cerquitelli
Anno accademico: 2022/23
Tipo di pubblicazione: Elettronica
Numero di pagine: 80
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Gestionale
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-31 - INGEGNERIA GESTIONALE
Aziende collaboratrici: Mediamente Consulting srl
URI: http://webthesis.biblio.polito.it/id/eprint/24264
Modifica (riservato agli operatori) Modifica (riservato agli operatori)