polito.it
Politecnico di Torino (logo)

Fault detection and explanation applied to engine control unit data = Fault detection and explanation applied to engine control unit data

Francesco Saracco

Fault detection and explanation applied to engine control unit data = Fault detection and explanation applied to engine control unit data.

Rel. Francesco Vaccarino. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview
Abstract:

Il rilevamento delle anomalie è un importante campo di ricerca nella letteratura sul Machine Learning e sull'Intelligenza Artificiale, in particolare nelle applicazioni industriali. L'identificazione efficace e precoce di problemi in un processo industriale è fondamentale per operare interventi immediati, evitare danni e quindi ridurre i costi. Tuttavia, una questione spesso trascurata nel contesto della rilevazione delle anomalie è quella della spiegazione delle anomalie, sacrificando così l'interpretabilità. Il sistema di anomaly detection diventa così una cosiddetta "scatola nera", di cui ci si può fidare solo ciecamente. Questa tesi, ospitata da Data Reply, presenta un algoritmo basato su ML finalizzato all'estrazione di regole human-comprehensible che caratterizzano e spiegano la classe anomala nel contesto di un dataset supervisionato con etichette binarie, ottenuto da una precedente fase di anomaly detection. Può essere considerata come un'estensione di quest'ultima, fornendo una maggiore interpretabilità del rilevamento delle anomalie e spiegando quali caratteristiche le distinguono dai normali data points. In particolare, una Random Forest viene costruita sul dataset etichettato, al fine di apprendere le caratteristiche salienti della classe anomala. Quindi, viene impiegata una procedura di ricerca euristica per selezionare, dall'insieme di tutte le regole di cui è composta la RF, un sottoinsieme che ottimizzi una misura di performance adeguata. Quest'ultimo passo permette di ridurre il numero totale di regole a un livello gestibile, mantenendo allo stesso tempo più informazioni possibili. La soluzione proposta è stata applicata a un caso automotive su dati raccolti da unità di controllo motore su veicoli industriali per un'importante multinazionale cliente, leader nello sviluppo, produzione, vendita e assistenza di gruppi motore per applicazioni on-road, off-road, marine e di generazione di energia. L'obiettivo era quello di ottenere, a partire dai dati che descrivono il funzionamento dei veicoli, una caratterizzazione delle condizioni di guasto del sistema che fosse efficace nel rilevare i problemi e comprensibile per i professionisti dell'azienda cliente. Questo permetterebbe di investigare ulteriormente le anomalie sfruttando queste regole come punto di partenza per i test e le operazioni sul campo. L'algoritmo è stato testato su una flotta di veicoli che avevano problemi noti, al fine di convalidare i risultati ottenuti attraverso il giudizio e la conoscenza di dominio dei professionisti della società cliente. I risultati ottenuti sono stati trovati soddisfacenti da quest'ultima ed un progetto di follow up ha ricevuto un finanziamento dall'azienda cliente.

Relatori: Francesco Vaccarino
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 95
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Matematica
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-44 - MODELLISTICA MATEMATICO-FISICA PER L'INGEGNERIA
Aziende collaboratrici: DATA Reply S.r.l. con Unico Socio
URI: http://webthesis.biblio.polito.it/id/eprint/20784
Modifica (riservato agli operatori) Modifica (riservato agli operatori)