polito.it
Politecnico di Torino (logo)

Progettazione e sviluppo di una metodologia data-driven per l’identificazione della deriva dei dati. Caso di studio: outlier detection nell’industria 4.0. = Design and development of a data-driven methodology for the identification of data drift. Case study: outlier detection in Industry 4.0.

Angelica Rita Giordano

Progettazione e sviluppo di una metodologia data-driven per l’identificazione della deriva dei dati. Caso di studio: outlier detection nell’industria 4.0. = Design and development of a data-driven methodology for the identification of data drift. Case study: outlier detection in Industry 4.0.

Rel. Tania Cerquitelli, Paolo Bethaz, Riccardo Calla'. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Gestionale, 2020

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (16MB) | Preview
Abstract:

L’avvento della quarta rivoluzione industriale ha permesso lo sviluppo del settore manifatturiero rendendolo sempre più intelligente tramite la fusione del mondo fisico con quello virtuale. In un contesto di “smart manufacturing” tutto è collegato con l’aiuto di sensori e Internet of Things. Grazie a questi dispositivi si è in grado di raccogliere una quantità sempre maggiore di dati che danno informazioni sulla produzione degli impianti. I macchinari nel corso del tempo possono essere soggetti ad anomalie e guasti e, per poterli rilevare, si sfruttano i flussi di dati raccolti con i sensori. In questi casi i dati possono subire dei cambiamenti nella loro distribuzione. Questo fenomeno prende il nome di “concept drift” o “deriva dei dati” e può essere identificato con tecniche di machine learning e in particolare con modelli di classificazione. L’obiettivo di questa tesi è quello di proporre una metodologia data-driven per il rilevamento di tali variazioni dei dati e del degrado del modello adottato. L’approccio scelto è quello di sfruttare le distribuzioni dei dati per avere una soluzione scalabile, innovativa, non supervisionata e in grado di autovalutarsi in modo efficace per indirizzare la stima in tempo reale del degrado del modello. Dopo aver esaminato le tecniche già presenti nello stato dell’arte con algoritmi di classificazione multiclasse, si è cercato di proporre un’alternativa sfruttando il processo di outlier detection maggiormente adatto al contesto del caso di studio presentato. In particolare, sono state usate delle metriche data-driven e unsupervised per il calcolo del degrado del modello e il rilevamento della deriva causata dall’ingresso di nuovi dati non presenti in fase di training. Per fare ciò sono stati analizzati i dati provenienti da un’industria specializzata in processi di automazione e su di essi sono stati eseguiti gli esperimenti per la metodologia proposta.

Relatori: Tania Cerquitelli, Paolo Bethaz, Riccardo Calla'
Anno accademico: 2019/20
Tipo di pubblicazione: Elettronica
Numero di pagine: 166
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Gestionale
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-31 - INGEGNERIA GESTIONALE
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/14906
Modifica (riservato agli operatori) Modifica (riservato agli operatori)