polito.it
Politecnico di Torino (logo)

A machine learning models comparison for wildfire susceptibility maps at the regional scale: the case of Liguria region, Italy.

Sara Isnardi

A machine learning models comparison for wildfire susceptibility maps at the regional scale: the case of Liguria region, Italy.

Rel. Luigi Preziosi, Andrea Trucchia. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2021

Abstract:

L'obiettivo di questo lavoro è il confronto tra tre modelli di machine learning e le loro prestazioni per il calcolo delle mappe di suscettibilità relative agli incendi boschivi per la regione Liguria. Le mappe di suscettibilità indicano le aree che sono più soggette ad incendi, a causa delle loro caratteristiche geografiche ed antropiche: sono utili per i programmi di protezione civile volti a diminuire l'impatto di tali eventi perniciosi. Lo studio mira ad approfondire le caratteristiche dei metodi selezionando quello che presenta risultati migliori in termini di accuratezza e di costo computazionale. In una prima parte, vengono descritti i metodi adottati e la Cross Validation (CV) utilizzata per validare ciascun modello. La CV viene utilizzata per migliorare l'accuratezza dei modelli e per ridurre la varianza dopo la fase di addestramento. I modelli utilizzati sono: Support Vector Machine (SVM), Random Forest (RF) e Multi Layer Perceptron (MLP). Il SVM, che viene adattato per ottenere un output probabilistico, assicura buone proprietà di generalizzazione su problemi di classificazione. La RF, utilizzata anche in precedenti studi, fornisce buoni risultati, quindi viene usata come benchmark rispetto allo stato dell'arte. Il MLP è un caso particolare di Rete Neurale: emula la logica del cervello umano per proporre un modello di machine learning per studi di classificazione e regressione. Infine, sono presentati, dopo la scelta dei parametri, gli output generati: le mappe di suscettibilità e la sovrapposizione tra tali mappe ed i poligoni delle aree bruciate. Si evince che tutti i modelli sono in grado di approssimare la distribuzione di probabilità del rischio; anche se la RF è la più accurata perché è in grado di distinguere le aree più pericolose e con maggior probabilità di incendi. Inoltre, vediamo che, anche se è la più lenta, la RF addestrata con variabili sia categoriche che numeriche, anziché solo numeriche, fornisce la migliore curva ROC con il valore più alto di AUC e il più piccolo RMSE. L'importanza delle informazioni ottenute utilizzando tutte le colonne è confermata dall'importanza delle variabili, dove si nota che l'attributo categorico relativo al tipo di vegetazione è quello più importante per la RF. Inoltre, è possibile apprezzare che tutti i risultati sono confermati utilizzando sia one fold CV che five folds CV. Riassumendo, in questa tesi viene dimostrata l'elevata flessibilità dei metodi di machine learning analizzati e che questi sono un buon compromesso in termini di accuratezza e costo computazionale. Si osserva, inoltre, che il confronto di diversi modelli mette in evidenza le qualità dei metodi data driven, che estraggono la conoscenza direttamente dai dati. Il machine learning si dimostra uno strumento affidabile in diversi studi quantitativi relativi agli incendi boschivi, offrendo una valida alternativa ad approcci statistici e numerici standard.

Relatori: Luigi Preziosi, Andrea Trucchia
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 99
Informazioni aggiuntive: Tesi secretata. Fulltext non presente
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Matematica
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-44 - MODELLISTICA MATEMATICO-FISICA PER L'INGEGNERIA
Aziende collaboratrici: Fondazione CIMA
URI: http://webthesis.biblio.polito.it/id/eprint/19865
Modifica (riservato agli operatori) Modifica (riservato agli operatori)