Assunta Valentina Aprile
Tecniche di esplorazione dei dati spazio-temporali = Spatial-temporal data exploration techniques.
Rel. Tania Cerquitelli. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Gestionale, 2021
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (13MB) | Preview |
Abstract: |
Il clustering dei dati spazio-temporali è una tecnica di data mining che consente il raggruppamento dei dati sulla base della relativa similarità temporale e spaziale. È un campo di interesse relativamente nuovo del data mining che ha attirato sempre più attenzione negli ultimi decenni soprattutto a causa della pervasività dei dispositivi basati sulla posizione e che dunque permettono di tener traccia non solo della componente spaziale, ma anche dell’istante temporale, ed eventualmente di diverse proprietà dell'ambiente. Infatti, grazie alla crescente disponibilità di sensori sempre più economici si è assistiti ad una crescita esponenziale dei dati georeferenziati con frequenze di campionamento sempre più basse. L’evoluzione delle tecnologie di geolocalizzazione e di comunicazione wireless ha generato, in questi ultimi anni, la creazione di una grande quantità di dati geografici: sensori GPS e device mobili producono senza soluzione di continuità dati relativi allo spazio geografico in cui sono localizzati. Tali dati rappresentano una preziosa risorsa e sono difatti utilizzati nel campo dello spatio-temporal data mining per estrarre conoscenza implicita e pattern interessanti non esplicitamente rappresentati. Obiettivo principale della tesi è presentare una overview sul clustering dei dati spazio-temporali nell’ottica di una possibile estensione del framework ADESCA, il quale sposando il concetto di democratizzazione della data analysis, consente l’analisi di dati in modo automatico, al fine di creare un framework utilizzabile anche da utenti “non esperti” di datamining. In particolare, integrando in ADESCA algoritmi di clustering spazio-temporali, è possibile individuare e/o validare trends di fenomeni geografici che si evolvono nel tempo. Infatti, più in generale il clustering è uno degli approcci utilizzati per la modellazione descrittiva dei big data, che consentono di analizzare ed esplorare set di dati per raggruppare gli oggetti in modo tale che vengono inseriti in gruppi, detti appunti cluster, che hanno caratteristiche comuni. Nel caso specifico, i dati spaziotemporali sono caratterizzati da una dimensione spaziale, che esprime la posizione dell’oggetto sulla Terra e corrisponde tipicamente alle coordinate latitudine e longitudine; una dimensione temporale, che descrive l’istante di tempo di validità dell’istanza, corrispondente a esempio all’istante in cui il dato è stato rilevato o salvato nel database; una o più dimensioni collegate a misure non spaziali, che caratterizzano l’istanza (ad esempio, nome, popolazione, tasso di disoccupazione di una città in un certo intervallo di tempo, ecc..) Esempi di dati spaziotemporali sono: temperatura media registrata da diverse stazioni meteorologiche in un certo istante di tempo; numero di casi di malattie registrati in diverse città in un periodo di tempo, ad esempio mensile; metriche per l’inquinamento dell’aria di diverse città in un periodo di tempo, ad esempio con frequenza oraria. |
---|---|
Relatori: | Tania Cerquitelli |
Anno accademico: | 2020/21 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 130 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Gestionale |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-31 - INGEGNERIA GESTIONALE |
Aziende collaboratrici: | NON SPECIFICATO |
URI: | http://webthesis.biblio.polito.it/id/eprint/19059 |
Modifica (riservato agli operatori) |