polito.it
Politecnico di Torino (logo)

IDBN-MINING: DATA MINING IN BASI DI CONOSCENZA MEDIANTE VALUTAZIONE DI MODELLI GRAFICI PROBABILISTICI

Piero Ciffolillo

IDBN-MINING: DATA MINING IN BASI DI CONOSCENZA MEDIANTE VALUTAZIONE DI MODELLI GRAFICI PROBABILISTICI.

Rel. Mauro Gasparini. Politecnico di Torino, Corso di laurea magistrale in Data Science And Engineering, 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (3MB) | Preview
Abstract:

I modelli grafici probabilistici (PGM) rappresentano un ramo dell'apprendimento automatico che fornisce un quadro intuitivo per descrivere le interazioni all'interno dei sistemi con semplice astrazione. Il ragionamento che utilizza i PGM consente di rispondere alle domande di inferenza in termini di incertezza, formalizzata dalla teoria della probabilità. Due tipi classici di PGM sono le reti bayesiane (basate su grafici aciclici diretti) e i campi casuali di Markov (basati su grafici non diretti). Un'utile estensione delle reti bayesiane per il processo decisionale sono i diagrammi di influenza (ID). Gli ID sono modelli decisionali grafici utilizzati per agire in condizioni di incertezza: risolvere un ID significa determinare la strategia ottimale per il decisore e il valore della decisione quando viene applicata tale strategia ottimale. I PGM possono essere utilizzati per costruire sistemi basati sulla conoscenza come guida per esperti di dominio e analisti, in campi diversi come la medicina, l'elaborazione del linguaggio, la visione. Gli ID possono essere chiavi per il supporto decisionale. Quando si tratta di sistemi complessi, il risultato dell'inferenza del modello potrebbe non essere intuitivo. La capacità di interpretare criticamente i risultati è cruciale, quindi sviluppare metodi adeguati per interpretare e spiegare è attualmente un compito ambizioso e stimolante. Molti sforzi di ricerca sono stati dedicati allo sviluppo di metodi e algoritmi per i PGM ed esiste una vasta letteratura. In un primo momento, questo lavoro tenta una breve esposizione sullo stato dell'arte delle tecniche utilizzate per l'inferenza nei BN e per la risoluzione degli ID, insieme alle loro criticità. Oltre ad esplorare i metodi principali, lo scopo di questo lavoro è l'implementazione di un pacchetto in Python di alcuni degli algoritmi studiati e descritti, con personali tentativi di miglioramento. Seguono alcuni approfondimenti relativi al lavoro interdisciplinare, insieme ad esempi applicativi del software sviluppato. Infine, si cercano strategie per spiegare e visualizzare i risultati utilizzando approcci di data mining.

Relatori: Mauro Gasparini
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 94
Soggetti:
Corso di laurea: Corso di laurea magistrale in Data Science And Engineering
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Ente in cotutela: UNIVERSIDAD POLITECNICA DE MADRID - ETS DE INGENIEROS INFORMATICOS (SPAGNA)
Aziende collaboratrici: Universidad Politecnica de Madrid
URI: http://webthesis.biblio.polito.it/id/eprint/25838
Modifica (riservato agli operatori) Modifica (riservato agli operatori)