polito.it
Politecnico di Torino (logo)

Metodi di machine learning per il riconoscimento di metaplasie gastrointestinali a partire da immagini gastroscopiche = Machine learning methods for the recognition of gastrointestinal metaplasia from gastroscopic images

Marcella Toma

Metodi di machine learning per il riconoscimento di metaplasie gastrointestinali a partire da immagini gastroscopiche = Machine learning methods for the recognition of gastrointestinal metaplasia from gastroscopic images.

Rel. Monica Visintin, Guido Pagana. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Biomedica, 2022

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (5MB) | Preview
Abstract:

Quando cellule differenziate si evolvono in modo diverso da quello fissato dall'ontogenesi si parla di metaplasia. Il persistere dello stimolo che ha indotto la modificazione può indurre una trasformazione neoplastica. Oggetto di questa tesi è la metaplasia gastrointestinale e la progettazione di un metodo di machine learning che sia di sostegno nella relativa diagnosi a partire da immagini gastroscopiche. Le lesioni metaplastiche gastrointestinali presentano una struttura ghiandolare di aspetto tubulo-villoso, pertanto, si propone un riconoscimento automatico di tali pattern al fine di segmentare le zone a rischio. Il database a disposizione si compone di 102 acquisizioni gastroscopiche RGB associate agli esiti istologici relativi alla presenza di metaplasie. Alle immagini patologiche sono affiancate le maschere delle zone metaplastiche, segmentate manualmente da un esperto dell'Azienda Ospedaliera Ordine Mauriziano di Torino. Le immagini sono state acquisite attraverso gastroscopio Pentax MEDICAL in modalità i-SCAN 3 e sono rappresentative di diverse zone anatomiche dello stomaco. Le immagini vengono processate allo scopo di isolarne le porzioni di interesse. Si è scelto di effettuare un pre-processing che prevede l’equalizzazione dell’istogramma delle luminosità e l’applicazione di un filtro gaussiano per la riduzione del rumore, per poi valutarne l’efficacia. Una volta convertite in scala di grigi, le immagini vengono divise in ROI (Regions of Interest) 25x25 con un overlap bidirezionale di 10 pixel. Per ogni ROI, si estraggono diverse tipologie di feature, valutate a partire da Gray-Level Co-Occurrence Matrix (GLCM), istogramma delle luminosità e Gray-Level Run-Length Matrix (GLRLM), per un totale di 20 variabili. Si utilizzano tre diversi Construction Set (CS) che differiscono nella rappresentazione della classe sana. Il CS1 prevede che questa sia rappresentata unicamente da ROI sane estratte da immagini sane. Il CS2 introduce le ROI sane da immagini patologiche come classe a parte, passando ad un problema di classificazione multiclasse con due classi sane ed una patologica. Il CS3 suddivide le ROI sane da immagini patologiche in due cluster i quali vengono assegnati a due classi differenti, per un totale di tre classi sane ed una patologica. Tale clustering si effettua con l’ipotesi di poter distinguere elementi riconducibili a ROI effettivamente sane da misclassificazioni della segmentazione manuale. Ognuna delle tre configurazioni viene combinata con l’assenza o la presenza di pre-processing sulle immagini al fine di costruire sei classificatori. La dimensionalità dei CS viene ridotta attraverso l’impiego della Principal Component Analysis (PCA). Per tutti i classificatori si utilizza un modello ottimizzabile di Random Forest, allenato in concomitanza ad un tuning degli iperparametri mediante un processo di ottimizzazione bayesiana valutato in cross-validation. Dei due classificatori più prestanti nella classificazione pixel per pixel si comparano le performance con e senza l’impiego della PCA. Il classificatore che presenta le prestazioni migliori è il Random Forest costruito a partire dal CS1 estratto da immagini sottoposte a pre-processing e senza l’utilizzo della PCA, con accuratezza bilanciata dell’80,67% ed F1-score del 57,18%. L’applicazione di operatori morfologici sulle maschere di segmentazione automatica permette di ottenere un’accuratezza dell’81,78% ed F1-score del 62,61%.

Relatori: Monica Visintin, Guido Pagana
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 114
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Biomedica
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-21 - INGEGNERIA BIOMEDICA
Aziende collaboratrici: FONDAZIONE LINKS-LEADING INNOVATION & KNOWLEDGE
URI: http://webthesis.biblio.polito.it/id/eprint/23739
Modifica (riservato agli operatori) Modifica (riservato agli operatori)