polito.it
Politecnico di Torino (logo)

Sviluppo e Implementazione di un algoritmo di Machine Learning per il riconoscimento di pazienti affetti da Malattie Sessualmente Trasmissibili = Development and Implementation of a Machine Learning algorithm for the recognition of patients suffering from Sexually Transmitted Diseases

Virginia Pastorini

Sviluppo e Implementazione di un algoritmo di Machine Learning per il riconoscimento di pazienti affetti da Malattie Sessualmente Trasmissibili = Development and Implementation of a Machine Learning algorithm for the recognition of patients suffering from Sexually Transmitted Diseases.

Rel. Gabriella Olmo, Federica Semproni. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Biomedica, 2021

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (14MB) | Preview
Abstract:

Le Malattie Sessualmente Trasmissibili (MST) sono uno dei problemi più diffusi nel mondo e spesso la loro trasmissione è dovuta alla mancanza di informazione: infatti esse coinvolgono particolarmente adolescenti o giovani adulti, i quali frequentemente affrontano con imbarazzo questi temi. Si intende quindi creare, con il progetto Bridge, un portale in grado di fornire affidabili informazioni relative a questa tematica, del quale uno degli elementi principali è un questionario, che intende concentrarsi sulle MST più diffuse in Italia, cioè Clamidia, Condiloma ano-genitale, Gonorrea, Herpes genitale, HIV e Sifilide. Lo scopo del questionario è informativo, non diagnostico: si intende infatti fornire all’utente il grado di rischio di aver contratto una MST e una serie di informazioni utili relative al singolo caso, in modo da incoraggiare innanzitutto una visita medica e successivamente alcune soluzioni e/o informazioni sulla base delle risposte fornite. Il presente lavoro di tesi si pone come obiettivo principale l’ottimizzazione e il miglioramento dell’efficacia del questionario e il riconoscimento dei pazienti che hanno contratto una MST. A tal fine sono stati raccolti i dati, ovvero le risposte al questionario, dai pazienti che si sono recati nei consultori di 13 regioni d’Italia e che hanno deciso di contribuire al progetto. A causa dell’attuale pandemia da Covid-19 e la conseguente riduzione di affluenza di pazienti nei consultori, si è deciso di lavorare temporaneamente su un dataset simulato, ovvero con risposte inviate dai medici e/o specializzandi, ai quali viene chiesto di immedesimarsi in un paziente con una specifica patologia o un paziente sano. Il fine ultimo dell’analisi dei dati svolta consiste nell’ implementazione di un algoritmo, che utilizza la clusterizzazione mediante reti neurali SOM (Self-Organizing Map) per distinguere inizialmente i pazienti sani dai pazienti affetti dalle patologie indicate e, contemporaneamente, un Algoritmo Genetico per la selezione delle domande del questionario necessarie e sufficienti per il raggiungimento di soddisfacenti prestazioni della rete neurale precedente. Le domande selezionate in quest’ultima fase sono state confrontate con i risultati di una ricerca bibliografica volta a identificare il valore della domanda per la distinzione di ogni singola patologia. Un’ulteriore indagine è stata svolta per l’analisi delle singole patologie nei clusters ottenuti, in modo tale da verificare un possibile riconoscimento successivo della singola patologia del soggetto. Il lavoro di tesi presentato rappresenta un’analisi in fase preliminare, in quanto il numero di dati del dataset simulato conta 314 pazienti, di cui 90 pazienti sani. Inoltre, in una fase successiva, l’algoritmo dovrà essere validato mediante l’utilizzo del dataset costituito dai dati reali dei pazienti, che risultano ad oggi essere in numero troppo esiguo. In conclusione, la procedura di selezione delle domande ha prodotto risultati soddisfacenti per questa fase preliminare: si registra infatti un miglioramento nella clusterizzazione a seguito della riduzione delle domande utilizzate dall’algoritmo, comportando un miglioramento nella distinzione dei pazienti sani dai pazienti malati.

Relatori: Gabriella Olmo, Federica Semproni
Anno accademico: 2021/22
Tipo di pubblicazione: Elettronica
Numero di pagine: 123
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Biomedica
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-21 - INGEGNERIA BIOMEDICA
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/20159
Modifica (riservato agli operatori) Modifica (riservato agli operatori)