polito.it
Politecnico di Torino (logo)

Text mining e sentiment analysis in ambito sanitario: un approccio community-based

Davide Marino

Text mining e sentiment analysis in ambito sanitario: un approccio community-based.

Rel. Silvia Anna Chiusano. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2020

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (2MB) | Preview
Abstract:

Questo elaborato si preoccupa di descrivere le applicazioni di analisi di dati in ambito medicale. Lo studio presenta come tematica affrontata l’analisi delle recensioni scritte da utenti in lingua inglese e italiana per comprendere il sentimento espresso e il confronto tra le diverse culture. Inizialmente vengono presentate le modalità di reperimento dei dati e la loro formattazione. Cenni di stato dell’arte nell’analisi del linguaggio sono stati descritti per poi approfondire solamente le sezioni che sono interessanti al fine dello studio. Successivamente vengono presentate le scelte sulla pulizia del dataset e della sua trasformazione in una rappresentazione matriciale, più facile da utilizzare per la costruzione del modello semantico. Con l’analisi del sentimento, vengono introdotte le diverse problematiche legate al bilanciamento del dataset e alla sua trasformazione. Viene proposto un confronto tra le tecniche di generazione dei word embedding supervisionate e non, evidenziando le diverse criticità, la complessità algoritmica e la scalabilità come soluzione in base alle metriche ottenute. Nello studio sono state adottate diverse tecniche di apprendimento supervisionato per la costruzione di un classificatore: ognuna sarà presentata con le relative metriche prestazionali. Come conclusioni vengono presentate delle tecniche alternative a quelle adottate per la costruzione di un classificatore e viene suggerita un’integrazione con altri dataset per aumentare il numero di sentimenti che possono essere compresi. Sempre come miglioria possibile, l’applicazione di un modello matematico basato su un meccanismo di tagging potrebbe migliorare l’apprendimento statistico di una rete neurale in modo da generalizzare il più possibile la casistica e non dipendere dal contesto di provenienza.

Relatori: Silvia Anna Chiusano
Anno accademico: 2019/20
Tipo di pubblicazione: Elettronica
Numero di pagine: 104
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: NON SPECIFICATO
URI: http://webthesis.biblio.polito.it/id/eprint/14422
Modifica (riservato agli operatori) Modifica (riservato agli operatori)