Gianluca Fino
Sentiment analysis using ensemble methods: an application to Twitter.
Rel. Roberto Fontana. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2019
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (4MB) | Preview |
Abstract: |
Il seguente elaborato si concentra principalmente su un’applicazione del natural language processing, chiamata sentiment analysis, e sugli ensemble methods (metodi d’insieme). Inizialmente vengono presentate le modalità con cui, tramite Python, si ottengono i dati da Twitter (utilizzando una procedura chiamata scraping) e si costruisce un data set con la frequenza delle parole più utilizzate da nove personaggi della politica italiana. Successivamente si utilizza il software SAS per fare un’analisi descrittiva e per ricercare una somiglianza di linguaggio fra i politici in esame. Questa prima parte dell’elaborato, svolta durante il periodo di tirocinio, ha ispirato l’analisi del sentimento e quanto presentato successivamente. Lo sviluppo della tesi prosegue con lo studio della classificazione applicata al text mining. Vengono trattati gli algoritmi più comuni in questo ambito e le modalità di valutazione delle loro performance. Vengono proposti una serie di metodi, comunemente chiamati ensemble methods che, con lo scopo di ottenere una classificazione più accurata, combinano i modelli precedenti. Viene spiegata in dettaglio l’analisi del sentimento, con particolare interesse per il suo ramo legato alla classificazione delle emozioni umane. Ne viene presentata un’applicazione in cui alcuni tweet, scaricati dal profilo di un personaggio di fama mondiale, vengono associati ad un’emozione tramite l’uso degli ensemble methods. |
---|---|
Relatori: | Roberto Fontana |
Anno accademico: | 2018/19 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 84 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Matematica |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-44 - MODELLISTICA MATEMATICO-FISICA PER L'INGEGNERIA |
Aziende collaboratrici: | NON SPECIFICATO |
URI: | http://webthesis.biblio.polito.it/id/eprint/10363 |
Modifica (riservato agli operatori) |