Lorenzo Montoro
Cross-Lingual Sentiment Analysis.
Rel. Luca Cagliero, Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2020
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (607kB) | Preview |
Abstract: |
I dati disponibili su internet, e soprattutto le informazioni in essi contenute, sono già numerosissimi ed in costante aumento. Questi dati, che possono trovarsi rappresentati in diversi formati, dai testi alle immagini e i video, sono una miniera di informazioni che ricoprono fondamentale importanza per le aziende di tutto il mondo. Si stima però che circa l'80% di questi dati sia non strutturato, cioè non abbia una rappresentazione ordinata (un database rappresenta dati strutturati per esempio), e siano solitamente testi, immagini, audio e video che necessiterebbero dell'intervento umano per poter essere compresi. La Sentiment Analysis è un'analisi dei testi che sfruttando algoritmi soliti del Natural Language Processing si proprone di estrapolare il sentiment (positivo, negativo o neutro) espresso nel testo analizzato (che può essere una recensione, un tweet, una notizia ecc.), automatizzando quindi l'operazione di estrazione di informazioni da dati non strutturati. In particolare in questa tesi si analizza il problema di espandere la Sentiment Analysis anche ad altre lingue oltre all'inglese, dove i modelli creati fino ad ora già danno ottimi risultati, ma che invece faticano con altre lingue per cui i dati disponibili sono numericamente inferiori. |
---|---|
Relatori: | Luca Cagliero, Paolo Garza |
Anno accademico: | 2020/21 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 58 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
Aziende collaboratrici: | NON SPECIFICATO |
URI: | http://webthesis.biblio.polito.it/id/eprint/16701 |
Modifica (riservato agli operatori) |