Federico Meneghetti
Classificazione testuale basata su summarization per fondi d’investimento = Summarization Based Text Classification for Investment Funds.
Rel. Paolo Garza, Moreno La Quatra. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2023
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract: |
I fondi comuni d'investimento consentono ai piccoli investitori di costruire portafogli diversificati. L'universo dei fondi d'investimento è molto vasto, date le molteplici variabili che li caratterizzano. L'azienda FIDA, specializzata in analisi finanziarie, si occupa dell'organizzazione e classificazione di moltissimi fondi disponibili sul mercato. In questa tesi, si sono sviluppati algoritmi di Natural Language Processing per automatizzare il processo di classificazione dei fondi sulla base di testi che ne descrivono la politica e la finalità. L'approccio utilizzato consiste nell'introduzione di uno step di summarization, eseguito attraverso il fine tuning di architetture Transformer, per condensare in dei riassunit le informazioni dei testi utili alla classificazione. Per la classificazione sono stati poi applicati modelli Transformer e il modello Doc2vec in combinazione con la SVM. La summarization ha mostrato buoni risultati, misurati con le metriche ROUGE e BERTScore. Per quanto riguarda invece la classificazione, si è notato che i riassunti si comportano generalmente meglio rispetto ai testi originali. |
---|---|
Relatori: | Paolo Garza, Moreno La Quatra |
Anno accademico: | 2023/24 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 82 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Matematica |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-44 - MODELLISTICA MATEMATICO-FISICA PER L'INGEGNERIA |
Aziende collaboratrici: | FIDA s.r.l. |
URI: | http://webthesis.biblio.polito.it/id/eprint/29059 |
Modifica (riservato agli operatori) |