Abele Sanzari
BERTopic vs STM: Text Mining su Raccolte di Testi Sintetici di Digital Voice of Customer = BERTopic vs. STM: Text Mining on Collections of Short Texts of Digital Voice of Customer.
Rel. Federico Barravecchia. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Gestionale, 2025
|
|
PDF (Tesi_di_laurea)
- Tesi
Accesso limitato a: Solo utenti staff fino al 26 Novembre 2028 (data di embargo). Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (6MB) |
|
|
Archive (ZIP) (Documenti_allegati)
- Altro
Accesso limitato a: Solo utenti staff fino al 26 Novembre 2028 (data di embargo). Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (96MB) |
Abstract
L'aumento esponenziale di dati digitali ha trasformato il modo in cui le informazioni vengono analizzate, specialmente nel campo del topic modeling, una tecnica fondamentale per l’estrazione automatica di argomenti da vasti corpora testuali. Questo lavoro di tesi si concentra su un'analisi comparativa tra due tra i più utilizzati algoritmi di topic modeling: la Latent Dirichlet Allocation (LDA), nella sua derivazione STM, uno dei modelli statistici più affermati, e BERTopic, un modello più recente basato su tecniche di embedding e clustering. L'obiettivo è valutare quale dei due approcci si dimostri più efficace nell'analisi di testi brevi, un campo in cui i modelli convenzionali spesso faticano a produrre risultati coerenti e significativi.
La tesi è suddivisa in diverse fasi
Relatori
Anno Accademico
Tipo di pubblicazione
Numero di pagine
Corso di laurea
Classe di laurea
Aziende collaboratrici
URI
![]() |
Modifica (riservato agli operatori) |
