Riconoscimento di fake news in lingua italiana mediante analisi di contenuti multimodali = Fake news recognition in the Italian language through multimodal content analysis

Lorenzo D'Amico

Riconoscimento di fake news in lingua italiana mediante analisi di contenuti multimodali = Fake news recognition in the Italian language through multimodal content analysis.

Rel. Luca Cagliero, Lorenzo Vaiani, Davide Napolitano. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2023

Preview

PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.
Download (4MB) | Preview

Abstract:	Nell'era dell'informazione digitale, la diffusione delle fake news rappresenta una sfida significativa per la società contemporanea. L'ampia disponibilità di strumenti per la creazione e condivisione dei contenuti ha amplificato la portata e la velocità di propagazione di notizie false, rendendole un fenomeno pervasivo e pericoloso. Informazioni intenzionalmente distorte o inventate hanno la capacità di influenzare l'opinione pubblica e manipolare le percezioni, con conseguenze politiche, sociali ed economiche. Più nello specifico possono influenzare l'esito delle elezioni, alimentare conflitti sociali, danneggiare reputazioni personali e aziendali, e mettere a rischio la salute e la sicurezza pubblica. L'identificazione e il contrasto delle fake news rappresenta una priorità cruciale per garantire l'integrità e l'affidabilità dell'informazione. In questo contesto, l'utilizzo dell'Intelligenza Artificiale offre un potenziale significativo. Le scoperte nel campo dell'analisi del linguaggio naturale e delle reti neurali hanno permesso lo sviluppo di metodi avanzati per l'interpretazione del testo e per l'estrazione di informazioni rilevanti dalle immagini. L'obiettivo di questo lavoro è quello di sviluppare un modello multimodale di Intelligenza Artificiale basato sul Deep Learning. In particolare è stato realizzato un sistema che, data una notizia composta da testo e immagini associate, è in grado di valutarne l'autenticità. Il contesto visivo è stato utilizzato per supportare o confutare le informazioni presentate nel testo. Sono state utilizzate le potenzialità dei modelli Transformer e delle reti neurali convoluzionali per risolvere un task di classificazione multiclasse in cui le etichette corrispondono a diversi livelli di veridicità delle notizie. Il lavoro è stato sviluppato in parallelo alla partecipazione alla competizione MULTI-Fake-DetectiVE, co-locata al workshop EVALITA 2023 per l'etica computazionale. Dopo aver presentato la teoria alla base del progetto, uno studio approfondito del dataset usato per l'apprendimento e la realizzazione di modelli di riferimento, è stato sviluppato un metodo per l'analisi di testi di lunghezza arbitraria. Sono successivamente state esplorate diverse estensioni su un modello stato dell'arte pre-esistente in letteratura per affrontare le sfide dell'identificazione delle fake news. Queste estensioni si sono basate sull'analisi del sentimento, la generazione di nuovi sample per il bilanciamento delle classi, l'analisi delle immagini nel dominio della frequenza, l'unione efficiente delle rappresentazioni testuali e visive, un'aggregazione migliore di quest'ultime e la focalizzazione su parti specifiche delle immagini. I risultati ottenuti dimostrano che il modello sviluppato supera le performance delle baseline e hanno permesso di ottenere il primo posto nella competizione, confermando l'enorme potenziale dell'Intelligenza Artificiale nell'analisi di dati che presentano diverse modalità.
Relatori:	Luca Cagliero, Lorenzo Vaiani, Davide Napolitano
Anno accademico:	2022/23
Tipo di pubblicazione:	Elettronica
Numero di pagine:	99
Soggetti:
Corso di laurea:	Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea:	Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici:	NON SPECIFICATO
URI:	http://webthesis.biblio.polito.it/id/eprint/27733

Modifica (riservato agli operatori)