polito.it
Politecnico di Torino (logo)

Privacy preserving per l'analisi dei dati = Privacy preserving data analytics

Stefano Principato

Privacy preserving per l'analisi dei dati = Privacy preserving data analytics.

Rel. Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2022

Abstract:

L'epoca in cui viviamo si può considerare come "era del digitale". Dove milioni di informazioni ogni giorno viaggiano nei nostri dispositivi e nei sistemi informatici di diverse aziende. In questo continuo flusso di dati che scambiamo, capita spesso di inserire informazioni sensibili che riguardano la nostra sfera privata, come foto, video personali, indirizzi, informazioni personali riguardo al nostro stato ed altro ancora, è naturale chiedersi se questi dati sensibili che scambiamo sono veramente al sicuro quando sono salvati online o invece rischiano di essere compromessi. Questo lavoro di tesi verte sull'analisi delle varie proprietà che una collezione di dati all'interno di una base di dati debba avere per garantire sicurezza e anonimato, qualità essenziali per proteggere i dati sensibili. Caratteristiche che garantiscono ad una collezione di dati sicurezza come la K-Anonymity o la l-diversity sono alla base del lavoro di tesi, cosi come lo sono le contromisure che si applicano per garantire integrità ed utilità delle informazioni, inoltre è anche essenziale che i dati conservino utilità, mentre sono anonimizzati. Dopo la fase di ricerca sono passato alla realizzazione di un sistema che applica diverse regole di anonimizzazione, il sistema gestisce, a seguito dell'inserimento di ricerche di vari utenti, con differenti livelli di autorizzazioni, diverse tecniche che sono utilizzate per far rispettare le regole di anonimizzazione come la generalizzazione dei dati, o la soppressione delle informazioni che espongono la privacy di alcuni utenti ad altri che non hanno le corrette autorizzazioni. Il sistema è stato gestito mediante il supporto offerto da Apache Spark, che tramite la sua componente SparkSQL facilità la gestione dei dati e permette di eseguire analisi e stime su grandi quantità di dati in tempi ridotti.

Relatori: Paolo Garza
Anno accademico: 2022/23
Tipo di pubblicazione: Elettronica
Numero di pagine: 82
Informazioni aggiuntive: Tesi secretata. Fulltext non presente
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: Agile Lab S.r.l.
URI: http://webthesis.biblio.polito.it/id/eprint/25560
Modifica (riservato agli operatori) Modifica (riservato agli operatori)