Eugenio Marinelli
Cross Architecture Edit Similarity Join for DNA Data Storage Using oneAPI.
Rel. Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2021
|
Preview |
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
La quantità di dati prodotti è destinato ad aumentare in modo significativo nei prossimi anni. Il problema principale legato alla crescita dei dati è rappresentato dal costo di archiviazione di tali dati. Ciò è dovuto alla limitazione fisica rappresentata dai supporti magnetici attualmente utilizzati per l'archiviazione. Un'alternativa ai supporti magnetici contemporanei è rappresentata dal DNA sintetico, ancora poco studiato, ma che presenta alcune proprietà interessanti - in termini di durata e alta densità - che lo rendono molto promettente. Tuttavia, il processo di recupero dei dati dal DNA è limitato da una procedura chiamata "consenso". L'obiettivo di questa procedura è identificare milioni di stringhe univoche tra centinaia di milioni di copie contenenti errori.
Ciò coinvolge algoritmi di "similarity join" che tuttavia non sono in grado di scalare su tali dataset a causa sia della complessità della metrica utilizzata - edit distance - sia per il loro design single-thread
Relatori
Anno Accademico
Tipo di pubblicazione
Numero di pagine
Corso di laurea
Classe di laurea
Ente in cotutela
Aziende collaboratrici
URI
![]() |
Modifica (riservato agli operatori) |
