Cross Architecture Edit Similarity Join for DNA Data Storage Using oneAPI
Eugenio Marinelli
Cross Architecture Edit Similarity Join for DNA Data Storage Using oneAPI.
Rel. Paolo Garza. Politecnico di Torino, Master of science program in Computer Engineering, 2021
|
Preview |
PDF (Tesi_di_laurea)
- Thesis
Licence: Creative Commons Attribution Non-commercial No Derivatives. Download (2MB) | Preview |
Abstract
La quantità di dati prodotti è destinato ad aumentare in modo significativo nei prossimi anni. Il problema principale legato alla crescita dei dati è rappresentato dal costo di archiviazione di tali dati. Ciò è dovuto alla limitazione fisica rappresentata dai supporti magnetici attualmente utilizzati per l'archiviazione. Un'alternativa ai supporti magnetici contemporanei è rappresentata dal DNA sintetico, ancora poco studiato, ma che presenta alcune proprietà interessanti - in termini di durata e alta densità - che lo rendono molto promettente. Tuttavia, il processo di recupero dei dati dal DNA è limitato da una procedura chiamata "consenso". L'obiettivo di questa procedura è identificare milioni di stringhe univoche tra centinaia di milioni di copie contenenti errori.
Ciò coinvolge algoritmi di "similarity join" che tuttavia non sono in grado di scalare su tali dataset a causa sia della complessità della metrica utilizzata - edit distance - sia per il loro design single-thread
Relators
Publication type
URI
![]() |
Modify record (reserved for operators) |
