polito.it
Politecnico di Torino (logo)

Deep Learning Hardware Accelerator, Nvidia's NVDLA open source evaluation

Yan Wolff

Deep Learning Hardware Accelerator, Nvidia's NVDLA open source evaluation.

Rel. Candido Pirri. Politecnico di Torino, Corso di laurea magistrale in Nanotechnologies For Icts (Nanotecnologie Per Le Ict), 2019

Abstract:

Questo referto è la prova della mia esperienza di stage di sei mesi nel campo della progettazione hardware per Nordic Semiconductor Norway. L'argomento è lo studio del progetto open source NVDLA (Nvidia Deep Learning Accelerator) pubblicato nella primavera del 2018. NVDLA è un progetto software e hardware basato sul progetto dell'acceleratore di apprendimento deep-sensing Xavier SoC per la guida autonoma. Questo hardware è configurabile con un'architettura modulare che può contenere motori di risagoma dati, nuclei di convoluzione, processori di dati planari e processori di dati di canale. Il NVDLA può essere configurato con tutti o solo alcuni di questi elementi. Il NVDLA si collega alla CPU principale tramite un bus di controllo e accede alla memoria tramite due bus AXI (uno è opzionale e solitamente collegato a una memoria a larghezza di banda elevata o SRAM dedicata). Il lavoro di questo tirocinio si interessa in particolare alla configurazione nv_small del NVDLA, un'implementazione a bassa potenza del NVDLA proposta da Nvidia. Sia il modello che la sintesi pre-place&route stimano che la configurazione di nv_small possa raggiungere un'efficienza energetica ottimale di 0,6-1,5 TeraOp / s / W a 50-100Mhz (a seconda della rete in esecuzione), con una larghezza di banda di accesso fissa verso la memoria esterna di 1 GB / s. I migliori processi e i migliori casi limite devono essere determinati per migliorare questi risultati. Le fasi di integrazione portate avanti sono state: generare RTL di nv_small, generare le librerie RAM per il chip, creare il codice per generare i loro wrapper e infine testare le fasi della sintesi e eseguirne il debug. Inoltre, il modo in cui l'architettura e il software lavorano insieme sono stati riassunti ed un modello teorico è stato studiato per dare un'idea delle prestazioni. Al momento della stesura di questo rapporto, NVDLA è un lavoro-in-corso da parte di Nvidia. Ciò che è scritto fornisce le migliori pratiche e suggerimenti su come funzionano gli elementi principali disponibili che dovrebbero rimanere tali nell'ulteriore sviluppo del progetto. Ho cercato di mantenere questo referto il più didattico possibile così che qualsiasi altro non specialista possa leggerlo e possa continuare il progetto. Il lavoro completo di questi 6 mesi è disponibile per i lavoratori della azienda Nordic Semiconductor in un ambiente user-friendly. Tutto il lavoro svolto sulla RTL ed il codice in generale è disponibile su stash.

Relatori: Candido Pirri
Anno accademico: 2018/19
Tipo di pubblicazione: Elettronica
Numero di pagine: 58
Informazioni aggiuntive: Tesi secretata. Fulltext non presente
Soggetti:
Corso di laurea: Corso di laurea magistrale in Nanotechnologies For Icts (Nanotecnologie Per Le Ict)
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-29 - INGEGNERIA ELETTRONICA
Aziende collaboratrici: Nordic Semiconductor ASA
URI: http://webthesis.biblio.polito.it/id/eprint/11710
Modifica (riservato agli operatori) Modifica (riservato agli operatori)