Matteo Celia
Uno studio comparativo delle equazioni differenziali ordinarie neurali e degli operatori neurali per la modellazione delle dinamiche temporali.
Rel. Daniele Apiletti, Simone Monaco. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2024
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (6MB) | Preview |
Abstract: |
Riuscire a catturare l'intricato comportamento tridimensionale (3D) dei sistemi relazionali è una sfida cruciale nelle scienze naturali, con applicazioni che vanno dalla simulazione delle interazioni molecolari all'analisi della meccanica delle particelle. Gli approcci di machine learning hanno fatto passi da gigante in questo settore, utilizzando le reti neurali a grafo per apprendere e rappresentare efficacemente le interazioni spaziali. Le Neural Ordinary Differential Equation (NODE) e i neural operator (NO) rappresentano due approcci potenti, ma distinti, per affrontare questo problema. Mentre le NODE eccellono nella modellazione in tempo continuo utilizzando risolutori di equazioni differenziali, gli Operatori Neurali possono gestire dinamiche più complesse attraverso condizioni iniziali variabili imparando il mapping funzionale. Tuttavia, non è ancora chiaro quale struttura sia più efficace o efficiente in generale e rispetto a domini specifici come la modellazione dell'evoluzione temporale di sistemi complessi, come i sistemi di particelle cariche. Confrontando sistematicamente i modelli NODE e NO, questa ricerca mira a identificare i vantaggi e i limiti specifici di ciascun approccio, fornendo indicazioni sulla loro efficacia in un dominio applicativo specifico. Questa esplorazione può quindi contribuire a sviluppare una comprensione più profonda di questi metodi emergenti e aiutare a informare la futura selezione di modelli per sistemi dinamici intricati come quello in analisi. Negli ultimi anni sono state proposte diverse varianti dei suddetti approcci per affrontare questo tipo di problemi. Tra queste, vi sono quelle su cui si concentra il presente lavoro: SEGNO (NODE) ed EGNO (NO). Entrambe le architetture utilizzano grafi per rappresentare le relazioni tra gli oggetti di un sistema e sono equivarianti, ovvero le loro previsioni non cambiano se il sistema di input viene ruotato, traslato o riflesso, introducendo nuovi meccanismi per migliorare la loro capacità di generalizzazione. Sono stati condotti diversi esperimenti per mostrare le rispettive capacità e i difetti di entrambe le architetture. In particolare, il punto principale consiste nell'analizzare la capacità dei modelli di prevedere traiettorie multi-step in modo rollout, e come il numero di steps in input influisca sulla loro capacità di ricostruire la dipendenza a lungo raggio nei dati, considerando anche la distanza variabile tra i timesteps. I risultati mostrano i limiti e i vantaggi delle due architetture nel gestire serie temporali irregolari e un diverso numero di istantanee in ingresso. |
---|---|
Relatori: | Daniele Apiletti, Simone Monaco |
Anno accademico: | 2024/25 |
Tipo di pubblicazione: | Elettronica |
Numero di pagine: | 68 |
Soggetti: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
Classe di laurea: | Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA |
Aziende collaboratrici: | Politecnico di Torino |
URI: | http://webthesis.biblio.polito.it/id/eprint/33779 |
Modifica (riservato agli operatori) |