Andrea Pio Scaturro
Automatic Documentation Drafting.
Rel. Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2025
|
Preview |
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract
La scrittura e il mantenimento della documentazione rappresentano at- tività essenziali ma spesso trascurate nei progetti di sviluppo software, in particolare in ambito ETL, dove le pipeline evolvono rapidamente. La docu- mentazione manuale risulta non solo time-consuming, ma anche soggetta a inconsistenze dovute alla molteplicità di template e pratiche adottate dai vari sviluppatori. In questa tesi si propone un tool innovativo in grado di generare automa- ticamente la documentazione a partire dal codice sorgente di pipeline ETL realizzate con Apache Airflow e PySpark. Il sistema sfrutta modelli di Ge- nerative AI e tecniche di prompt engineering per estrarre in modo intelli- gente le informazioni rilevanti dal codice, organizzandole in una struttura standardizzata e pubblicandole su piattaforme collaborative come Confluence.
Il progetto, sviluppato in collaborazione con Data Reply, integra servizi cloud di AWS (in particolare SageMaker Studio) e si pone l’obiettivo di ri- durre significativamente il carico di lavoro legato alla manutenzione della documentazione, migliorandone l’accuratezza e la coerenza
Tipo di pubblicazione
URI
![]() |
Modifica (riservato agli operatori) |
