polito.it
Politecnico di Torino (logo)

AI-DRIVEN VIDEO GENERATION: ricerca, analisi e utilizzo dei tool di AI video generativa che stanno rivoluzionando il mondo della comunicazione = AI-DRIVEN VIDEO GENERATION: research, analysis and usage of generative AI video tools that are revolutionizing the world of communication

Stefano Tagliente

AI-DRIVEN VIDEO GENERATION: ricerca, analisi e utilizzo dei tool di AI video generativa che stanno rivoluzionando il mondo della comunicazione = AI-DRIVEN VIDEO GENERATION: research, analysis and usage of generative AI video tools that are revolutionizing the world of communication.

Rel. Andrea Bottino, Francesco Strada. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Del Cinema E Dei Mezzi Di Comunicazione, 2024

[img]
Preview
PDF (Tesi_di_laurea) - Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives.

Download (5MB) | Preview
Abstract:

Il lavoro di tesi mira ad offrire una ricerca, un’analisi e un approfondimento sul tema dell’intelligenza artificiale e, in particolare, su una sotto-tipologia che sta assumendo sempre più importanza in ambito tecnologico e creativo, l’AI generativa. Il lavoro è stato svolto in Reply, azienda italiana di consulenza informatica e tecnologica, e comprende un’introduzione generale sull’AI e sulle sue diverse sfaccettature. In seguito, è stata condotta una ricerca sulla logica e sul funzionamento che riguarda l’AI generativa. Quindi, sono stati individuati i diversi approcci con cui la Generative AI si presenta, dalla teoria dei GAN a quella dei modelli di diffusione, fino ad esplorare anche le recenti scoperte e ricerche elaborate da team aziendali. Ne sono un esempio il metodo Emu Video ed è presente una sezione di approfondimento sul funzionamento di tool come Runway. Terminata la prima fase di lavoro di tesi, si è passati ad effettuare una ricerca e un’analisi sui diversi tool dell’AI generativa come: Runway, Kaiber, Genmo, Pika. In particolare, sono state effettuate diverse prove e generazioni che potessero dare un contributo sia dal punto di vista quantitativo che qualitativo. Quantitativo perché si sono ottenuti diversi risultati in output, prima di andare ad individuare i risultati migliori in base agli input dati in ingresso. Qualitativo, invece, dal momento che sono stati selezionati solo alcuni video come ben realizzati e, su questi, sono state date delle considerazioni sia soggettive che oggettive. Nello specifico, i video ottenuti in output dai vari tool AI generatori, vengono confrontati tra di loro per capire quale tool è stato più efficiente in termini di qualità risolutiva e di fedeltà relativa agli elementi inseriti in input. Infatti, le generazioni effettuate sono di tipo Text-to-Video Generation e questo significa che i vari video di output sono stati generati a partire da un prompt testuale inserito in input. Tra i parametri presi in considerazione per la valutazione soggettiva dei diversi tool, troviamo: qualità del rendering e della risoluzione; gli effetti di luci e ombre; il 3D; il fotorealismo; la gamma di colori; la precisione dei dettagli e delle textures degli oggetti generati. Per le valutazioni oggettive sono state poste delle domande a un numero di valutatori umani. In seguito, una volta condotti i test e capiti quali applicativi fossero i migliori, è iniziata la fase di produzione di video AI all’interno dell’azienda Reply, in cui il candidato ha intrapreso uno stage collaborativo. Nello specifico, a partire da alcuni progetti svolti in Reply, è stata prodotta una serie video originale, interamente generata in AI: script, storyboard, image e video generation, voice e audio generation, video editing indicano il flusso di lavoro seguito per la realizzazione. Dai video AI realizzati, prima nei test e poi per l’azienda, si capisce come la nuova tecnologia emergente della Generative AI sta cambiando il modo di realizzare i contenuti multimediali e, soprattutto, sta rivoluzionando il mondo della comunicazione. Il futuro si prepara ad essere rappresentato da questo nuovo medium creativo e questo lavoro di tesi mira ad essere una base approfondita per uno scenario che sarà presto modificato dalle nuove tecnologie emergenti in ambito AI generativa.

Relatori: Andrea Bottino, Francesco Strada
Anno accademico: 2023/24
Tipo di pubblicazione: Elettronica
Numero di pagine: 94
Soggetti:
Corso di laurea: Corso di laurea magistrale in Ingegneria Del Cinema E Dei Mezzi Di Comunicazione
Classe di laurea: Nuovo ordinamento > Laurea magistrale > LM-32 - INGEGNERIA INFORMATICA
Aziende collaboratrici: REPLY SERVICES SRL
URI: http://webthesis.biblio.polito.it/id/eprint/31057
Modifica (riservato agli operatori) Modifica (riservato agli operatori)