Le ultime modelli generativi sono ottime per dimostrazioni, ma stanno davvero per cambiare il modo in cui le persone realizzano film e programmi TV? Non nel breve termine, secondo esperti di produzione cinematografica e VFX - ma nel lungo termine, i cambiamenti potrebbero essere letteralmente al di là della nostra immaginazione.
In un panel al SIGGRAPH di Denver, Nikola Todorovic (Wonder Dynamics), Freddy Chavez Olmos (Boxel Studio) e Michael Black (Meshcapade, Max Planck Institute) hanno discusso del potenziale dell'IA generativa e di altri sistemi per cambiare - ma non necessariamente migliorare - il modo in cui i media vengono creati oggi. Il loro consenso è che mentre possiamo giustamente mettere in dubbio l'utilità di questi strumenti nel futuro immediato, il tasso di innovazione è tale che dovremmo essere pronti per cambiamenti radicali in qualsiasi momento successivo a quello.
Uno dei primi argomenti affrontati è stata la natura impraticabile dei generatori video attuali.
Todorovic ha osservato la "mancata comprensione dell'IA che è una soluzione a un clic, che ti farà ottenere uno scatto VFX finale, e questo è davvero impossibile. Forse ci arriveremo, ma se non hai la modificabilità, quella scatola nera non ti offre molto. Quello che stiamo vedendo ora è che l'esperienza utente è ancora in fase di scoperta - queste aziende di ricerca stanno iniziando a imparare i termini legati al 3D e alla cinematografia".
Black ha sottolineato che il linguaggio manca fondamentalmente della capacità di descrivere alcuni degli aspetti più importanti della creazione visiva.
"Voglio dire, cose come pose di yoga, pose di balletto, ci sono alcune cose classiche per cui abbiamo nomi, che possiamo definire, ma la maggior parte delle cose che facciamo, non abbiamo nomi", ha detto. "E c'è un buon motivo per questo: è perché gli esseri umani hanno dentro di sé un modello generativo di comportamento. Ma non ho un modello generativo di immagini nella mia testa; se voglio spiegarti ciò che sto vedendo, non posso proiettarlo fuori dalle mie orbite o non sono abbastanza bravo artista da disegnarlo per te. Quindi devo usare le parole, e abbiamo molte parole per descrivere il mondo visivo. Ma se voglio descriverti un particolare movimento, non devo descriverlo a parole - lo faccio per te, e poi il tuo sistema motorio mi vede e si attiva nell'interpretarlo. E quindi, penso che ci sia una ragione biologica, una ragione neuroscientifica, per cui non abbiamo parole per tutti i nostri movimenti".
Questo può sembrare un po' filosofico, ma il risultato è che i sistemi di prompt basati su testo per le immagini sono fondamentalmente limitati nel modo in cui possono essere controllati. Persino le centinaia di termini tecnici e artistici usati ogni giorno sul set e in post-produzione sono inadeguati.
Chavez Olmos ha fatto notare che, essendo del Messico, ha avuto poche opportunità di partecipare nel mondo della produzione cinematografica, poiché tutti i soldi e le competenze erano concentrate a LA. Ma ha detto che le competenze in materia di IA (e la domanda ad esse associate) sono più ampiamente distribuite. "Ho dovuto lasciare il Messico perché lì non avevo opportunità; posso vedere, ora, che stessa opportunità per persone che non hanno bisogno di andare all'estero per farlo".
Black, tuttavia, è preoccupato che l'accesso improvviso a questi processi possa avere conseguenze indesiderate nel breve termine.
"Puoi dare a qualcuno una macchina potente, ma questo non lo rende un pilota di Formula Uno, giusto? È un po' quello che abbiamo adesso. La gente sta parlando del fatto che tutti faranno film. Saranno mediocri, onestamente", ha detto. "La democrazia è esattamente ciò che [Chavez Olmos] ha detto, e la potenza è che forse una nuova voce avrà un'opportunità che altrimenti non avrebbe. Ma il numero di persone che fa davvero buoni film sarà comunque limitato, secondo me".
"La vera rivoluzione", ha continuato, "il vero potere di ciò che stiamo vedendo nell'IA è che vedremo un genere completamente nuovo di intrattenimento, e non so esattamente com'è. Prevedo che sarà qualcosa tra videogioco e film e vita reale. L'industria cinematografica è narrativa passiva: sto lì e osservo, è come il teatro o un podcast. Sono il destinatario passivo dell'intrattenimento. Ma nella nostra vita di tutti i giorni, ci raccontiamo storie a vicenda, parliamo di cosa abbiamo fatto nel weekend e così via. E questo è un tipo molto attivo di narrazione interattiva".
Prima che ciò accada, però, Chavez Olmos ha detto di aspettarsi una curva di accettazione più tradizionale per le immagini e gli attori generati dall'IA:
"Avrà la stessa, penso, reazione che abbiamo avuto quando abbiamo visto il primo film 'Final Fantasy' o 'The Polar Express' - qualcosa non sarà ancora del tutto lì, ma le persone inizieranno ad accettare questi film. E invece di un film interamente in CG, sarà un film interamente in IA, che credo vedremo già alla fine di quest'anno. Penso che le persone supereranno questo ostacolo, tipo 'OK, questa è IA,' le persone accetteranno questo."
"La cosa importante è, e Pixar ci ha insegnato questo molto chiaramente: è tutto una questione di storia. È tutto una questione di connettersi ai personaggi. Si tratta di cuore. E se il film ha cuore, non importa se i personaggi sono AI, penso che le persone apprezzeranno il film", ha detto Black. "Questo non significa che non vorranno attori umani. C'è un'emozione nel sapere che sono esseri umani reali come noi, ma molto migliori di noi, vedere un essere umano al massimo delle proprie capacità, ispira tutti noi, e non credo che questo sparirà".