Immaginate di creare un video in pochi istanti usando solo la vostra immaginazione. Presto questo sogno diventerà realtà con Sora, l’intelligenza artificiale (AI) generativa che è in grado di generare video a partire da un comando testuale. Al momento Sora non è disponibile pubblicamente, ma solo per una cerchia di esperti selezionati dall’azienda che ne stanno testando rischi, capacità e potenzialità.
In una intervista del 13 marzo al The Wall Street Journal, la direttrice tecnica di OpenAI Mira Murati ha rivelato nuove indiscrezioni sulla data di rilascio e sulle effettive funzioni di Sora. In basso, intanto, un esempio di un video generato con questa intelligenza artificiale.
Come funziona Sora
Sora di OpenAI è un modello di intelligenza artificiale specificamente progettato per la creazione di video. Questo tipo di AI viene definito come un modello di diffusione. Cosa significa? Si tratta di una tecnica innovativa che serve per generare o modificare media digitali con l’ausilio di una intelligenza artificiale generativa. Nel caso di Sora, i video
Sora genera video partendo da ciò che inizialmente appare come rumore statico, simile a un segnale televisivo disturbato. Attraverso una serie di iterazioni, il modello riduce questo rumore, dando forma alle immagini e aggiungendo dettagli e struttura al video. Tutto per formare una sequenza coerente con il comando dato.
Sotto un video creato con Sora; in questo caso il contenuto è animato, mettendo in risalto anche le capacità dell’AI di creare contenuti che possano cambiare il funzionamento dell’industria dell’animazione.
In termini più semplici, l’AI può creare interi video da zero, o estendere video già generati per renderli più lunghi, mantenendo la coerenza del soggetto e del contesto. Ciò significa che, ad esempio, se un personaggio esce momentaneamente dal campo visivo nel video, Sora si sforza di mantenere la continuità logica e visiva quando il soggetto riappare.
Rischi e limitazioni
Non è tutto oro quel che luccica. Sora, come ogni modello di AI, ha le sue limitazioni. Può incontrare difficoltà nel simulare bene interazioni fisiche complesse o nel gestire scene con molteplici elementi e personaggi, il che può talvolta risultare in rappresentazioni imprecise o non naturali.
Come accade anche con altri modelli di generazione delle immagini, poi, l’intelligenza artificiale ha problemi nel generare mani in modo realistico.
Novità su Sora
Secondo quanto ha affermato Mira Murati, Sora sarà non solo in grado di creare video semplici, ma di generare un audio coerente con il materiale prodotto. Il modello di AI, inoltre, dovrebbe essere rilasciato al pubblico entro la fine dell’anno. Le stime più ottimistiche parlano di solo qualche mese.
«Si basa solo su un prompt (un comando) testuale, ed è in grado di creare video belli e iper-realistici lunghi fino a un minuto, ma siamo anche preoccupati per il suo impatto», ha dichiarato Murati.
Ecco perché l’AI sta passando sotto la lente di ingrandimento di vari esperti e tecnici dell’azienda. Il pericolo è l’utilizzo di questa tecnologia per la creazione di video ingannevoli o per la diffusione di notizie false. Un’eventualità che OpenAI vuole evitare a ogni costo.