La Cina dimostra ancora una volta di non stare a guardare i colossi americani nel mondo tecnologico e digitale. Al Forum di Zhongguancun 2024, tenutosi a Pechino, è stato presentato un nuovo modello di intelligenza artificiale che potrebbe interessare gli appassionati del settore. Chiamato Vidu, questo modello è il risultato di una collaborazione tra Shengshu Technology e l’Università di Tsinghua. Vidu entra nel mercato come diretto concorrente di Sora, l’IA di OpenAI che ha già fatto parlare di sé all’inizio dell’anno.
La capacità di Vidu di generare video di 16 secondi a risoluzione 1080p da un semplice input di testo pone questo strumento come una valida alternativa. Si basa su una struttura chiamata Universal Vision Transformer (U-ViT), che consente la generazione di scene dinamiche e realistiche, imitando il mondo fisico attraverso angolazioni multiple.
Nonostante le similitudini con Sora, Vidu ha dimostrato alcune peculiarità durante la sua presentazione. È in grado di creare contenuti non solo realistici ma anche surreali, come mostrato negli esempi di un panda che suona la chitarra o una tempesta che irrompe nello studio di un pittore. Questa capacità di mescolare realtà e fantasia potrebbe aprire nuove strade per i creatori di contenuti, specialmente in Cina, dove Vidu sarà inizialmente disponibile in versione beta.
L’arrivo di Vidu non solo segna un ulteriore sviluppo nella competizione dell’intelligenza artificiale generativa introducendo anche una sfida interessante per OpenAI. Entrambi i modelli hanno i loro punti di forza e il futuro dirà chi riuscirà a imporsi come leader nel settore della generazione di video basata su IA, magari con altre gradite soprese per l’utente finale.