Ícono del sitio TechGames

OpenAI Sora convierte los textos en videos ultra realistas

OpenAI Sora austronata
Comparte

El avance de OpenAI en la creación de video sigue adelante con el lanzamiento de Sora. La nueva aplicación espera dominar el cine sin ir a la escuela de cine.

Sora, que por ahora es un producto de investigación, se crea para unos cuantos creadores y a varios expertos en seguridad, que lo someterán a un examen para detectar vulnerabilidades de seguridad. 

Cabe señalar que OpenAI tiene previsto ponerlo a disposición de todos los aspirantes a autores en una fecha no especificada.

Aunque las escenas son ciertamente impresionantes, las capacidades más sorprendentes de Sora son aquellas para las que no es entrenado. 

Gracias a una versión del modelo de difusión usado por el generador de imágenes DALL-E 3 de OpenAI y al motor basado en transformadores de GPT-4, Sora no se limita a producir videos que satisfacen las demandas de las instrucciones, sino que lo hace de una forma que demuestra una comprensión emergente de la gramática cinematográfica.

Bill Peebles, investigador del proyecto, señala que Sora crea un empuje narrativo gracias a sus ángulos de cámara y a la sincronización. “En realidad, hay varios cambios de plano: no están cosidos, sino generados por el modelo de una sola vez. No le dijimos que lo hiciera, lo hizo automáticamente”

Sora podrá sacar videos a partir de una imagen

La capacidad de generar videos a partir de una sola imagen o una secuencia de fotogramas es una de sus funciones, aunque por el momento no se muestra pero se espera que esté lista más adelante. 

“Esta va a ser otra forma realmente genial de mejorar las capacidades de narración. Puedes dibujar exactamente lo que tienes en mente y luego animarlo para que cobre vida”. 

OpenAI es consciente de que esta función también tiene el potencial de producir deepfakes y desinformación. Por lo que serán Vamos a ser muy cuidadosos con todas las implicaciones de seguridad de esto”, añade Peebles.

Mismas restricciones que DALL-E 3

Sora tendrá las mismas restricciones de contenido que DALL-E 3: nada de violencia, nada de porno, nada de apropiarse de personas reales o del estilo de artistas conocidos.

Al igual que en DALL-E 3, OpenAI ofrecerá a los espectadores la posibilidad de identificar los resultados como creados por la IA. Aun así, OpenAI afirma que la seguridad y la veracidad es un problema continuo que va más allá de una empresa.

“La solución a la desinformación implicará cierto nivel de mitigación por nuestra parte, pero también necesitará la comprensión de la sociedad y que las redes sociales se adapten”, Aditya Ramesh, investigador principal y jefe del equipo de DALL-E 3.

Otro posible problema es si el contenido del video que produce Sora infringe los derechos de autor de otros.

“Los datos de entrenamiento proceden de contenidos cuya licencia hemos adquirido y también de contenidos de dominio público”, Peebles. Por supuesto, el meollo de una serie de demandas contra OpenAI gira en torno a la cuestión de si los contenidos protegidos por derechos de autor “disponibles públicamente” son lícitos para el entrenamiento de la IA.

Pasará mucho tiempo, si es que llega a pasar, antes de que la conversión de texto en video amenace a la producción cinematográfica real. No, no se pueden hacer películas coherentes juntando 120 clips de Sora de un minuto de duración, ya que el modelo no responderá a las instrucciones exactamente de la misma manera: la continuidad no es posible.

Pero el límite de tiempo no es un obstáculo para que Sora y programas similares transformen TikTok, Reels y otras plataformas sociales. “Para hacer una película profesional se necesita un equipo muy caro. Este modelo va a capacitar a la persona promedio que hace videos en las redes sociales para hacer contenido de muy alta calidad”, Peebles.

Comparte
Salir de la versión móvil