OpenAI tiene una nueva criatura: se llama Sora y crea vídeos de hasta un minuto a partir de una descripción en texto. Este software genera vídeos muy realistas, tanto que es difícil para un no profesional distinguir si está filmado o estamos ante la generación de la Inteligencia Artificial si no se incorpora una marca de agua.

Sora genera vídeos con calidad visual y cumpliendo las indicaciones del usuario en una descripción. De un texto, hace un vídeoclip. Y ese videoclip admite diferentes tomas o complejidad de personajes. Funciona de manera similar a la herramienta de inteligencia artificial de generación de imágenes de OpenAI, DALL-E. Un usuario escribe la escena deseada y Sora le devolverá un videoclip de alta definición.

La imagen que se muestra a continuación procede de un vídeo de OpenAI con esta descripción: Una mujer elegante camina por una calle de Tokio llena de luces de neón brillantes y carteles animados de la ciudad. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva gafas de sol y lápiz labial rojo. Camina con confianza y despreocupación. La calle está húmeda y refleja, creando un efecto espejo de las luces de colores. Muchos peatones caminan por allí.

Imagen creada por Sora, nueva herramienta de OpenAI
Podcast: OpenAI ya crea vídeos a partir de texto con Sora

OpenAI lanza un software (Sora) que genera vídeos muy realistas de hasta un minuto a partir de descripciones de texto

Open AI advierte que Sora aun puede confundir los detalles espaciales de un mensaje y tener dificultades para seguir una trayectoria de cámara específica. En cualquier caso, el software puede crear escenas intrincadas que combinen múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y del fondo. Y además de generar vídeos a partir de indicaciones de texto, también puedes animar imágenes fijas.

Tras conocer la capacidad de Sora, casi parece de principiantes que ChatGPT pueda redactar emails, escribir código o redactar poemas. Ahora la clave es si seríamos capaces de distinguir que estas imágenes están generadas por inteligencia artificial. Sin marca de agua, resulta complicado.


Frame de un vídeo generado por Sora
Frame de un vídeo generado por Sora
Frame de un vídeo generado por Sora

Sora tiene antecedentes. Meta reforzó su modelo de generación de imágenes Emu el año pasado para agregar dos funciones basadas en inteligencia artificial que pueden editar y generar vídeos a partir de indicaciones de texto.

OpenAI explica que también construye un "clasificador de detección" que puede identificar videoclips generados por Sora. La empresa planea incluir ciertos metadatos en su salida que deberían ayudar a identificar el contenido generado por IA. Aspecto clave ante la generación de imágenes con IA si tenemos en cuenta que las nuevas tecnologías presentan graves problemas de desinformación a medida que se acercan las principales elecciones políticas en todo el mundo. Y es que la cantidad de deepfakes generados por IA ha aumentado un 900% año tras año, según datos de Clarity, una empresa de aprendizaje automático.

Fragmento de un vídeo generado por Sora, OpenAI

El "autobús de dos plantas" que lanza ASML por 380 millones

La industria TEDAE quiere más mujeres de ciencias