Una estampida de mamuts o un robot ciberpunk: Sora, la nueva herramienta de OpenAI para crear vídeos a partir de instrucciones de texto

Blake Montgomery

The Guardian —

0

La empresa de inteligencia artificial (IA) OpenAI presentó este jueves una herramienta capaz de generar vídeos a partir de instrucciones de texto. Apodado 'Sora', por la palabra japonesa para cielo, la herramienta es capaz de generar secuencias realistas de hasta un minuto de duración ajustándose a instrucciones escritas en las que se define tema y estilo.

Vídeo creado con Inteligencia Artificial con el texto: Varios mamuts lanudos gigantes se acercan caminando por una pradera nevada, su largo pelaje lanudo se agita ligeramente con el viento mientras caminan, árboles cubiertos de nieve y dramáticas montañas nevadas en la distancia, la luz de media tarde con nubes difusas y un sol alto en la distancia crea un cálido resplandor, la vista de cámara baja es impresionante capturando el gran mamífero peludo con una hermosa fotografía con profundidad de campo.

De acuerdo con información publicada en el blog de OpenAI, el nuevo modelo también es capaz de crear vídeos a partir de una imagen fija, o de ampliar vídeos existentes añadiendo nuevo material. “Estamos enseñando a la IA a comprender y a simular el mundo físico en movimiento, con el objetivo de desarrollar modelos que ayuden a la gente a resolver problemas que requieren interacción en el mundo real”, dice el texto del blog.

Uno de los vídeos incluidos entre los primeros ejemplos se basaba en la siguiente instrucción de texto: “El tráiler de una película sobre las aventuras de un astronauta de 30 años que usa un casco de moto de punto de lana y color rojo, cielo azul, desierto de sal, estilo cinematográfico, rodado en película de 35 mm, colores vívidos”.

La empresa comunicó que había dado acceso a Sora a unos pocos investigadores y creadores de vídeo. Según el blog, los expertos se encargarán de ponerlo a prueba para comprobar si es posible eludir las condiciones de servicio de OpenAI, en las que se prohíbe “violencia extrema, contenidos sexuales, imágenes que inciten al odio, imágenes de famosos, o propiedad intelectual de terceros”.

Aunque la empresa solo está dando acceso limitado a investigadores, artistas visuales y cineastas, su consejero delegado Sam Altman respondió en Twitter a usuarios que le enviaban textos con videoclips creados por Sora a partir de esas instrucciones, según dijo (los vídeos llevan una marca de agua donde dice que han sido generados por IA).

OpenAI presentó en 2021 a Dall-E, su generador de imágenes fijas; y en noviembre de 2022, al chatbot de inteligencia artificial generativa ChatGPT, que en seguida llegó a 100 millones de usuarios. Otras empresas de IA han presentado herramientas de generación de vídeo, pero solo han sido capaces de producir pocos segundos de metraje y no suelen guardar mucha relación con las instrucciones. Google y Meta han comunicado que están desarrollando herramientas de generación de vídeo, aunque aun no las han hecho públicas.

El miércoles OpenAI anunció un experimento para añadir memoria a ChatGPT de forma que pueda recordar más chats de sus usuarios.

Vídeo creado con Inteligencia Artificial con el texto: Vídeo de celebración del Año Nuevo Lunar chino con un dragón chino.

OpenAI no ha informado sobre el número de secuencias utilizadas para entrenar a Sora. Consultada por The New York Times, lo único que la empresa dijo sobre el origen de esos vídeos es que se trataba de material libre de derechos o de material cuyo uso había sido permitido por los propietarios de los derechos.

OpenAI ha sido demandada en múltiples ocasiones por supuestamente infringir derechos de autor durante el entrenamiento de sus herramientas de inteligencia artificial generativa, un proceso en el que se procesan cantidades ingentes de material de Internet para imitar las imágenes o los textos contenidos en él.

Vídeo creado con Inteligencia Artificial con el texto: La historia de la vida de un robot en un entorno ciberpunk.