Todo es dinero

El papá de ChatGPT revela a una nueva bestia que simula el mundo físico

Open AI marcó este 15 de febrero un importante precedente en el camino hacia la inteligencia artificial general (AGI)

Open AI revela su nuevo superpoder: Sora. (Foto: Open IA)
15/02/2024 |17:28
Javier Ramírez
Editor web en El UniversalVer perfil

Open AI va cumpliendo lo que hace unos meses adelantaba su director ejecutivo Sam Altman, acerca de los "superpoderes" que la va adquiriendo para simular cada vez más el mundo físico.

Situada en uno de los campos más prometedores y revolucionarios, Open IA, una de las organizaciones líderes en el desarrollo de IA, presentó hace unas horas un innovador modelo de texto a vídeo llamado , que promete cambiar la forma en que interactuamos con el mundo digital.

Sora es un modelo capaz de generar vídeos de hasta un minuto de duración, manteniendo una alta calidad visual y una fiel adherencia a las instrucciones del usuario.

Newsletter
Recibe en tu correo las noticias más destacadas para viajar, trabajar y vivir en EU

Este avance, el único hasta el momento, se convierte en un paso significativo en la enseñanza de la IA para comprender y simular el mundo físico en movimiento, abriendo un abanico de posibilidades para aplicaciones en diversos campos.

El modelo de Sora fue puesto a disposición de los equipos de red para evaluar áreas críticas en busca de riesgos o daños. Además, se ha otorgado acceso a artistas visuales, diseñadores y cineastas para recabar retroalimentación sobre cómo mejorar el modelo y hacerlo más útil para los profesionales creativos.

Una de las características más destacadas de Sora es su capacidad para generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo.

El modelo tiene un profundo entendimiento del lenguaje que resulta impactante en su resultado final, pues interpretar con precisión las instrucciones del usuario (ingeniería de prompts) y generar personajes que expresan emociones tan vibrantes como las que vemos en nuestros conocidos.

Sin embargo, como toda tecnología emergente, Sora tiene sus limitaciones: el modelo puede tener dificultades para simular con precisión la física de una escena compleja o entender instancias específicas de causa y efecto. Además, puede confundir detalles espaciales o tener problemas con descripciones precisas de eventos que ocurren a lo largo del tiempo.

En términos de seguridad, OpenAI informó que está tomando medidas importantes antes de hacer que Sora esté disponible en sus productos. Esto incluye trabajar con equipos de red para probar adversarialmente el modelo y desarrollar herramientas para detectar contenido engañoso.

Adicionalmente, se están utilizando métodos de seguridad existentes desarrollados para otros productos de OpenAI, como DALL·E 3.

Sora es un modelo de difusión que genera vídeos comenzando con uno que parece ruido estático y lo transforma gradualmente eliminando el ruido en muchos pasos. Utiliza una arquitectura de transformador, similar a los modelos GPT (Transformador generativo preentrenado), lo que le permite escalar de manera superior.

Este modelo se basa en investigaciones anteriores en modelos DALL·E y GPT y utiliza técnicas como la recaptación de DALL·E 3 para generar subtítulos altamente descriptivos para los datos de entrenamiento visual. Como resultado, Sora es capaz de seguir las instrucciones de texto del usuario en el video generado de manera más fiel.

Sora marcó este 15 de febrero un importante precedente en el camino hacia la inteligencia artificial general (AGI), con la capacidad de comprender y simular el mundo real. Sin embargo, no olvidemos que a medida que la tecnología continúa avanzando, será importante abordar los desafíos éticos y de seguridad que surgen, garantizando que la IA se desarrolle de manera responsable y beneficiosa para nuestra sociedad.