La red neuronal Deepmind de Google ya es capaz de crear vídeos de 30 segundos a partir de una sola imagen.
Transframer, como se llama la nueva herramienta, sólo necesita una foto para trabajar, ya que empieza a identificar lo que hay en el marco de la imagen. Analiza el contenido de la imagen y, a continuación, predice lo que habría a su alrededor con “imágenes de contexto”, es decir, adivinando el aspecto que tendrían los objetos desde distintos ángulos, basándose en una enorme cantidad de datos de entrenamiento.
“Dada una colección de imágenes de contexto con anotaciones asociadas (marcas de tiempo, puntos de vista de la cámara, etc.), y una anotación de consulta, la tarea es predecir una distribución de probabilidad sobre la imagen objetivo”, escribió el equipo de Deepmind en un post.
“Este marco admite una serie de tareas de predicción visual, incluyendo el modelado de vídeo, la síntesis de vistas novedosas y la visión multitarea”.
Es posible que esta tecnología se utilice para construir entornos digitales tridimensionales, en lugar del tradicional rending que se utiliza actualmente en los videojuegos y otros espacios online.
El equipo de inteligencia artificial de Google ha realizado otros avances sorprendentes en el pasado. El mes pasado, el sistema mapeó la forma de prácticamente todas las proteínas conocidas por la ciencia, un avance que ayudará a afrontar grandes retos mundiales como el desarrollo de vacunas contra la malaria y la lucha contra la contaminación por plásticos.
La división también entrenó a una IA para controlar el plasma sobrecalentado dentro de un reactor de fusión nuclear, abriendo nuevas vías para avanzar en la llegada de la energía limpia ilimitada.
El mayor reto de esto es dar forma y mantener el plasma de alta temperatura. En las estrellas esto se consigue mediante la gravedad, pero es más difícil en la Tierra, ya que se necesitan láseres o imanes para controlar el material extremadamente caliente.
Sin embargo, la IA de DeepMind fue capaz de controlar constantemente el plasma tomando 90 mediciones diferentes 10.000 veces por segundo, y ajustando el campo magnético en consecuencia.
Comments