La industria del entretenimiento experimenta una nueva transformación con el lanzamiento de VOID (Video Object and Interaction Deletion), una herramienta desarrollada por Netflix diseñada para eliminar objetos en movimiento de forma automatizada. A diferencia de los borradores convencionales, este sistema no solo remueve elementos de la toma, sino que genera resultados físicamente coherentes al recalcular las interacciones del entorno, como colisiones o caídas de objetos.
A través de una publicación en el repositorio académico arXiv, el equipo de investigación de Netflix detalló que VOID permite completar escenas sin necesidad de rodar de nuevo. Esta capacidad democratiza la edición avanzada de video, permitiendo que usuarios sin conocimientos especializados en efectos visuales (VFX) logren acabados profesionales mediante el uso de grandes modelos de lenguaje (LLM).
Arquitectura técnica y modelos integrados
Para lograr una reconstrucción precisa, VOID utiliza un entramado de tecnologías de Código Abierto y modelos de última generación. El flujo de trabajo se apoya en:
-
Motores de simulación: Utiliza Kubric para simular físicas de cuerpos rígidos y el conjunto de datos Humoto para recrear interacciones humanas naturales.
-
Modelos de Visión-Lenguaje (VLM): Implementa arquitecturas como Gemini 3 Pro, GPT-5.2 y Qwen-3.5 V para identificar las áreas afectadas y recibir instrucciones directas.
-
Generación de fotogramas: Se basa en CogVideoX, un modelo de difusión encargado de rellenar los espacios vacíos y mantener la continuidad visual entre cuadros.
El sistema de ‘Quadmasks’
La precisión de VOID radica en la creación de Quadmasks (máscaras de cuatro regiones), que dividen la imagen en secciones específicas: el área a reconstruir, los bordes inmediatos, el contexto circundante y las zonas que deben permanecer intactas. Este método asegura que, al eliminar un soporte, el objeto que descansaba sobre él caiga siguiendo una trayectoria físicamente lógica, evitando errores de continuidad.
El desarrollo de esta tecnología fue liderado por especialistas y doctorandos de instituciones de prestigio como la Universidad de Columbia, Oxford y el Instituto de Informática, Inteligencia Artificial y Tecnología. Aunque el estudio se centra en el avance científico, la implementación de VOID plantea interrogantes sobre el futuro del impacto laboral en los departamentos de postproducción y efectos visuales tradicionales.

Discussion about this post