NVIDIA Maxime y las nuevas videollamadas

Cuando te conectas a un videoconferencia siempre pasa lo mismo; los ojos de la otra pero siempre están mirado a otro sitio. Esto es más que molesto, hace que la conversación no fluya. Sin embargo, la revolución de la vida digital está en marcha y NVIDIA Maxime ha dado un paso adelante. 

Como muchas de las soluciones a los problemas de nuestro tiempo, la inteligencia artificial es la que va a resolver este problema. La firma lleva tiempo implementando soluciones gráficas para recrear a la perfección las facciones humanas reales. 

Ya se han dado a conocer algunas pruebas pilotos que consisten en el uso de una cámara integrada, aunque también es posible hacerlo con una externa. Se trata de una pantalla dividida en la que el lado izquierdo se encarga de reflejar nuestro rostro. Este registro es importante porque aquí se va a crear nuestra imagen digital. La realidad aumentada hace que nuestros ojos estén siempre mirando a la cámara

Este es el salto que hará que las comunicaciones digitales se sientan más reales. El efecto y las imágenes que hasta ahora se han dado a conocer, son increíbles. Claramente, no es magia y todavía hay desperfectos que hacen que los ojos no encajen bien en la imagen. Sin embargo, los resultados generales son muy convincentes.

La tecnología de rastreo de NVIDIA Maxime es capaz de repetir movimientos milimétricos como pestañeos. También puede recolocar los ojos hacia la pantalla cuando en realidad estamos mirando a otro sitio. Parece que el gran talón de Aquiles son los ojos. Todavía no tiene un efecto tan idéntico  a los ojos de una persona con sus movimientos reales. Se nota que es el resultado de un ordenador, pero es una prueba piloto muy bien acabada. 

Una de las pruebas más difíciles de esta nueva tecnología de enfoque visual es cuando se mira fuera de la pantalla. En estos casos, los ojos se adaptan al movimiento y se mantienen en una posición natural, tal como si se tratase de una conversación real. Es cierto que en algún momento podía haber un poco de descontrol de la mirada respecto al resto del rostro, pero nada demasiado notorio. 

Hasta ahora, todo pinta muy bien. Sobre todo porque la mayor parte del tiempo estamos mirando a la pantalla. Esto es una gran solución porque el lente de la cámara suele estar encima de la pantalla. Esta es una buena forma de sentir que estamos mirando a la cara de la persona sin subir la mirada hacia la cámara.

Otra incorporación interesante es la aplicación que está unida a este nuevo desarrollo visual. Esta es la que permite crear la plantilla específica de nuestro rostro. Esta plantilla es la que crea los movimientos lo más reales posible. 

El seguimiento de los movimientos también está muy avanzado y es notable. Cuando la imagen parece que se mueve mucho más lento que la persona que está en la pantalla, da una sensación un poco molesta. Pensemos en que las cámaras de los computadores nunca fue una prioridad para los fabricantes, hasta ahora. 

Desde que el mundo físico quedó suspendido, las videoconferencias son cada vez más importantes. Sin embargo, una parte muy importante de nuestra vida sigue siendo online, por eso es necesario volver la mirada a estas nuevas necesidades. Hacer que las videoconferencias sean más reales y sofisticadas hace que las personas se sientan cada vez más inmersas en esta nueva tecnología.

Las videollamadas y la tecnología NVIDIA Maxime.

Lo que ha quedado claro con esta prueba es que este tipo de tecnología es el futuro de las videollamadas. Sin embargo, las mejoras que se plantean son varias y vienen en forma de SDKs. Las aplicaciones NVIDIA todavía no ofrecen estas posibilidades. Para esto NVIDIA ha solucionado el problema con distintos SDKs. Los efectos son diferentes y los desarrolladores ya están trabajando para ello. Repasemos de qué se trata:

  • SDK de audio: Este es el encargado de limpiar los ruidos de fondo y mejorar la calidad general del audio en la videollamada.
  • SDK de video: Super resolution es la tecnología con la que NVIDIA ha llamado a su resolución de video. Este sirve para mejorar la calidad de los fondos y crear fondos virtuales de calidad.
  • SDK de realidad aumentada: Esta es la solución para mejorar la calidad de la realidad aumentada y el seguimiento facial. Los gestos, las poses y los movimientos se reconocen con esta tecnología para crear la malla con la que se digitalizan los movimientos del rostro.

¿Cuándo podremos ver esta tecnología?

Alex Qi, uno de los encargados de este nuevo desarrollo ha dicho que pronto podremos empezar a usar el NVIDIA Maxime. Sin embargo, tengamos en cuenta que la divulgación depende de Zoom, Teams, Skype y muchas otras plataformas que se conviertan en el intermediario entre NVIDIA y los usuarios finales.

Tengamos en cuenta que cualquier usuario va a necesitar de una GTX de NVIDIA. La inteligencia artificial de las RTX son las capaces de procesar los algoritmos con los que trabaja MAXIME de NVIDIA. Existe la posibilidad de que este trabajo pueda hacerlo un centro de datos. Con este centro se podrían procesar las señales de vídeos que necesita la máxima para poner en funcionamiento el Eye Contact. Esto quiere decir que no necesitamos un equipo específico.

Qi ha declarado que constantemente se realizan mejoras y actualizaciones a Maxime. Las configuraciones de contacto visual, siguen necesitando mejoras constantes. De esto depende que los gestos, el color de los ojos y otros detalles que se encuentren cerca del rostro sean cada vez más reales. Las condiciones de la luz es otra de las mejoras que necesita Maxime para funcionar a tope.

Aun cuando las condiciones de luz no sean las mejores, actualmente Maxime puede funcionar, pero la calidad no es la misma. Los algoritmos también deben mejorar cuando se trata de usuarios que usan anteojos. El reflejo de los cristales puede suponer un problema para que la malla pueda  evitar el rebote de la luz.

Algo que tenemos claro, es que las promesas de esta tecnología nos hacen a todos desearla y tenerla lo más pronto posible. Se trata de un avance más de la inteligencia artificial que podría dejarnos con la boca abierta a todos.

Deja un comentario