Microsoft DirectX con SER: así mejora el rendimiento del ray tracing con Shader Model 6.9

Última actualización: marzo 2, 2026
Autor: ForoPC
  • Shader Model 6.9 incorpora de forma "retail" Shader Execution Reordering (SER) para DXR 1.2.
  • SER y HitObject permiten reagrupar trabajo de la GPU y ganar coherencia en cargas de ray tracing.
  • Las demos técnicas muestran hasta un 90% más rendimiento en Intel Arc B-Series y un 40% en RTX 4090.
  • El soporte llega a través del Agility SDK 1.619 y el nuevo compilador DXC, clave para futuros juegos en PC y consolas.

Tecnología Microsoft DirectX con SER

La llegada de Shader Model 6.9 marca un paso importante en la evolución de Microsoft DirectX con SER, una combinación pensada para sacar más partido al ray tracing moderno sin obligar al usuario a cambiar de hardware de forma inmediata. La compañía ha decidido integrar por fin de manera oficial su tecnología de Shader Execution Reordering dentro del paquete “retail”, dejando atrás la fase de vista previa en la que llevaba tiempo.

Este movimiento encaja en un contexto donde el trazado de rayos y el path tracing ganan peso en juegos de PC y consolas de última generación en Europa, pero también ponen a las GPU bajo una presión enorme. DirectX con SER pretende precisamente reducir esa carga reorganizando el trabajo interno de los shaders y mejorando la forma en la que la GPU aprovecha su paralelismo, algo que puede traducirse en más FPS y menor coste de ray tracing cuando los desarrolladores adoptan estas funciones.

Qué problema intenta resolver Shader Execution Reordering en DirectX

impacto de DirectX 13 en el futuro del gaming
Artículo relacionado:
Impacto de DirectX 13 en el futuro del gaming: todo lo que se sabe y lo que podría cambiar

En las cargas de trabajo con ray tracing, cada rayo que se lanza en escena puede seguir un camino distinto: algunos fallan, otros impactan contra geometría opaca, otros atraviesan superficies con alpha y otros se topan con materiales muy complejos. Esta diversidad de rutas provoca una gran divergencia de ejecución, es decir, muchos hilos de la GPU dejan de hacer lo mismo al mismo tiempo, algo que rompe la coherencia que el hardware necesita para exprimir su paralelismo masivo.

Aquí entra en juego Shader Execution Reordering. SER introduce nuevas primitivas en HLSL que permiten al propio shader comunicar al hardware qué trabajo es similar y puede reagruparse. En lugar de que la GPU procese de forma caótica rayos “baratos” y “caros” mezclados, el motor puede marcar qué invocaciones van a resultar más costosas y dar a la GPU margen para reordenarlas y ejecutarlas en lotes más homogéneos.

La clave es que Shader Model 6.9 exige soporte de SER: los drivers deben aceptar shaders que hagan uso de estas instrucciones. No obstante, que un dispositivo declare compatibilidad no implica automáticamente una aceleración notable; el beneficio real depende de cómo implementen el reordenamiento cada GPU y cada driver. Puede existir un soporte puramente funcional sin que haya un reordenamiento efectivo y agresivo a nivel de hardware.

Microsoft DirectX con SER se apoya así en la colaboración estrecha entre fabricantes de tarjetas gráficas, desarrolladores de motores y el propio runtime de DirectX, con el objetivo de minimizar esa divergencia que hasta ahora limitaba el rendimiento de muchas escenas con trazado de rayos complejo.

En la práctica, esta capacidad abre la puerta a escenas con materiales más variados, iluminaciones más sofisticadas y efectos de transparencia avanzados sin que el coste se dispare tanto como en las implementaciones de ray tracing clásicas donde todos los hilos avanzan descoordinados y desperdician gran parte del potencial de la GPU.

Shader Model 6.9 y SER en DirectX

HitObject y SER: separando recorrido del rayo y sombreado final

Para entender mejor cómo se logra esa mejora de rendimiento en DirectX con SER, conviene fijarse en el papel de HitObject. Esta funcionalidad se encarga de dividir el trabajo en dos fases diferenciadas: por un lado, el recorrido del rayo por la escena (traversal, pruebas de intersección y cualquier lógica de AnyHit/Intersection) y, por otro, la etapa de ClosestHit/Miss que determina cómo se sombrea finalmente el píxel.

  Windows 11 da el salto a un sistema operativo con IA integrada

En términos sencillos, el motor puede trazar primero el rayo y guardar un objeto de impacto que almacena la información relevante del hit o del miss. A partir de ahí decide en qué momento y de qué forma se ejecuta el sombreado final, incluso intercalando lógica adicional entre medias. Esta separación, combinada con SER, permite reforzar la coherencia en la ejecución y en el acceso a datos, que es justo donde las GPU son más eficientes.

La especificación de la API define las consultas disponibles sobre HitObject: se pueden obtener datos de hit/miss, atributos, transformaciones, índices y otros campos necesarios para reconstruir la información de la intersección. Además, introduce un punto de reordenamiento, un “reorder point” en el que el hardware puede pausar y reagrupar las invocaciones según las pistas que aporte el shader mediante SER.

En ese punto, la GPU tiene margen para ordenar las tareas de forma que agrupe operaciones con costes similares, mejorando así la utilización de sus unidades de cómputo. De este modo, DirectX con SER no solo reordena hilos de forma arbitraria, sino que lo hace con conocimiento del contexto de ray tracing que el motor de juego le ha proporcionado.

El resultado potencial es que los motores pueden diseñar tuberías de renderizado más flexibles, donde la fase de recorrido del rayo y la fase de sombreado se desacoplan, dando más libertad para decidir cuándo conviene disparar cada tipo de trabajo y evitar mezclar tareas ligeras y pesadas en el mismo grupo de ejecución de la GPU.

La demo técnica de Microsoft: SER puesto a prueba en DXR

Para ilustrar los efectos de Shader Execution Reordering en un entorno controlado, Microsoft ha publicado una demo técnica DirectX con SER basada en un ejemplo de “hello world” de DXR denominado D3D12RaytracingHelloShaderExecutionReordering. Esta demo dibuja un rectángulo a pantalla completa y utiliza coordenadas baricéntricas de triángulos para colorear la imagen.

En lugar de recrear una escena realista, la demo provoca de forma deliberada una fuerte divergencia artificial. Parte de los rayos ejecuta un trabajo relativamente ligero, mientras que otra fracción asume un trabajo pesado. Para maximizar el contraste, la escena distribuye estas cargas en bandas verticales, de forma que, sin SER, los grupos de ejecución mezclan continuamente hilos “caros” y “baratos”.

En este contexto, el shader hace uso de SER para marcar qué hilos serán más costosos y permitir a la GPU reagruparlos. Con el reordenamiento activo, el hardware puede evaluar primero los rayos ligeros por un lado y los pesados por otro, evitando que se frene el conjunto por culpa de un subconjunto de tareas muy complejas incrustadas en el mismo grupo.

Microsoft subraya que se trata de una demo técnica y no de un juego comercial. Está diseñada precisamente para maximizar el beneficio del reordenamiento, porque la divergencia está definida de forma muy clara y bajo control. Aun así, sirve como referencia para entender en qué tipo de escenas se pueden esperar ganancias tangibles cuando se integra SER en motores reales.

Los escenarios típicos en los que DirectX con SER tiene más sentido son aquellos con muchos materiales distintos, rutas de ray tracing con costes muy irregulares y patrones de ejecución poco coherentes, algo bastante habitual en títulos con iluminación avanzada, reflejos, transparencias complejas o efectos de oclusión global basados en rayos.

Rendimiento DirectX con SER en GPU

Ganancias de rendimiento: Intel Arc B-Series y NVIDIA RTX 4090

Los datos de rendimiento compartidos por Microsoft proceden de esta demo técnica, por lo que no deben interpretarse como una garantía directa para todos los juegos, pero sí como una referencia razonable del potencial de DirectX con SER cuando la escena está bien adaptada. En varias configuraciones con tarjetas gráficas Intel Arc B-Series, se registraron incrementos de hasta un 90% de rendimiento respecto al mismo escenario sin SER activado.

  RTX 5090 podría costar 5.000 dólares: así afectaría la subida a los jugadores europeos

En el caso de NVIDIA, se citó también un modelo concreto, la GeForce RTX 4090. En esta GPU de gama alta se observó una mejora de alrededor del 40% en número de fotogramas por segundo, siempre en las mismas condiciones de prueba y comparando directamente entre usar o no las capacidades de reordenamiento de shaders.

Conviene insistir en que esta prueba está pensada para mostrar el máximo impacto posible de SER: la divergencia está cuidadosamente diseñada, la carga de trabajo es muy específica y no hay los elementos imprevisibles de un videojuego real, como la lógica de juego o la carga de la CPU. Aun así, la demostración sugiere que, si la industria del videojuego adopta estas optimizaciones de forma seria, hay margen para conseguir mejoras de rendimiento muy apreciables sin aumentar los requisitos mínimos de hardware.

En el mercado europeo, donde muchos jugadores siguen utilizando configuraciones de gama media y no renuevan tarjeta gráfica con cada generación, tecnologías como DirectX con SER pueden resultar especialmente interesantes. Permiten a los estudios ofrecer efectos de ray tracing más ambiciosos y, al mismo tiempo, conservar una tasa de fotogramas suficiente o reducir la dependencia de reescalados agresivos.

Shader Model 6.9, DXR 1.2 y su papel en la evolución gráfica

Shader Model ha ido de la mano de las distintas versiones de la API DirectX y ha marcado en gran medida los saltos visuales que se han ido produciendo generación tras generación. Con Shader Model 1.0 llegaron a PC títulos como DOOM 3, con 2.0 fue el turno de juegos como The Elder Scrolls IV: Oblivion, 3.0 acompañó a éxitos como BioShock y 4.0 se asoció a ese gran salto gráfico que supuso Crysis. Más tarde, Shader Model 5.0 y 6.0 dieron soporte a producciones con un nivel de detalle aún mayor como The Witcher 3 o A Plague Tale.

La nueva versión, Shader Model 6.9, se publicó el 26 de febrero y se integra en el ecosistema de DirectX Shader Compiler (DXC) versión 1.9.2602.16 y el Agility SDK 1.619. Su objetivo es ofrecer a los desarrolladores un conjunto de herramientas más amplio con el que empujar un poco más el techo gráfico, en un momento en que muchos estudios perciben que el sistema tradicional de rasterización está tocando techo pero siguen queriendo dar pasos adelante en realismo.

Entre las novedades de Shader Model 6.9 destacan los Long Vectors, que permiten cargar, almacenar y operar con vectores HLSL largos de hasta 1.024 elementos, incluyendo soporte para elementos en coma flotante de 16 bits. Esta capacidad amplía el margen para procesar grandes cantidades de datos en paralelo dentro de un mismo shader.

Sin embargo, uno de los puntos clave de esta actualización es la integración de DXR 1.2 con soporte completo para Opacity Micromaps (OMM) y SER. Los OMM permiten al hardware gestionar geometrías complejas con transparencia alpha de forma mucho más eficiente, reduciendo el coste de evaluar múltiples capas de transparencia en objetos como vegetación densa, vallas, cristales o elementos decorativos con cortes muy finos.

Junto con SER, estos avances convierten a DirectX con SER y DXR 1.2 en una plataforma más madura para el ray tracing, en la que se combinan técnicas de optimización del recorrido del rayo, gestión de transparencia y reordenamiento inteligente de shaders, todo con el fin de lograr escenas visualmente más ricas con un coste computacional más razonable.

Herramientas de desarrollo: Agility SDK y nuevas extensiones

El lanzamiento de SER se enmarca dentro de una actualización mayor del ecosistema de DirectX. El Agility SDK 1.619 es el paquete en el que Microsoft encuadra oficialmente estas capacidades, listando tanto SER como Opacity Micromaps como componentes de DXR 1.2 y de Shader Model 6.9. Este SDK resulta clave para que los estudios europeos y españoles puedan adoptar rápidamente estas funciones en motores propios o comerciales.

  ZOTAC alerta de una crisis de memoria que amenaza al mercado de GPU

Además de la versión estable, se ha anunciado también una rama Agility SDK 1.719-preview, que amplía aún más las posibilidades al incorporar características experimentales. Entre ellas se encuentran las denominadas «Fence Barriers», pensadas para mejorar la sincronización de dependencias entre GPU y CPU, algo fundamental cuando se encadenan varias etapas de cómputo y renderizado en pipelines complejas.

Otra de las novedades es VPblit 3DLUT, que habilita el acceso directo al hardware de procesamiento para combinar corrección de color (CSC), LUT 1D y LUT 3D reduciendo a la vez el consumo energético. Esto puede interesar especialmente a desarrollos en portátiles o consolas con presupuestos térmicos restringidos, donde cada vatio ahorrado cuenta.

Por último, el SDK introduce un mecanismo de extensión que permite a los proveedores de GPU y a los desarrolladores de software colaborar en funcionalidades gráficas experimentales. En la práctica, esto abre la puerta a que los fabricantes puedan probar ideas nuevas sobre DirectX sin tener que esperar a revisiones de la API principal, acelerando la llegada de innovaciones a los juegos que se publican en PC y, potencialmente, a consolas basadas en esta tecnología.

Impacto en juegos reales y perspectivas para el mercado europeo

Aunque SER se ha mostrado en una demo sintética, ya existe experiencia en cargas de trabajo reales. Durante la Game Developers Conference de 2025, Remedy Entertainment enseñó una reducción aproximada de un tercio en el coste de ray tracing en Alan Wake 2 combinando Opacity Micromaps y SER. Este caso indica que, integradas en un motor comercial complejo, estas tecnologías pueden traducirse en menos consumo de recursos para los mismos efectos o en la opción de activar configuraciones de calidad más altas sin penalizaciones tan severas.

Para el mercado español y europeo, donde hay una mezcla notable de PCs con hardware reciente y equipos que se van quedando algo atrás, DirectX con SER puede ayudar a ampliar la vida útil de muchas configuraciones. Los estudios que adopten estas técnicas tienen margen para ajustar sus pipelines de ray tracing de forma que, a mismos requisitos mínimos, el rendimiento sea superior o, al menos, más estable.

Al mismo tiempo, los desarrolladores de motores gráficos que se utilizan ampliamente en Europa, como Unreal Engine o los motores internos de grandes editoras, disponen con Shader Model 6.9 y DXR 1.2 de una base más sólida para implementar efectos avanzados de iluminación global, reflejos precisos y transparencias complejas sin que resulten inasumibles en términos de fotogramas por segundo.

Si a esto se suma la capacidad de los nuevos SDK para experimentar con funciones emergentes y optimizar la sincronización entre CPU y GPU, es razonable esperar que, en los próximos años, veamos cada vez más juegos que hagan uso de DirectX con SER para equilibrar mejor el binomio calidad gráfica-rendimiento, especialmente en plataformas muy asentadas en Europa como el PC de sobremesa.

En conjunto, la incorporación de Shader Execution Reordering a Shader Model 6.9 y DXR 1.2, la mejora de HitObject, el soporte de Opacity Micromaps y las nuevas herramientas del Agility SDK configuran un paquete con el que Microsoft busca dar más margen de maniobra a estudios y fabricantes de GPU. Si la industria aprovecha estas piezas, los jugadores en España y el resto de Europa podrían beneficiarse de efectos de ray tracing más sólidos y mejor rendimiento sin necesidad de saltar de inmediato a la próxima gran generación de hardware.