Microsoft выпустила новую версию Agility SDK, в которой представлена модель шейдеров 6.9 и улучшения для DirectX 12 и DXR 1.2.
API DirectX 12 дебютировал более десяти лет назад, в июле 2015 года. Расширенная версия DirectX 12 Ultimate, которая также включает DirectX Raytracing (DXR), появилась в мае 2020 года. С тех пор платформа регулярно разрабатывается вместе с Agility SDK. Теперь доступна следующая версия этого пакета, в которой представлена модель шейдеров 6.9, добавлены четыре новые функции и полная версия микрокарт непрозрачности D3D12 (OMM).
В выпуске Agility SDK версии 1.619 представлены Shader Model 6.9, DXR 1.2 и различные улучшения для DirectX 12 Ultimate, включая четыре новые функции. Полная поддержка микрокарт OMM может повысить производительность в играх до 2,3 раз с использованием трассировки лучей и трассировки путей.
Microsoft представляет DirectX Raytracing 1.2, который значительно улучшит производительность и визуализацию игр
В Agility SDK версии 1.619 представлена модель шейдеров 6.9, которая расширяет возможности HLSL (языка шейдеров высокого уровня) четырьмя ключевыми функциями: длинным вектором, специальными 16-битными операциями с плавающей запятой, поддержкой 16- и 64-битных шейдерных операций и волновых операций. Длинный вектор позволяет HLSL загружать, хранить и манипулировать векторами длиной более четырех элементов (до 1024 компонентов). Специальные 16-битные операции с плавающей запятой позволяют выполнять дополнительные вычисления с половинной точностью над числами с плавающей запятой, повышая производительность и экономя использование видеопамяти. Однако поддержка 16- и 64-битных шейдерных операций обеспечивает большую гибкость при выполнении сложных вычислений различной точности. Wave ops позволяет потокам эффективно работать в группах, улучшая параллелизм и производительность вычислений на графическом процессоре.
В игру вступают DirectX 12 Agility SDK 1.618 и рабочие графики. Microsoft предоставляет инструменты для борьбы с заиканием
В DXR 1.2 представлено несколько важных новых функций, которые расширяют возможности трассировки лучей на графическом процессоре. Микрокарты непрозрачности (OMM) позволяют эффективно обрабатывать частично прозрачную геометрию, такую как листья и сетки, без дорогостоящих вызовов шейдеров AnyHit, значительно ускоряя трассировку лучей в сценах с большим количеством таких объектов. Раньше OMM были доступны в ограниченной форме, а в Shader Model 6.9 активируются дополнительные элементы, позволяющие полностью использовать эту функцию в HLSL. Также был представлен новый механизм переупорядочения выполнения шейдеров (SER), который позволяет графическому процессору реорганизовать выполнение шейдеров в группах потоков (волна), что улучшает работу SIMD и увеличивает производительность RT и PT.
Intel выпустила новое обновление драйверов для видеокарт и процессоров Intel Core Ultra 300, увеличивающее FPS на 35% в The Witcher 3
Ранее Microsoft сообщала об увеличении производительности в играх до 2,3 раз с использованием Path Tracing и Opacity Micromaps (OMM). Одна из демонстраций технологий NVIDIA показала повышение производительности более чем на 60%. В эталонной сцене слева плавность составила 55 FPS, а в сцене справа при активном OMM была достигнута 90 FPS. В Alan Wake II одна сцена может содержать от 4,5 до 9,3 миллионов треугольников, 5,2 миллиона вершин со скинами и 2,2 тысячи экземпляров со скинами. Это также одна из самых требовательных игр с трассировкой пути, генерирующая 10 лучей на пиксель, что в общей сложности составляет 36,9 миллиона лучей на кадр. Карте GeForce RTX 4090 без оптимизации требуется в среднем 16,8 мс для рендеринга сцены, а с включенными SER и OMM время рендеринга падает всего до 10,2 мс. В настоящее время только NVIDIA предлагает драйверы, поддерживающие OMM, для своих карт GeForce RTX, тогда как другие производители планируют ввести поддержку в будущем.
| АМД | Интел | NVIDIA | |
| Водитель | Адреналин издание 26.2.1 | Драйвер графической системы Intel 32.0.101.8531 | Драйвер GeForce для игр 595 (пока не доступен) |
| Длинный вектор | серия Радеон RX 9000 | Серия Arc Battlemage | Серия GeForce RTX |
| 16-битные специальные числа с плавающей запятой | серия Радеон RX 9000 | Серия Arc Battlemage | Серия GeForce RTX |
| Переупорядочение выполнения шейдеров (SER) | Еще нет | Серия Arc Battlemage (ограничение 64 000 элементов) |
серия GeForce RTX 4000, Серия GeForce RTX 5000 |
| Микрокарты непрозрачности (OMM) | Еще нет | Еще нет | Серия GeForce RTX |
| Пересмотренный ресурс Посмотреть API создания |
серия Радеон RX 7000, серия Радеон RX 9000 |
Серия Arc Battlemage | Серия GeForce RTX |
| Периодические уведомления об обрезке | Еще нет | Серия Arc Battlemage | Серия GeForce RTX |
| Увеличение отправки Предел сетки |
серия Радеон RX 7000, серия Радеон RX 9000 (вычислительные шейдеры – без ограничений, сетчатые шейдеры — 64 тысячи тем) |
Серия Arc Battlemage (ограничение 64 тыс. тем) |
Серия GeForce RTX (ограничение 64 тыс. тем) |
| Временная шкала процессора Запрос разрешается |
серия Радеон RX 7000, серия Радеон RX 9000 |
Серия Arc Battlemage | Серия GeForce RTX |
AMD FSR 4.1 — утекший DLL-файл из закрытых тестов драйверов Adrenalin, улучшающий резкость изображения
Обновление также включает функции, о которых сообщили разработчики. Обновленный API представления ресурсов позволяет более гибко и эффективно определять способ доступа к текстурам и буферам на графическом процессоре, а уведомления о периодической обрезке позволяют приложениям сокращать использование памяти за счет освобождения неактивных ресурсов. Увеличенный предел диспетчерской сетки позволяет выполнять более крупные и сложные параллельные вычисления в вычислительных шейдерах, а функция разрешения запросов временной шкалы ЦП позволяет более точно отслеживать время выполнения задач графического процессора по сравнению с процессором, что упрощает профилирование и оптимизацию производительности в играх. Поддержка Agility SDK 1.619 доступна от трех основных производителей графических процессоров (NVIDIA, AMD, Intel), хотя набор функций зависит от конкретных видеокарт.
Источник: Microsoft, NVIDIA, WCCFTech.