AMD RDNA 4 — Обсуждение архитектуры GPU для предстоящих графических карт Radeon RX 9070 XT и Radeon RX 9070

AMD RDNA 4 - Обсуждение архитектуры GPU для предстоящих графических карт Radeon RX 9070 XT и Radeon RX 9070

AMD, наконец, раскрывает изменения в архитектуре RDNA 4, которые будут присутствовать на предстоящих видеокартах. Благодаря улучшению Raytracing, новым методам сжатия и оптимизированному доступу к памяти VRAM, карты Radeon RX 9070 XT и Radeon RX 9070 могут быть серьезным конкуренцией за модели NVIDIA 4000 и 5000 … по крайней мере, мышление на основе официальных слайдов и изменений в RDNA 4.

Архитектура AMD RDNA 4, присутствующая в предстоящих графических картах Radeon RX 9070 XT и Radeon RX 9070, была значительно улучшена по сравнению с предыдущим поколением RDNA.

Monster Hunter Wilds бесплатно при покупке выбранных процессоров AMD Ryzen и видеокарты AMD Radeon

Архитектура AMD RDNA 4 претерпела многочисленные улучшения в RDNA 3. Хотя она все еще использует память GDDR6, мы можем рассчитывать на повышение производительности благодаря многочисленным оптимизациям. Упомянутая итерация архитектуры, используемая в последних графических системах AMD Radeon RX 9070 XT и Radeon RX 9070, основана на монолитной структуре, которая является отходом от модульной структуры с несколькими чипами. Это решение позволяет уменьшить внутренние задержки. GPU был сделан в технологическом процессе TSMC N4P (4 нм), а ядро ​​Navi 48 XTX содержит 53,9 миллиарда транзисторов на площади 356,5 мм², что является определенным сокращением по сравнению с предыдущим поколением, где это было 390 мм². Новые системы также будут использовать шину PCIe 5.0.

AMD Radeon RX 9070 XT AMD Radeon RX 9070 Nvidia geforce rtx 5070 ti Nvidia geforce rtx 5070
Архитектура Rdna 4 Rdna 4 Блэквелл Блэквелл
Литография TSMC N4P (4 нм) TSMC N4P (4 нм) TSMC 4n (5 нм) TSMC 4n (5 нм)
Основной Navi 48 XTX Navi 48 XT GB203-300 GB205-300
Поверхность 357 мм² 357 мм² 378 мм² 263 мм²
Транзисторы 53,9 млрд 53,9 млрд 45,6 млрд 31 миллиард
Cu / SM -блоки 64 56 70 48
FP32 единицы 4096 3584 8960 6144
Реп 128 128 96 64
TMU 256 224 280 192
RT ядра 64 56 70 48
Ядра AI 128 112 280 192
Базовые часы 2400 МГц (игра) 2070 МГц (игра) 2300 МГц 2160 МГц
Турбо часы 2970 МГц 2520 МГц 2450 МГц 2510 МГц
Врамная память 16 ГБ GDDR6 16 ГБ GDDR6 16 ГБ GDDR7 12 ГБ GDDR7
Скорость VRAM 20 Гбит / с 20 Гбит / с 28 Гбит / с 28 Гбит / с
Главная линия 256-битный 256-битный 256-битный 192-бит
Емкость 640 ГБ/с 640 ГБ/с 896 ГБ/с 672 ГБ/с
Амд Кэш Бесконечности 64 МБ (3. Gen) 64 МБ (3. Gen)
FP32 Power 48,7 TFLOPS 36.1 Tflops 44 TFLOPS 31 TFLOPS
Power FP8 (AI Tops) 703 Tops AI 494 AI Tops
FP4 Power (AI Tops) 1406 Tops 988 Tops
Int8 Power (AI Tops) 779 Tops AI 578 AI Tops Нет информации Нет информации
Int4 Power (AI Tops) 1557 Tops 1156 Tops Нет информации Нет информации
DLSS / FSR FSR 4 FSR 4 DLSS 4 DLSS 4
Главная линия PCIE 5.0 X16 PCIE 5.0 X16 PCIE 5.0 X16 PCIE 5.0 X16
HDMI HDMI 2.1b HDMI 2.1b HDMI 2.1 HDMI 2.1
DisplayPort Displayport 2.1a UHB13.5 Displayport 2.1a UHB13.5 Displayport 2.1b UHBR20 Displayport 2.1b UHBR20
TDP 304 Вт 220 Вт 300 Вт 250 Вт
MSRP цена 599 долларов США 549 долларов США 749 долларов США 549 долларов США

AMD Radeon RX 9070 XT и графические карты Radeon RX 9070 будут доступны только в нереферентных версиях

Что касается изменений в самой архитектуре, мы начнем с обсуждения наиболее жгучей темы, то есть повышения эффективности в районе и внедрении поддержки отслеживания пути. Согласно AMD, увеличение производительности должно быть почти в 2,5 раза по сравнению с системами, основанными на RDNA 2 и дважды по сравнению с RDNA 3. Это было достигнуто путем удвоения пересечения треугольников и лучей, ускоренной обработки лучевых и затененных стеков, а также ограничивающих коробок, то есть расчеты столкновения в RAYCOGICE. Кроме того, два блока RA (Ray Accelerator) (Ray Accelerator) (Ray Accelerator), который должен уменьшить требования к памяти, улучшаются на каждые 4 блока расчета Cu. Мы обсудим детали этого вопроса позже в статье. Ускорители пакетов данных также были улучшены, что улучшает обработку команд и, таким образом, влияет на более низкие задержки.

Акции AMD на рынке потребительских процессоров постепенно растет, но компания по -прежнему разделена на разрыв от Intel

Изменения также охватывали подсистему памяти, потому что новые системы будут предлагать 64 МБ памяти третьего уровня — Cache 3 Infinity. Таким образом, AMD продолжает стратегию использования большого кеша, которая направлена ​​на уменьшение задержек и уменьшение нагрузки на шину VRAM, что имеет особое значение с использованием более старого типа памяти GDDR6. Кэш второго уровня (L2) был увеличен до 8 МБ, в то время как память первого уровня (кэш), интегрированная с вычислительными единицами, составляет 2 МБ. Стоит также отметить, что графические системы поддерживают максимум 16 ГБ VRAM на скорости 20 ГБ/с, сотрудничая с 256-битным направлением данных, что означает емкость 640 ГБ/с.

AMD представила финансовые результаты за 2024 год. Компания находится в гораздо лучшем положении, чем Intel

Единицы Cu получили два блока SIMD32, то есть блоки, содержащие 32 вычислительных единица для векторов. Первый из них поддерживает расчеты FMA и Int, то есть расчеты с плавающей запятой и для целых чисел. Второй блок, с другой стороны, поддерживает только расчеты для номеров с плавающей запятой. Вычислительные блоки также оснащены 8 жирными единицами (трансцендентные логические единицы), предназначенные для производительности с более сложными математическими операциями, такими как расчеты с трансцендентными числами (например, π, E). Блоки, ответственные за скалярные расчеты, также были улучшены, что теперь может обрабатывать данные поплавкой 32B в этом FP32. Планировщик также был улучшен, что теперь может обрабатывать загрузку данных и быстрее сохранять данные. Регистр общего назначения для векторных единиц (Vector GPR) имеет емкость 192 т.п.н., а для скалярных расчетов (скалярный GPR) — 8 кб. Общая память между ядрами составляет 128 кб. В целом заключается в повышении эффективности растизации примерно на 50% по сравнению с архитектурой рДНК 3 и почти дважды по сравнению с рДНК 2.

AMD Radeon Anti-Lag 2 может вызвать неудачи Marvel Spider-Man 2.

AMD улучшила сжатие структур данных BVH восьми. в Raytracing, которая ускоряет расчеты, связанные с рендерингом трехмерных сцен в режиме реального времени. BVH позволяет быстро определить, какие объекты в сцене должны быть включены в процесс рендеринга, что влияет на такие эффекты, как ликвидация тени по объектам за видимой игровой сценой. Сжатие этих структур данных в архитектуре RDNA 3 позволяет уменьшить их объем в 0,4 раза по сравнению с предыдущими решениями. Тем не менее, это не единственное изменение — также был улучшен метод королевы, связанных с затенрями, также был улучшен, и был добавлен другой поток. В архитектуре RDNA 3 этот процесс проводился с использованием метода «First Come и Better», в то время как в RDNA 4 возможность изменения очереди, представленной в RDNA 4, которая позволяет вам переводить задачи с длительным временем ожидания. Итак, мы говорим о динамическом распределении регистров. Благодаря этому включение RayTraing и использование более высоких разрешений должно быть связано с меньшим спросом на VRAM и меньшие задержки в доступе к данным.

AMD Radeon RX 7650 GR не является еще одной системой, выпущенной по случаю кроличьего года. Игра аббревиатура означает здесь … отличное издание Radeon

Конечно, в соответствии с текущими тенденциями, эффективность ускорения ИИ также повышается, что будет привести к таким технологиям, как FSR 4. В отношении архитектуры рДНК 3 мы говорим о двухэтажном повышении производительности, за что он отвечает за повышение производительности для вычислений тензора, поддержки для 8B -плавучих расчетов, в этом FP8, Struktred Sparsita Sparsita -Sporta -Model -Modemly -Mle -Mle -Mle. Разрешение, которое будет переведено в эксплуатацию метода FSR 4. Задержки в потоковой передаче были уменьшены и оптимизация для: OBS, FFMPEG и ручной тормоза были введены, что реально приведет к преимуществам для людей, работающих с видео материалами. Что касается двигателя дисплея изображения, новые системы поддерживают Displayport 2.1a и HDMI 2.1b, а также предлагают улучшенное масштабирование и затопку изображения для дисплеев.

AMD Radeon RX 9070 XT и Radeon RX 9070 — мы уже знаем, когда видим новые видеокарты RDNA 4

Подводя итог, AMD ввела несколько значительных изменений в своей архитектуре, особенно в контексте методов отслеживания RT и PT Ray. NVIDIA GEFORCE RTX 4000 и 5000. Окончательное подтверждение производительности этих решений представит тесты, которые появятся в ближайшем будущем.

Источник: PurePC

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии