AMD RDNA 4 — Обсуждение архитектуры GPU для предстоящих графических карт Radeon RX 9070 XT и Radeon RX 9070

AMD, наконец, раскрывает изменения в архитектуре RDNA 4, которые будут присутствовать на предстоящих видеокартах. Благодаря улучшению Raytracing, новым методам сжатия и оптимизированному доступу к памяти VRAM, карты Radeon RX 9070 XT и Radeon RX 9070 могут быть серьезным конкуренцией за модели NVIDIA 4000 и 5000 … по крайней мере, мышление на основе официальных слайдов и изменений в RDNA 4.
Архитектура AMD RDNA 4, присутствующая в предстоящих графических картах Radeon RX 9070 XT и Radeon RX 9070, была значительно улучшена по сравнению с предыдущим поколением RDNA.
Monster Hunter Wilds бесплатно при покупке выбранных процессоров AMD Ryzen и видеокарты AMD Radeon
Архитектура AMD RDNA 4 претерпела многочисленные улучшения в RDNA 3. Хотя она все еще использует память GDDR6, мы можем рассчитывать на повышение производительности благодаря многочисленным оптимизациям. Упомянутая итерация архитектуры, используемая в последних графических системах AMD Radeon RX 9070 XT и Radeon RX 9070, основана на монолитной структуре, которая является отходом от модульной структуры с несколькими чипами. Это решение позволяет уменьшить внутренние задержки. GPU был сделан в технологическом процессе TSMC N4P (4 нм), а ядро Navi 48 XTX содержит 53,9 миллиарда транзисторов на площади 356,5 мм², что является определенным сокращением по сравнению с предыдущим поколением, где это было 390 мм². Новые системы также будут использовать шину PCIe 5.0.
AMD Radeon RX 9070 XT | AMD Radeon RX 9070 | Nvidia geforce rtx 5070 ti | Nvidia geforce rtx 5070 | |
Архитектура | Rdna 4 | Rdna 4 | Блэквелл | Блэквелл |
Литография | TSMC N4P (4 нм) | TSMC N4P (4 нм) | TSMC 4n (5 нм) | TSMC 4n (5 нм) |
Основной | Navi 48 XTX | Navi 48 XT | GB203-300 | GB205-300 |
Поверхность | 357 мм² | 357 мм² | 378 мм² | 263 мм² |
Транзисторы | 53,9 млрд | 53,9 млрд | 45,6 млрд | 31 миллиард |
Cu / SM -блоки | 64 | 56 | 70 | 48 |
FP32 единицы | 4096 | 3584 | 8960 | 6144 |
Реп | 128 | 128 | 96 | 64 |
TMU | 256 | 224 | 280 | 192 |
RT ядра | 64 | 56 | 70 | 48 |
Ядра AI | 128 | 112 | 280 | 192 |
Базовые часы | 2400 МГц (игра) | 2070 МГц (игра) | 2300 МГц | 2160 МГц |
Турбо часы | 2970 МГц | 2520 МГц | 2450 МГц | 2510 МГц |
Врамная память | 16 ГБ GDDR6 | 16 ГБ GDDR6 | 16 ГБ GDDR7 | 12 ГБ GDDR7 |
Скорость VRAM | 20 Гбит / с | 20 Гбит / с | 28 Гбит / с | 28 Гбит / с |
Главная линия | 256-битный | 256-битный | 256-битный | 192-бит |
Емкость | 640 ГБ/с | 640 ГБ/с | 896 ГБ/с | 672 ГБ/с |
Амд Кэш Бесконечности | 64 МБ (3. Gen) | 64 МБ (3. Gen) | — | — |
FP32 Power | 48,7 TFLOPS | 36.1 Tflops | 44 TFLOPS | 31 TFLOPS |
Power FP8 (AI Tops) | — | — | 703 Tops AI | 494 AI Tops |
FP4 Power (AI Tops) | — | — | 1406 Tops | 988 Tops |
Int8 Power (AI Tops) | 779 Tops AI | 578 AI Tops | Нет информации | Нет информации |
Int4 Power (AI Tops) | 1557 Tops | 1156 Tops | Нет информации | Нет информации |
DLSS / FSR | FSR 4 | FSR 4 | DLSS 4 | DLSS 4 |
Главная линия | PCIE 5.0 X16 | PCIE 5.0 X16 | PCIE 5.0 X16 | PCIE 5.0 X16 |
HDMI | HDMI 2.1b | HDMI 2.1b | HDMI 2.1 | HDMI 2.1 |
DisplayPort | Displayport 2.1a UHB13.5 | Displayport 2.1a UHB13.5 | Displayport 2.1b UHBR20 | Displayport 2.1b UHBR20 |
TDP | 304 Вт | 220 Вт | 300 Вт | 250 Вт |
MSRP цена | 599 долларов США | 549 долларов США | 749 долларов США | 549 долларов США |
AMD Radeon RX 9070 XT и графические карты Radeon RX 9070 будут доступны только в нереферентных версиях
Что касается изменений в самой архитектуре, мы начнем с обсуждения наиболее жгучей темы, то есть повышения эффективности в районе и внедрении поддержки отслеживания пути. Согласно AMD, увеличение производительности должно быть почти в 2,5 раза по сравнению с системами, основанными на RDNA 2 и дважды по сравнению с RDNA 3. Это было достигнуто путем удвоения пересечения треугольников и лучей, ускоренной обработки лучевых и затененных стеков, а также ограничивающих коробок, то есть расчеты столкновения в RAYCOGICE. Кроме того, два блока RA (Ray Accelerator) (Ray Accelerator) (Ray Accelerator), который должен уменьшить требования к памяти, улучшаются на каждые 4 блока расчета Cu. Мы обсудим детали этого вопроса позже в статье. Ускорители пакетов данных также были улучшены, что улучшает обработку команд и, таким образом, влияет на более низкие задержки.
Акции AMD на рынке потребительских процессоров постепенно растет, но компания по -прежнему разделена на разрыв от Intel
Изменения также охватывали подсистему памяти, потому что новые системы будут предлагать 64 МБ памяти третьего уровня — Cache 3 Infinity. Таким образом, AMD продолжает стратегию использования большого кеша, которая направлена на уменьшение задержек и уменьшение нагрузки на шину VRAM, что имеет особое значение с использованием более старого типа памяти GDDR6. Кэш второго уровня (L2) был увеличен до 8 МБ, в то время как память первого уровня (кэш), интегрированная с вычислительными единицами, составляет 2 МБ. Стоит также отметить, что графические системы поддерживают максимум 16 ГБ VRAM на скорости 20 ГБ/с, сотрудничая с 256-битным направлением данных, что означает емкость 640 ГБ/с.
AMD представила финансовые результаты за 2024 год. Компания находится в гораздо лучшем положении, чем Intel
Единицы Cu получили два блока SIMD32, то есть блоки, содержащие 32 вычислительных единица для векторов. Первый из них поддерживает расчеты FMA и Int, то есть расчеты с плавающей запятой и для целых чисел. Второй блок, с другой стороны, поддерживает только расчеты для номеров с плавающей запятой. Вычислительные блоки также оснащены 8 жирными единицами (трансцендентные логические единицы), предназначенные для производительности с более сложными математическими операциями, такими как расчеты с трансцендентными числами (например, π, E). Блоки, ответственные за скалярные расчеты, также были улучшены, что теперь может обрабатывать данные поплавкой 32B в этом FP32. Планировщик также был улучшен, что теперь может обрабатывать загрузку данных и быстрее сохранять данные. Регистр общего назначения для векторных единиц (Vector GPR) имеет емкость 192 т.п.н., а для скалярных расчетов (скалярный GPR) — 8 кб. Общая память между ядрами составляет 128 кб. В целом заключается в повышении эффективности растизации примерно на 50% по сравнению с архитектурой рДНК 3 и почти дважды по сравнению с рДНК 2.
AMD Radeon Anti-Lag 2 может вызвать неудачи Marvel Spider-Man 2.
AMD улучшила сжатие структур данных BVH восьми. в Raytracing, которая ускоряет расчеты, связанные с рендерингом трехмерных сцен в режиме реального времени. BVH позволяет быстро определить, какие объекты в сцене должны быть включены в процесс рендеринга, что влияет на такие эффекты, как ликвидация тени по объектам за видимой игровой сценой. Сжатие этих структур данных в архитектуре RDNA 3 позволяет уменьшить их объем в 0,4 раза по сравнению с предыдущими решениями. Тем не менее, это не единственное изменение — также был улучшен метод королевы, связанных с затенрями, также был улучшен, и был добавлен другой поток. В архитектуре RDNA 3 этот процесс проводился с использованием метода «First Come и Better», в то время как в RDNA 4 возможность изменения очереди, представленной в RDNA 4, которая позволяет вам переводить задачи с длительным временем ожидания. Итак, мы говорим о динамическом распределении регистров. Благодаря этому включение RayTraing и использование более высоких разрешений должно быть связано с меньшим спросом на VRAM и меньшие задержки в доступе к данным.
AMD Radeon RX 7650 GR не является еще одной системой, выпущенной по случаю кроличьего года. Игра аббревиатура означает здесь … отличное издание Radeon
Конечно, в соответствии с текущими тенденциями, эффективность ускорения ИИ также повышается, что будет привести к таким технологиям, как FSR 4. В отношении архитектуры рДНК 3 мы говорим о двухэтажном повышении производительности, за что он отвечает за повышение производительности для вычислений тензора, поддержки для 8B -плавучих расчетов, в этом FP8, Struktred Sparsita Sparsita -Sporta -Model -Modemly -Mle -Mle -Mle. Разрешение, которое будет переведено в эксплуатацию метода FSR 4. Задержки в потоковой передаче были уменьшены и оптимизация для: OBS, FFMPEG и ручной тормоза были введены, что реально приведет к преимуществам для людей, работающих с видео материалами. Что касается двигателя дисплея изображения, новые системы поддерживают Displayport 2.1a и HDMI 2.1b, а также предлагают улучшенное масштабирование и затопку изображения для дисплеев.
AMD Radeon RX 9070 XT и Radeon RX 9070 — мы уже знаем, когда видим новые видеокарты RDNA 4
Подводя итог, AMD ввела несколько значительных изменений в своей архитектуре, особенно в контексте методов отслеживания RT и PT Ray. NVIDIA GEFORCE RTX 4000 и 5000. Окончательное подтверждение производительности этих решений представит тесты, которые появятся в ближайшем будущем.
Источник: PurePC