NVIDIA Vera Rubin NVL72 — это 72 графических процессора Rubin, HBM4 с пропускной способностью 22 ТБ/с и стоимостью токена в 10 раз ниже, чем у Blackwell.
NVIDIA официально подтвердила доставку клиентам первых образцов системы Vera Rubin VR200. Это преемник платформы Grace Blackwell, которая, как мы писали при обзоре RTX 5090, произвела революцию в подходе к построению ИИ-ускорителей. На этот раз компания пошла еще дальше, спроектировав с нуля шесть новых чипов и поместив стойку в центр всей архитектуры. Чем «Вера Рубин» отличается от своей предшественницы и оправдано ли повышение цены на 25%?
NVIDIA Vera Rubin NVL72 — не только преемник Blackwell — это доказательство того, что в эпоху «фабрик ИИ» на счету вся стойка, а не один чип.
NVIDIA приобретает важного клиента AMD. Meta заключила многолетнюю сделку на миллионы чипов Blackwell, процессоров Rubin и Grace
Vera Rubin NVL72 — это стойка, состоящая из 72 графических процессоров Rubin и 36 процессоров Vera, процессоров, построенных на собственной архитектуре Olympus (88 ядер, пропускная способность памяти 1,2 ТБ/с). Самым важным изменением является память HBM4. Каждый графический процессор получает 288 ГБ с пропускной способностью 22 ТБ/с, что почти в три раза превышает показатель HBM3e от Blackwell. NVLink 6 удваивает пропускную способность между графическими процессорами до 3,6 ТБ/с, а совокупная внутренняя пропускная способность всей стойки достигает 260 ТБ/с. Энергопотребление выросло до 220 кВт на стойку, но NVIDIA заявляет о 10-кратной меньшей стоимости генерируемого токена и в 4-кратном снижении требований к графическому процессору при обучении моделей MoE. Впервые в истории компания применила полное жидкостное охлаждение без вентиляторов и гибких шлангов в компьютерных лотках.
Инстинкт MI455X без лагов. AMD отвечает на спорный отчет SemiAnaанализа о проблемах с процессом N2
Для операторов центров обработки данных это означает реальную необходимость перестроить инфраструктуру охлаждения перед установкой. Ориентировочная цена превышает 3,5–4 миллиона долларов США за стойку (рост примерно на 25 % по сравнению с Grace Blackwell), что, учитывая заявленную эффективность токена, является аргументом, который, похоже, принимают гиперскейлеры, такие как AWS, Google Cloud или Microsoft Azure. Все три подтвердили реализацию на 2026 год. Однако реальная угроза для NVIDIA появляется там, где ее не было год назад. AMD готовит систему Helios с 72 графическими процессорами MI455X на тот же период и только что подписала контракт с Meta на 6 ГВт этой инфраструктуры.
Источник: CNBC (YouTube), Блог разработчиков NVIDIA, Отдел новостей NVIDIA, WCCFtech