Bolt Graphics анонсировала универсальную видеокарту с So-DIMM-слотами, которые могут конкурировать с RTX 5080

Bolt Graphics анонсировала универсальную видеокарту с So-DIMM-слотами, которые могут конкурировать с RTX 5080

Все современные видеокарты поставляются с прочно определенным количеством видео для саке, а в самых продуктивных моделях памяти HBM интегрированы в ту же подушку, что и основной кристалл. Однако в последнее время требования к размеру памяти увеличиваются быстрее, и производители все больше требуют дополнительной емкости памяти. Радикально другой подход предлагает Golt Graphics, которая недавно анонсировала серию Zeus.

Несмотря на «пандемию искусственного интеллекта», графика болтов в его сообщении не подчеркивает печально известную технологию, но называет Zeus первым графическим процессором, специально разработанным для HPC, рендеринга, лучей и даже компьютерных игр.

Интересно, что Zeus не основан на некоторой закрытой архитектуре: скалярная часть нового графического процессора основана на спецификации RISC-V RVA23, а векторная часть представлена ​​FP64 ALU, основанной на слегка модифицированном RVV 1.0. Другие функции реализуются посредством расширений потребителей и отдельных акселеративных блоков. Все они используют общий кеш 128 МБ. Блок телеметрии и внутреннее соединение связи с другими вычислительными блоками дополняют конфигурацию.

Был использован подход чипсета. Основной «строительный элемент» Zeus 1C26-032 включает в себя GPU-цифлет, который подключен к 32 ГБ памяти LPDDR5X (273 ГБ/с) и контроллером внешней памяти DDR5 (90 Гбит), т.е. Если вы хотите, вы можете установить еще 128 ГБ оперативной памяти (два SO-DIMM-модуль).

Графический чип процессора создал контроллеры DisplayPort 2.1A и HDMI 2.1B и связывается с внешним миром через io-chiplet, к которому он подключен через емкость 256 ГБ/с. Io-chip предлагает необычный набор портов. В дополнение к двум интерфейсам PCIE 5.0 X16 (Каждые 64 ГБ/с), существует специальный порт RJ-45 для BMC и 400GBE QSFP-DD-порт. Наконец, доступен аппаратный модуль видеокодирования, который может обработать два потока 8K@60 AV1/H.264/H.265.

Запрашиваемый уровень производительности для вектора FP64/FP32/FP16 составляет 5/10/20 TFLOPS, а для расчетов матрицы Int16/Int8 — 307,2/614,4 TFLOPS. Аппаратное устройство для трассировки лучей обеспечивает до 77 лучей Giga/S (Гигал) Для сравнения, NVIDIA RTX 5090 способен предоставлять 32 Giga Rays/S, а производительность FP64 составляет 1,6 TFLOPS. В то же время текущие растворы nvidia все еще быстрее, чем Zeus 1C26-032 в расчетах с пониженной точностью. Тем не менее, новый продукт имеет важное преимущество — его уровень TDP составляет всего 120 Вт. Второй интерфейс PCIE 5.0 X16 может использоваться для непосредственного объединения двух видеокарт.

Вариант с двух чип-акселератором называется Zeus 2C26-064/128, а также с четырьмя-4C26-256. Последние цифры означают количество паяной оперативной памяти LPDDR5X. Что касается расширяемой памяти, то количество доступных слотов SO-DIMM также зависит от модели и составляет до 8, поэтому в флагманской конфигурации базовая 256 ГБ LPDDR5X может быть дополнено до 2 ТБ DDR5. Производительность с увеличением количества графических процессоров почти пропорционально, но есть некоторые другие оттенки. Например, в Zeus 2C26-064 и Zeus 2C26-128 (Оба варианта имеют TDP 250 Вт) Есть только один io-chip, а графические процессоры объединяются автобусом 768-гигабайта.

Разработчики, очевидно, разработали своего ребенка, чтобы предложить широко распространенные возможности шкафа, о которых свидетельствует доступность мощной сетевой подсистемы.

Как скромные конфигурации двух графических процессоров, подключенных непосредственно через Ethernet 400GBE и крупномасштабные системы на уровне шкафа, содержащие 80 Zeus 4C26-256, подключенные как к переключателю, так и непосредственно друг к другу. Такой кластер потребляет 44 кВт, но он способен выполнять крупномасштабные физические симуляции или тренировать I-модели, благодаря огромной общей памяти 160 ТБ. Вычислительные характеристики такого кластера достигают 1,6 PFLOP в режиме FP64 и 196 PFLOPS в режиме FP8.

Одной из особенностей новых продуктов является The Mlowstick Tracer, которая может работать в режиме реального времени почти во всех современных пакетах для 3D -моделирования или редактирования видео, такого как Maya, 3DS Max, Blender, Sketchup, Houdini и Nuke. Он будет дополнен запатентованной библиотекой материалов болта, в том числе более 5000 высококачественных текстур, а также с помощью стандарта OpenUSD он сможет легко интегрироваться в любую рендеринг и последующую цепочку обработки. Также запланировано создание электромагнитного симуляторного болта. Были обещаны Vulkan/DirectX и SDK, используя LLVM.

Bolt Graphics определила ранний доступ к наборам для разработчиков за четвертый квартал этого года. Серверы на основе Zeus 2U должны быть доступны в третьем квартале следующего года, а массовые поставки серверов и карт PCI начнутся только в четвертом квартале того же года. По-прежнему трудно сказать, насколько хороша будет работать новая архитектура, но если мы верим в предварительные тесты Зевса, выгода от существующих ИИ-зеленых, особенно с точки зрения потребления энергии.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии