Дефицита HBM нет: Positron AI готовит LPDRR5x терабайтный ИИ-ускоритель Азимова

Дефицита HBM нет: Positron AI готовит LPDRR5x терабайтный ИИ-ускоритель Азимова

Positron AI объявила, что привлекла 230 миллионов долларов в рамках раунда финансирования серии B с превышением подписки, оценивая компанию в более чем 1 миллиард долларов. Раунд возглавили ARENA Private Wealth, Jump Trading и Unless при участии новых инвесторов Qatar Investment Authority (QIA), Arm and Helena, а также существующих инвесторов Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures и 1517.

Объявление было сделано на Web Summit Qatar, что подчеркивает растущий международный авторитет компании, отмечает eWeek. Позитрону ИИ потребовалось 34 месяца, чтобы превратиться в единорога.

Positron AI отметил решение Jump Trading выйти в число лидеров раунда после того, как компания стала ее клиентом. «Для рабочих нагрузок, которые нас интересуют, память и энергопотребление все чаще становятся узкими местами, а не теоретическими соображениями.«, — сказал технический директор Jump Trading. «В наших тестах Positron Atlas продемонстрировал примерно в три раза меньшую задержку, чем системы на базе NVIDIA H100, при оценке рабочих нагрузок вывода, в готовом к производству корпусе с воздушным охлаждением и в цепочке поставок, которую мы могли спланировать.«

Полученные инвестиции ускорят запуск платформы Asimov следующего поколения, созданной по индивидуальному заказу. Компания планирует завершить тестирование Asimov к концу третьего квартала, а испытания станут доступны к концу первого квартала 2027 года. Asimov будет использовать память LPDDR (без HBM), но ее способность приближаться к теоретической пиковой пропускной способности памяти означает, что компании не нужно полагаться на HBM для быстрой генерации токенов, рассказал EE Times технический директор Positron.

Asimov Compute Elements — это эволюция блоков Atlas с добавлением ядер Arm и улучшенным межсоединением. Память Asimov LPDDR5x можно расширить с помощью CXL с 864 ГБ до 2,3 ТБ на чип. Чип позволяет создавать два независимых домена памяти для лучшего использования памяти. Хост-интерфейс чипа — PCI 6.0 x32.

Хотя LPDDR5x дешевле и имеет большую емкость, чем HBM, он существенно проигрывает по пропускной способности. Хотя ускорители NVIDIA Rubin оснащены 288 ГБ памяти HBM4 с пиковой пропускной способностью 22 ТБ/с, потолок Asimov, по данным The Register, составляет около 3 ТБ/с (в спецификациях указано 2,76 ТБ/с). По данным Positron, разница в том, что его чипы фактически могут использовать 90% этой пропускной способности, тогда как графические процессоры на базе HBM достигают только 30% пиковой производительности в реальных условиях, хотя память Рубина по-прежнему примерно в 2,4 раза быстрее, чем память Азимова.

Компания заявила, что чип мощностью 400 Вт оснащен систолической матрицей 512×512, работает на частоте 2 ГГц и поддерживает типы данных TF32, FP16/BF16, FP8, NVFP4 и INT4. Эта матрица управляется несколькими ядрами Armv9 и может быть перенастроена, например, на 128×512 (GEMV) или 512×128 (GEMM), в зависимости от того, какой вариант более эффективен для конкретной задачи.

Четыре чипа Asimov образуют платформу Titan высотой 4U с воздушным охлаждением и межчиповой пропускной способностью 16 Тбит/с. В компании отметили, что Asimov рассчитан на поддержку 2 ТБ памяти на каждый ускоритель и 8 ТБ памяти в системе Titan с такой же пропускной способностью памяти, как у ускорителя NVIDIA Rubin. В масштабе стойки это соответствует более 100 ТБ хранилища. До 4096 систем Titan (16 384 ускорителей) можно объединить в один масштабируемый домен с объемом памяти более 32 ПБ. Это достигается за счет чистого межчипового соединения, а не за счет переключаемых масштабируемых сетей, используемых в стоечных архитектурах NVIDIA или AMD.

Positron подчеркивает, что его архитектура, ориентированная на память, обеспечивает доступ к высокопроизводительным задачам вывода, включая большие, большие, длинные контекстные языковые модели, рабочие процессы агентов, а также модели мультимедиа и видео следующего поколения.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии