DeepSeek V3.2 и V3.2-Speciale — эти китайские модели искусственного интеллекта соответствуют GPT-5 и Gemini 3 Pro, стоят гораздо дешевле и имеют открытый исходный код.

DeepSeek V3.2 и V3.2-Speciale — эти китайские модели искусственного интеллекта соответствуют GPT-5 и Gemini 3 Pro, стоят гораздо дешевле и имеют открытый исходный код.

Китайская компания DeepSeek только что выпустила две новые модели искусственного интеллекта, которые могут навсегда изменить баланс сил в гонке за доминирование в этой отрасли. DeepSeek V3.2 и его более мощный V3.2-Speciale не только соответствуют последним достижениям OpenAI и Google, но и требуют значительно меньших затрат как на обучение, так и на использование. Более того, обе модели доступны с открытым исходным кодом по лицензии MIT. Любой желающий может скачать, изменить и внедрить их без ограничений.

DeepSeek еще раз доказывает, что можно создать модель искусственного интеллекта передового класса без огромных бюджетов — V3.2-Speciale соответствует Gemini 3 Pro по рассуждениям, а стандарт V3.2 конкурирует с GPT-5, предлагая API до 50 раз дешевле, чем у конкурентов.

Microsoft FARA-7B — компактная ИИ-модель для автономной работы компьютера с производительностью GPT-4o.

Недавно анонсированные модели DeepSeek V3.2 представляют собой революционную архитектурную инновацию. DeepSeek V3.2-Speciale завоевал золотые медали на престижных соревнованиях, включая Международную математическую олимпиаду IMO 2025, Китайскую математическую олимпиаду CMO, финал мирового финала по программированию ICPC и IOI 2025 — достижение, которое ранее было прерогативой исключительно собственных моделей OpenAI и Google DeepMind.

Гугл Нано Банан Про. Откройте для себя новую модель искусственного интеллекта, которая генерирует изображения 4K с идеальной визуализацией текста на нескольких языках.

Самое главное отличие от конкурентов заключается в экономике. DeepSeek V3.2 предлагает API по той же цене, что и модель V3.2-Speciale. DeepSeek V3.2 также представляет новую функцию в виде «мышления при использовании инструментов». Предыдущие модели ИИ теряли нить рассуждений всякий раз, когда вызывали внешний инструмент, например код, поисковую систему или API. Новая архитектура поддерживает непрерывность рассуждений на нескольких этапах, что позволяет беспрепятственно решать сложные проблемы, требующие десятков операций. Компания тренировала эту способность на синтетическом наборе данных, содержащем более 1800 различных задач и 85 000 сложных инструкций.

Искусственный интеллект Google AI Mode Shopping будет делать покупки за вас и звонить в магазины. Это не научная фантастика, это уже работает

Стратегия DeepSeek в отношении открытого исходного кода бросает вызов основам бизнеса конкурентов. В то время как OpenAI и Anthropic защищают свои лучшие модели как собственные активы, DeepSeek делает полные веса моделей доступными на платформе Hugging Face под разрешительной лицензией MIT. Любой разработчик может загрузить модели и развернуть их локально или в облаке без каких-либо лицензионных сборов. Это меняет уравнение стоимости для бизнеса. Они обеспечивают производительность высочайшего уровня, значительно более низкие затраты и полную гибкость развертывания.

Новая модель Google Gemini 3 Pro превосходит GPT-5.1 в тестах обработки внешнего кода и генерации кода.

Долгосрочные последствия для рынка значительны. Во-первых, DeepSeek демонстрирует, что контроль США за экспортом передовых чипов NVIDIA (H100, H800) не останавливает прогресс Китая в области искусственного интеллекта. Компания, вероятно, использует отечественные ускорители от Huawei и Cambricon. Во-вторых, доступность моделей с открытым исходным кодом на передовом уровне может ускорить внедрение ИИ, но также вызывает проблемы со стороны регулирующих органов. Германия и Италия уже заблокировали более ранние версии DeepSeek из-за передачи пользовательских данных в Китай. В-третьих, бизнес-модель, основанная на дорогих API-сервисах, таких как ChatGPT, подвергается сомнению, когда столь же эффективные альтернативы доступны практически бесплатно. Для конечного пользователя это означает реальное снижение эксплуатационных расходов на ИИ. Компания, обрабатывающая миллионы токенов в день, может сэкономить десятки тысяч долларов в месяц, перейдя на DeepSeek. С другой стороны, вопросы суверенитета данных и потенциального доступа китайских властей к информации, обрабатываемой моделью, могут ограничить ее внедрение в таких чувствительных секторах, как финансы, оборона и здравоохранение.

Источник: DeepSeek, South China Morning Post, arXiv, Hugging Face.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии