Mistral представляет семейство моделей Devstral 2 со 123 миллиардами параметров и инструментом CLI для программирования на естественном языке
Mistral AI только что поднял ставку в гонке за наиболее эффективные инструменты автоматизации разработки программного обеспечения. Новые модели Devstral 2 с интерфейсом командной строки Mistral Vibe CLI — прямой ответ на доминирование закрытых решений Anthropic Claude Code или GitHub Copilot. Европейцы выбрали модель с открытым исходным кодом. По тестам он соответствует коммерческим гигантам, но при этом предлагает гораздо более низкие эксплуатационные расходы.
Devstral 2 на данный момент является лучшей моделью с открытым исходным кодом для создания автономных программных агентов, достигая 72,2% при незначительном отставании от параметров конкурентов. эффективность в решении реальных проблем GitHub.
Польская команда SoftServe выиграла хакатон Google Cloud Agentic Era Hackathon 2025 с решением Team Buddy
Devstral 2 — модель со 123 миллиардами параметров, достигшая результата 72,2% в стандартном тесте SWE-bench Verified. Этот тест представляет собой набор из 500 реальных задач по программированию, взятых прямо из билетов GitHub. ИИ должен прочитать описание ошибки, проанализировать исходный код и сгенерировать работающий патч, прошедший модульное тестирование. Этот результат ставит французскую модель в число лучших решений с открытым исходным кодом на рынке, опережая, среди прочего, китайскую DeepSeek V3.2. Хотя закрытый Anthropic Claude Sonnet 4.5 по-прежнему сохраняет свое преимущество, разрыв между открытыми и коммерческими моделями сокращается с угрожающей скоростью.
Google Jules — это автономный агент искусственного интеллекта, использующий Gemini 2.5 Pro. Самостоятельно пишет, тестирует и реализует код.
Однако «Мистраль» не ограничился одной моделью. Компания также выпустила Mistral Vibe CLI. Это инструмент на базе терминала, который позволяет разработчикам общаться с Devstral на естественном языке и задавать ему работу с несколькими файлами одновременно. Vibe CLI автоматически сканирует структуру проекта и состояние Git, чтобы поддерживать контекст всего репозитория. Таким образом, он не ограничивается одним файлом, а понимает архитектуру системы на более высоком уровне абстракции. Представьте, что вместо того, чтобы объяснять другу «открыть файл X, найти функцию Y и изменить параметр Z»ты просто говоришь «оптимизировать обработку ошибок в модуле авторизации» и это происходит автоматически. Для разработчиков, работающих на менее эффективном оборудовании, Devstral Small 2 подготовлен с 24 миллиардами параметров, что обеспечивает 68 процентов. в том же тесте и может запускаться локально на обычном ноутбуке без подключения к Интернету. Mistral выпустил более крупную модель под модифицированной лицензией MIT, а меньшая Small 2 получила полную лицензию Apache 2.0.
Grammarly представляет агентов искусственного интеллекта для сферы образования. Новые инструменты призваны научить студентов критическому мышлению и письму.
Для конечных пользователей, особенно для небольших групп разработчиков или фрилансеров, Devstral 2 означает доступ к инструментам корпоративного класса без необходимости приобретения дорогостоящих подписок. Devstral 2 стоит в семь раз меньше, чем Claude Sonnet при обработке вывода (2 доллара против 15 долларов за миллион токенов), что резко снижает затраты в производственных сценариях. Возможность локального запуска меньшей модели также устраняет опасения по поводу безопасности конфиденциальных данных. Термин «виброкодирование», придуманный исследователем искусственного интеллекта Андреем Карпати, относится к стилю программирования, при котором разработчик описывает намерения на естественном языке, а ИИ занимается реализацией. Это развитие предыдущих помощников по кодированию, таких как GitHub Copilot, которые в основном функционировали как автозаполнение. Здесь у нас есть автономный агент, способный выполнять многоэтапные операции без человеческого микроуправления. Если эта тенденция сохранится, через год программирование может больше походить на консультацию по архитектуре, чем на ручное объединение блоков кода.
Источник: Mistral AI, SWE-bench.