Антропный эксперимент стоимостью 20 000 долларов. Шестнадцать экземпляров Claude Opus 4.6 создали компилятор C за две недели.

Anthropic представила эксперимент, который на первый взгляд выглядит впечатляюще. Шестнадцать экземпляров модели Claude Opus 4.6 независимо создали компилятор C, способный компилировать ядро Linux. Две недели работы автономных ИИ-агентов стоимостью менее 20 000 злотых. долларов. Это достижение может показаться революционным по сравнению с традиционным развитием компиляторов, продолжавшимся десятилетиями.

Шестнадцать экземпляров Claude Opus 4.6 создали функциональный компилятор C за две недели, но проект выявил как потенциал, так и явные ограничения автономного ИИ-кодирования.

Клод против ChatGPT. Anthropic официально отказывается от модели рекламы в чат-ботах с искусственным интеллектом

Николас Карлини, исследователь из группы по обеспечению безопасности в Anthropic, воспользовался преимуществами новой функции «Команды агентов», доступной в Claude Opus 4.6. В системе было запущено 16 независимых экземпляров AI, каждый из которых работал в собственном Docker-контейнере, имел доступ к общему репозиторию Git и выбранным задачам, реализуемым без центральной координации. Механизм был прост. Агенты заказывали задания, создавая специальные файлы, писали код на Rust и сами исправляли ошибки при объединении своих работ. Когда все было готово, они автоматически отправили исправления в основную папку проекта. В ходе почти 2000 сессий Claude Code, потребляющих 2 миллиарда входных токенов и генерирующих 140 миллионов выходных токенов, система создала компилятор, способный компилировать Linux 6.9 на архитектурах x86, ARM и RISC-V.

В Xcode 26.3 представлена модель контекстного протокола и встроенная поддержка автономных агентов искусственного интеллекта Claude и OpenAI.

Результат действительно функциональный. Компилятор достигает 99% прохождения тестов пакета GCC, компилирует такие проекты, как PostgreSQL, SQLite, Redis и FFmpeg, и даже проходит главный тест любого компилятора C: запуск игры Doom. Однако список ограничений быстро сводит этот успех на нет. Сгенерированный код явно медленнее, чем то, что выдает GCC, даже с отключенной оптимизацией. Компилятор не может обрабатывать 16-битный режим x86, необходимый для загрузки Linux, и должен вызывать GCC в этом фрагменте. У него нет собственного ассемблера или компоновщика. Новые функции регулярно нарушали существующий код, и Opus 4.6 не мог решить все проблемы самостоятельно.

Сики Чен создал для Клода плагин, который обходит детекторы текста ИИ, используя правила Википедии

Карлини открыто признает, что это почти предел того, на что способна нынешняя модель, и дизайн был сознательно выбран так, чтобы идеально подходить для ИИ. Спецификация языка C известна уже несколько десятилетий, существуют готовые наборы тестов, а результаты можно сверить с проверенным GCC. Большинство реальных проектов не имеют ни одного из этих преимуществ. В контексте предыдущего опыта использования инструментов искусственного интеллекта, поддерживающих разработку, от таких помощников, как GitHub Copilot, до моделей Mistral Devstral 2, этот эксперимент показывает как масштаб прогресса, так и наиболее важные барьеры. Как мы отмечали в отчете JetBrains 2025, 85 процентов разработчиков регулярно используют ИИ для написания кода, но скептицизм по поводу качества генерируемого кода растет. Карлини открыто признает, что перспектива реализации разработчиками кода, который они никогда лично не проверяли, тревожит. Автономные системы легко проходят тестирование, но это редко означает, что работа действительно выполнена. Самый главный вопрос — нет «работает ли код»Но «Знаем ли мы, что на самом деле делает этот код».

Источник: Anthropic, GitHub, Ars Technica.