OpenAI раскрывает архитектуру агента Codex CLI — подробности цикла агента и управления контекстом
OpenAI опубликовала обширную техническую публикацию, в которой подробно описывается, как работает Codex CLI, их автоматизированный агент написания кода. Это уникальная ситуация, поскольку компании, занимающиеся искусственным интеллектом, обычно держат такую информацию под замком. Решение о прозрачности особенно важно в контексте растущей конкуренции среди инструментов кодирования с использованием искусственного интеллекта, когда за внимание разработчиков конкурируют такие игроки, как Anthropic, Cursor и Windsurf от Claude Code.
OpenAI впервые подробно раскрывает, как работает цикл агента в интерфейсе командной строки Codex: от подсказок до кэширования и управления контекстными окнами.
Илон Маск требует от OpenAI и Microsoft 134 миллиарда долларов. Абсурдная математика или обоснованное утверждение?
В статье команды OpenAI основное внимание уделяется так называемому агентскому циклу — сердцу каждого ИИ-агента. Это циклический процесс, в котором агент получает данные от пользователя, создает запрос для языковой модели, получает ответ, а затем выполняет вызовы инструментов (например, запуск команды в терминале или чтение файла). Процесс повторяется до тех пор, пока модель не перестанет запрашивать дальнейшие действия и не сгенерирует окончательный ответ. Звучит просто, но дьявол кроется в деталях реализации. OpenAI показывает, что Кодекс взаимодействует с API ответов, создавая подсказки из компонентов различного приоритета: системных инструкций, определений инструментов (включая серверы протокола контекста модели) и пользовательского ввода.
OpenAI представляет рекламную модель в ChatGPT. Анализ новой стратегии монетизации диалоговых приложений ИИ
Самой важной задачей оказывается управление растущей скоростью. Каждый последующий обмен информацией в разговоре добавляет контент, что приводит к квадратичному увеличению передаваемых данных. Компания решает эту проблему с помощью оперативного кэширования, которое меняет сложность с квадратичной на линейную с точными совпадениями. Однако кеш попадает только в случае точного совпадения префиксов, что заставляет разработчиков Кодекса быть осторожными. Изменение порядка инструментов MCP в середине вызова может привести к дорогостоящей потере кэша.
Сам Альтман заявил, что Google может сокрушить OpenAI в 2023 году. OpenAI объявляет состояние повышенной готовности
Когда память заполняется, Кодекс использует специальную функцию сжатия, которая превращает длинную историю разговоров в сжатую версию. Затем модель ИИ получает хэш, содержащий суть предыдущих взаимодействий, что позволяет ей продолжать работу, не выходя за пределы своих возможностей. OpenAI сознательно отказывается от более простого технического решения, требующего хранения данных предыдущих сессий. Это противоречило бы обещаниям конфиденциальности для бизнес-клиентов, которые не хотят, чтобы их код сохранялся на серверах. Это показывает, что архитектурные решения в агентах ИИ касаются не только технологий, но и политики конфиденциальности.
OpenAI приобретает польский Neptune.ai за 400 миллионов долларов. Стартап из Варшавы улучшит обучение моделей ИИ
Столкнувшись с конкурентами, предлагающими визуальные IDE (Cursor) или динамическое разделение работы (Windsurf), OpenAI фокусируется на прозрачности и открытом исходном коде. Codex CLI доступен на GitHub, что отличает его от закрытых решений. Это противоположная стратегия, чем в случае с ChatGPT или веб-интерфейсом, где OpenAI держит реализацию под замком. Для разработчиков это означает возможность заглянуть под капот и понять, как на самом деле функционируют современные агенты кодирования. Это знания, которые могут быть важны при выборе инструмента для повседневной работы. В эпоху, когда ИИ-агенты становятся стандартным элементом рабочего процесса разработки, понимание их ограничений и сильных сторон больше не является роскошью, а становится необходимостью.
Источник: OpenAI, GitHub.