Microsoft FARA-7B — компактная ИИ-модель для автономной работы компьютера с производительностью GPT-4o.

Microsoft FARA-7B — компактная ИИ-модель для автономной работы компьютера с производительностью GPT-4o.

Жизненный цикл инноваций сокращается почти квартал за кварталом, поэтому появление полностью автономных агентов ИИ — это момент, определяющий будущее взаимодействия человека и компьютера. Мы уже много лет слышали о них в контексте научно-фантастических фильмов. Сегодня такие гиганты, как Microsoft, выводят их на рынок. Компактная модель может перевернуть нашу повседневную работу с ПК с ног на голову. Видим ли мы конец эпохи ручного управления интерфейсами?

FARA-7B — это компактная модель агента, которая использует компьютерное зрение и LLM для достижения производительности гораздо более крупных агентов, эффективно автоматизируя сложные задачи на компьютере.

Гугл Нано Банан Про. Откройте для себя новую модель искусственного интеллекта, которая генерирует изображения 4K с идеальной визуализацией текста на нескольких языках.

Microsoft Research официально представила FARA-7B, первую агентную модель малого языка (SLM), разработанную специально для компьютерных интерфейсов. В отличие от традиционных текстовых чат-ботов, FARA-7B представляет собой агента использования компьютера (CUA), который управляет мышью и клавиатурой, как человек, для выполнения задач от имени пользователя: от заполнения форм до поиска информации и бронирования поездок. В основе лежит базовая модель Qwen2.5-VL-7B от Alibaba, которую Microsoft обучила на 145 000 траекториях, охватывающих миллион шагов взаимодействия с множеством веб-сайтов. FARA-7B анализирует только скриншоты браузера, не используя деревья доступности или дополнительные данные, прогнозируя конкретные действия по точным координатам кликов. Это все равно, что научить ИИ наблюдать за экраном точно так же, как это делает человек.

Новая модель Google Gemini 3 Pro превосходит GPT-5.1 в тестах обработки внешнего кода и генерации кода.

Результаты тестов впечатляют. В тесте WebVoyager FARA-7B набрал 73,5 процента. эффективности, превосходя GPT-4o (65,1%) и модель предварительного просмотра компьютерного использования OpenAI (70,9%). Более того, модель Microsoft гораздо эффективнее. В среднем для выполнения задачи требуется всего 16 шагов, тогда как конкурирующий UI-TARS-1.5-7B требует 41 шаг. В недавно представленном тесте WebTailBench, ориентированном на реальные сценарии, такие как бронирование билетов и сравнение цен, FARA-7B набрал 38,4 процента, опередив всех конкурентов.

Искусственный интеллект Google AI Mode Shopping будет делать покупки за вас и звонить в магазины. Это не научная фантастика, это уже работает

Самым большим преимуществом FARA-7B является возможность запускать ее локально на устройстве пользователя. Благодаря своим компактным размерам модель поместится на ПК Copilot+ с ОС Windows 11, где она будет работать с использованием ускорения NPU. Это означает уменьшение задержки и повышение конфиденциальности, поскольку данные никогда не покидают ваш компьютер. Microsoft сделала эту модель доступной по лицензии MIT как на Microsoft Foundry, так и на платформе Hugging Face, что позволяет разработчикам экспериментировать с технологией.

Google Gemini заменит внутренние модели Apple в помощнике Siri AI в iOS 26.4

Для конечного пользователя FARA-7B — это потенциальная революция в автоматизации рутинных веб-задач. Система может самостоятельно искать информацию, совершать покупки в Интернете или управлять аккаунтами, останавливаясь в «критических точках», то есть ситуациях, требующих персональных данных или согласия на необратимые действия. Microsoft рекомендует запускать модель в изолированной среде с полным мониторингом, что снижает риск непреднамеренных действий. Однако стоит помнить, что FARA-7B – экспериментальная версия. Модель разделяет ограничения более крупных систем. Он может допускать ошибки в сложных задачах, неточно следовать инструкциям или генерировать ложную информацию. Microsoft провела интенсивные тесты безопасности, достигнув 82 процентов. процент отказов от вредоносных задач в тесте WebTailBench-Refusals, но технология все еще развивается.

Что нового в Windows 11? Скоро появится более функциональный блокнот, изменения в Microsoft Store, режим Xbox для ПК и многое другое.

Если смотреть шире, появление FARA-7B сигнализирует о важной тенденции в индустрии искусственного интеллекта, то есть о переходе от гигантских облачных моделей к компактным локальным решениям. В то время как Anthropic с моделью Claude Computer Use или OpenAI с функцией оператора ориентированы на крупные модели, требующие мощных серверов, Microsoft доказывает, что эффективные агенты ИИ можно запускать на обычном ноутбуке. Это похоже на эволюцию от мэйнфреймов к персональным компьютерам, только на этот раз речь идет о доступе к интеллектуальным агентам искусственного интеллекта.

Источник: исследования Microsoft.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии