Антропик хочет заглянуть внутрь ИИ. Мы узнаем до 2027 года, как на самом деле думают языковые модели?

Наряду с растущей важности технологий с использованием ИИ, вопросы о том, как проектировать и дальнейшее развитие, все чаще возникают. Прозрачность, безопасность и ответственность становятся темами, которые интересуют не только специалистов, но и общественное мнение. Новые исследовательские инициативы, предпринятые языковыми моделями, могут изменить способ мышления о системах ИИ и их приложениях в ближайшие годы.
Развитие ИИ недопустимо, не понимая его действия. Нам нужно знать, как эти системы принимают решения — Дарио Амодеей, генеральный директор Anpropic.
Антропический Клод получил доступ к Интернету. Новая функция увеличивает полезность ИИ в ежедневных приложениях
Anpropic, одна из самых важных компаний, занимающихся развитием безопасного и устойчивого искусственного интеллекта, объявила о новой стратегической цели. К 2027 году он хочет значительно расширить понимание того, как языковые модели принимают решения. Глава компании, Дарио Амодеэй, в обширном сообщении в блоге, озаглавленном срочности интерпретации, сравнил текущее состояние исследований искусственного интеллекта для создания ядерного реактора без диагностических схем и инструментов. Он подчеркнул, что искусственный интеллект стал слишком сильным, чтобы продолжать относиться к нему как к «черному ящику», внутренние процессы которого остаются неразборчивыми для людей. Согласно Amodea, игнорирование этой проблемы может привести к реальным угрозам, тем более что модели все более и более автономны, а также используются в чувствительных секторах, таких как национальная безопасность, медицина и финансы.
Приступают чат -боты, которые будут работать в 10 раз быстрее, чем присутствующие. Меркурий — первая серия DLLM, которая доказывает это
Антрические планы более специфичны, чем большинство предыдущих деклараций индустрии ИИ в этой области. Компания не только определила временные рамки (2027), но также указала на реальные подходы к исследованиям, которые она уже тестирует. Среди них, среди прочего, методы, которые позволяют отображать работу отдельных нейронов в моделях крупных языков, анализ повторяющихся моделей в принятии решений с помощью ИИ и инструментов тестирования Механистическая интерпретацияПолем Одним из примеров является проект, пытающийся назначить «значение» конкретным фрагментам нейронной сети. Цель состоит в том, чтобы определить, возможно ли систематически распознать, какие части модели ответственны за конкретные действия или ответы. Несмотря на то, что это все еще базовое исследование, согласно Anpropic, успех в этой области может изменить способ создания и контроля передовых моделей ИИ. Компания также рассчитывает на сотрудничество с другими игроками, как академической средой, так и партнеров из технологической индустрии.
Источник: Дарио Амодеей, TechCrunch, время