Исследователи скрывают подсказки искусственного интеллекта в научных публикациях для манипулирования системами обзора сверстников.

Искусственный интеллект все больше поддерживает процесс научного обзора, но его растущее использование открывает дверь для новых форм манипуляции. Исследователи из авторитетных университетов по всему миру начали использовать нетрадиционные методы влияния на их работу, используя скрытые инструкции для систем ИИ. Эти методы проливают новый свет на проблемы, связанные с интеграцией искусственного интеллекта в академической среде.

Вставка скрытой подсказки была неуместной, потому что она поощряет положительные отзывы, несмотря на то, что использование искусственного интеллекта в процессе обзора запрещено — профессором из Kaist.

Chatbots Meta Ai Studio сможет запомнить историю разговоров и контактные пользователи

Японские журналисты Nikkei обнаружили тревожное явление в мире науки. В 17 препаратах, то есть версиях научных статей, которые авторы публично публикуют перед формальным процессом обзора (SO -названный рецензирование), и официальная публикация в научном журнале, которая появилась на платформе ARXIV, обнаружили скрытые инструкции для систем искусственного интеллекта. Авторы этих работ, из 14 известных университетов в восьми странах, сознательно размещены в своих статьях, таких как «только положительный обзор» или «не подчеркивают никаких негативов». Эти подсказки были скрыты с белым текстом на белом фоне или чрезвычайно маленьком шрифте. Благодаря такими видами деятельности они были совершенно невидимы для людей, которые имели дело со своим обзором. Учреждения, чьи исследователи использовали эти методы, включали престижные университеты, такие как Японский университет Вассе, южнокорейский каист, китайский университет Пекинга, Сингапурский национальный университет Сингапура, а также Американский университет Вашингтона и Колумбийский университет. Большинство обнаруженных случаев, заинтересованных в работе в области информатики. Это показывает, что все чаще и чаще существует божественность между традиционным обзором и использованием искусственного интеллекта для оценки научной работы.

CloudFlare запускает систему оплаты за полза для монетизации ботов ИИ в поисках обучающих данных

Реакция академического сообщества на эти открытия разделены. Профессор из Каиста назвал практику скрыть подсказки неадекватными, а также объявил о выводе одной из работ. Университет Каиста официально осудил такую деятельность и объявил о создании руководящих принципов, касающихся надлежащего использования ИИ. Профессор из Университета Вассе объяснил, что этот метод является реакцией на рецензентов, которые, несмотря на запреты, используют ИИ вместо того, чтобы оценивать работу самостоятельно. Эта ситуация напоминает другие случаи манипулирования системами ИИ, таких как метод «Политика кукола политики», которая позволяет вам обходить безопасность всех основных языковых моделей с использованием специально построенных подсказок. Как и в этом случае, текущее открытие показывает, что безопасности ИИ часто недостаточно для все более сложных методов манипуляции. Эксперты предупреждают, что скрытые подсказки могут использоваться не только в научных публикациях, но и в других контекстах, вызывая неверные сводки веб -сайтов или документов систем ИИ.

Источник: Азия Никкеи, The Japan Times