Сики Чен создал для Клода плагин, который обходит детекторы текста ИИ, используя правила Википедии

Сики Чен создал для Клода плагин, который обходит детекторы текста ИИ, используя правила Википедии

Википедия продолжает бороться с лавиной контента, созданного искусственным интеллектом. Редакторы-добровольцы создали подробное руководство, содержащее 24 характерные особенности, раскрывающие происхождение текста в языковых моделях. От чрезмерного использования таких слов, как «погружение» или «гобелен», до типичных синтаксических структур. Сики Чен решил использовать его по-другому и опубликовал плагин с открытым исходным кодом для помощника Клода, который превращает этот каталог знаков ИИ в… инструкции о том, как их избегать.

Ироничный парадокс: годы работы волонтеров Википедии по каталогизации следов ИИ в тексте превратились в однофайловый плагин, который учит модели Клода тому, как избегать этих следов.

Microsoft Edge 144 представляет возможность скрывать значок Copilot и новый бэкэнд WebGL для сред без графических процессоров.

Плагин под названием «Humanizer» представляет собой всего лишь один файл подсказки, который передает Клоду список из 24 языковых шаблонов и шаблонов форматирования, которые редакторы Википедии определили как типичные для чат-ботов с искусственным интеллектом. Модель получает четкие инструкции. Замените напыщенные выражения простыми фактами, избегайте преувеличенных сравнений, исключите конструкции типа «Речь идет не только о… это…». Это работает именно так, как вы ожидаете. Клод анализирует результаты через призму правил Википедии и систематически удаляет все потенциально проблемные записи.

AMD представляет AI Bundle для драйверов Radeon. Локальные модели ИИ в один клик начиная с завтрашнего дня

Парадокс всей ситуации болезненный. В течение многих лет Википедия руководила проектом WikiProject AI Cleanup, волонтеры которого каталогизировали тысячи случаев текстов, созданных ИИ. Результатом их работы стало одно из наиболее полных руководств по обнаружению ИИ-контента в сети. Документ содержит не только список подозрительных слов, но и анализ более глубоких проблем, таких как поверхностный анализ, рекламный язык или искусственный акцент на важности темы. Исследование 2025 года показало, что активные пользователи LLM могут распознавать тексты AI с точностью 90 процентов, что звучит впечатляюще, пока вы не поймете, что это означает 10 процентов. ложные срабатывания. Теперь те же самые знания, кропотливо развиваемые сообществом, превратились в инструмент, позволяющий обойти обнаружение.

OpenAI представляет рекламную модель в ChatGPT. Анализ новой стратегии монетизации диалоговых приложений ИИ

Проблема выходит далеко за рамки Википедии. В академических кругах детекторы искусственного интеллекта стали этической миной. Такие инструменты, как Turnitin или GPTZero, обещают распознавать тексты, созданные искусственным интеллектом, но их уровень ложных срабатываний варьируется от 1 до даже 20 процентов. для бесплатных вариантов. Для студента это означает потенциальное обвинение в мошенничестве, несмотря на то, что работа написана самостоятельно. Плагин Humanizer еще больше усложняет эту картину. Если модель ИИ сможет научиться избегать отличительных закономерностей, детекторы станут еще более ненадежными. Тем временем Antropic представила в Claude Code систему «Навыки агента», позволяющую динамическую загрузку специализированных инструкций. Humanizer использует именно этот механизм, выступая в роли легковесного плагина, который Клод сканирует и применяет по требованию. Это меняет природу обнаружения ИИ с технической проблемы на философскую. Когда модели могут сознательно скрывать свои характеристики, что мы на самом деле проверяем? Не заметить иронии невозможно. Инструмент, который поможет вам писать «более человечный»само по себе показывает, как далеко мы продвинулись в автоматизации чего-то столь фундаментально человеческого, как язык.

Источник: @blader (X — Сики Чен), Skills.sh, Wikipedia, Ars Technica, TurnItIn

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии