Википедия теряет человеческий трафик из-за ботов. Фонд призывает пользователей нажимать на исходные материалы

Практически каждый человек, имеющий доступ к Интернету, знает Википедию. Эта цифровая энциклопедия, созданная волонтерами, содержит информацию практически по каждой теме. Однако онлайн-мир претерпевает серьезные изменения, поскольку сегмент искусственного интеллекта продолжает развиваться. Некоторые люди полагаются на чат-ботов или сводки AI и не заходят на страницы-источники, а значит, теряют прямой контакт с получателями, и Википедия не является исключением.
Википедия сталкивается не только с волнами ботов, которые пытаются обойти системы, обнаруживающие их присутствие и собирающие данные, но и с меньшей активностью реальных пользователей. Виновный? Искусственный интеллект.
Сьюзан Кью Инь / Unsplash
Как использовать Википедию без доступа в Интернет? База данных онлайн-энциклопедии доступна каждому в автономном режиме.
Для развития искусственный интеллект нужны данные, которые в основном собираются ботами и затем используются для обучения моделей — без согласия авторов. Этот сценарий является значительной нагрузкой для различных веб-сайтов, поскольку упомянутые боты копируют с них различные данные и нагружают сетевую инфраструктуру. В конечном итоге пользователь, ищущий информацию по заданной теме, все чаще обращается к чат-ботам, таким как ЧатGPT или завершает поиск после отображения вышеупомянутой сводки AI Google. Эти и подобные решения способны показывать информацию из Википедии, но это не приводит напрямую к ценному трафику на этой платформе, поскольку пользователь не всегда кликает по доступным ссылкам. Здесь мы подходим к проблеме, которая на самом деле касается не только ее самой. Википедияно и другие веб-сайты, которые теряют «человеческие взгляды» из-за искусственного интеллекта, обученного на поступающих от них данных. В апреле 2025 года Фонд Викимедиа сообщил, что боты и пауки (так называемые сканеры) перегружают его сетевую инфраструктуру, о чем мы можем прочитать подробнее. ЗДЕСЬ. Не так давно была опубликована еще одна запись, в которой обсуждается дальнейшая ситуация — эта пока выглядит не слишком хорошо для Википедии, так как за последние несколько месяцев (с учетом того же периода, но в предыдущем году) просмотры у реальных людей должны были упасть примерно на 8%. Эти данные связаны с обновленной системой обнаружения ботов, потому что до сих пор… ну, им удавалось ловко выдавать себя за людей и оставаться незамеченными.
*На графике ниже показано снижение «человеческих просмотров» в Википедии, но помните, что это заметно после пересмотра системы обнаружения ботов. Так что, возможно, Википедия уже давно имеет более низкие просмотры со стороны людей, а не только в последние несколько месяцев.
Народные просмотры Википедии за сентябрь 2021 г.; с апреля 2025 года статистика видна после обновления системы обнаружения ботов
Автоматические боты с искусственным интеллектом перегружают серверы Викимедиа. Увеличение использования полосы пропускания вдвое ставит под угрозу стабильность проектов
Wikimedia указывает, что примерно в мае 2025 года она наблюдала неожиданно высокий трафик, за который, казалось бы, отвечали реальные люди из Бразилии. Расследование этого дела показало, что большая часть этого «избыточного» трафика в период с мая по июнь исходила от ботов, которые были созданы, чтобы избежать обнаружения. Именно поэтому система, которая должна была их обнаруживать, была пересмотрена. Викимедиа считает, что эти чат-боты и другие решения искусственного интеллекта, а также платформы социальных сетей, отображающие контент из Википедии и других сайтов, должны не только ссылаться на источники, но и «поощрять»* пользователей посещать и использовать их**. Кроме того, фонд призывает самих пользователей предпринимать действия по посещению исходных материалов при поиске информации в Интернете. Если мы хотим прочитать официальное заявление фонда Викимедиа, мы можем его найти. ПО ЭТОМУ АДРЕСУ.
*Альтернативно: «предложить больше вариантов посещения», «увеличить возможности посещения».
**Точный «LLM, чат-боты с искусственным интеллектом, поисковые системы и социальные платформы, использующие контент Википедии, должны поощрять больше посетителей Википедии», «Чтобы люди доверяли информации, распространяемой в Интернете, платформы должны ясно указывать, откуда получена информация, и расширять возможности для посещения и участия в этих источниках»..
***Стоит иметь в виду, что искусственный интеллект не только обычно разрабатывается с нарушением авторских прав, но и решения на его основе часто вводят в заблуждение (так называемые галлюцинации, т.е. предоставляют ложную информацию и выдают ее за достоверную).
Источник: TechCrunch, Wikimedia, DeepL, Эрхан Астам/Unsplash (отредактировано), popo2021/Flaticon