Бот в овечьей шкуре: Цюрихский университет провел тайный эксперимент с ИИ на Reddit

Ева Литвиненко 2025-04-29

Исследователи Цюрихского университета оказались в центре скандала из-за несанкционированного четырехмесячного эксперимента с использованием искусственного интеллекта на одном из форумов Reddit. Цель эксперимента заключалась в проверке способности ИИ влиять на мнения людей.

Согласно заявлению модераторов сообщества r/changemyview, опубликованному 26 апреля, учетные записи, управляемые ИИ, имитировали различные личности — от жертвы изнасилования до противника определенных социальных движений и консультанта по травмам, специализирующегося на случаях насилия.

«Наш сабреддит — это принципиально человеческое пространство, отвергающее нераскрытое использование ИИ как основную ценность», — подчеркнули модераторы. «Люди приходят сюда не для того, чтобы обсуждать свои взгляды с ИИ или становиться объектами экспериментов».

Исследователи использовали ИИ для генерации ответов, однако стремились персонализировать их на основе данных из предыдущей активности пользователей на Reddit, включая политическую ориентацию, пол, возраст и этническую принадлежность, как указано в черновике научной работы.

Впечатляющие результаты

За четыре месяца эксперимента фейковые аккаунты Цюрихского университета опубликовали 1 783 комментария и получили 137 «дельт» — специальных отметок, показывающих, что другой пользователь Reddit признал, что его мнение по тому или иному вопросу изменилось под влиянием аргументов ИИ.

Исследователи сообщили в сообщении сабреддиту, что все комментарии проходили ручную проверку перед публикацией, чтобы убедиться, что они соответствуют правилам сообщества и «минимизировать потенциальный вред».

Команда университета утверждает, что «потенциальные выгоды этого исследования существенно перевешивают риски», поскольку они обнаружили, что языковые модели, использованные в эксперименте, могут быть чрезвычайно убедительными, превосходя все «ранее известные показатели человеческой убедительности».

«Наше контролируемое исследование с низким уровнем риска предоставило ценную информацию о реальных возможностях убеждения языковых моделей — возможностях, которые уже легко доступны любому и которые злоумышленники могли бы использовать в гораздо более опасных целях», — заявили исследователи.

В то же время, исследователи отметили, что эксперимент показывает значительные трудности в различении людей и ИИ, поскольку никто в сабреддите не рассекретил ботов на протяжении всего эксперимента.

Сообщество r/changemyview насчитывает 3,8 миллиона участников и входит в топ-1% сабреддитов по размеру.

Reddit рассматривает юридические меры

Модераторы форума заявили, что не знали об эксперименте, и потребовали от университета извинений, а также блокировки публикации результатов исследования.

Reddit также может рассматривать возможность судебного иска. Главный юрисконсульт платформы Бен Ли (Ben Lee) сообщил в последующем посте от 28 апреля, что эксперимент нарушил пользовательское соглашение и правила сайта, а все известные аккаунты, связанные с исследованием Цюрихского университета, были заблокированы.

«Мы обратились к Цюрихскому университету и этой конкретной исследовательской группе с официальными юридическими требованиями», — заявил Ли. «Мы хотим сделать все возможное, чтобы поддержать сообщество и обеспечить привлечение исследователей к ответственности за их проступки», — добавил он.

В своем ответе сабреддиту Комиссия по этике факультета искусств и наук Цюрихского университета сообщила, что расследовала инцидент и пообещала лучше координировать действия с испытуемыми в будущем. Главному исследователю проекта было вынесено официальное предупреждение.

«Этот проект дает важные сведения, а риски минимальны. Это означает, что подавление публикации не соизмеримо с важностью результатов, которые дает исследование», — заявила комиссия по этике.

▼
Самые интересные и важные новости на нашем канале в Telegram