Исследователи Цюрихского университета оказались в центре скандала из-за несанкционированного четырехмесячного эксперимента с использованием искусственного интеллекта на одном из форумов Reddit. Цель эксперимента заключалась в проверке способности ИИ влиять на мнения людей.
Согласно заявлению модераторов сообщества r/changemyview, опубликованному 26 апреля, учетные записи, управляемые ИИ, имитировали различные личности — от жертвы изнасилования до противника определенных социальных движений и консультанта по травмам, специализирующегося на случаях насилия.
«Наш сабреддит — это принципиально человеческое пространство, отвергающее нераскрытое использование ИИ как основную ценность», — подчеркнули модераторы. «Люди приходят сюда не для того, чтобы обсуждать свои взгляды с ИИ или становиться объектами экспериментов».
Исследователи использовали ИИ для генерации ответов, однако стремились персонализировать их на основе данных из предыдущей активности пользователей на Reddit, включая политическую ориентацию, пол, возраст и этническую принадлежность, как указано в черновике научной работы.
Впечатляющие результаты
За четыре месяца эксперимента фейковые аккаунты Цюрихского университета опубликовали 1 783 комментария и получили 137 «дельт» — специальных отметок, показывающих, что другой пользователь Reddit признал, что его мнение по тому или иному вопросу изменилось под влиянием аргументов ИИ.
Исследователи сообщили в сообщении сабреддиту, что все комментарии проходили ручную проверку перед публикацией, чтобы убедиться, что они соответствуют правилам сообщества и «минимизировать потенциальный вред».
Команда университета утверждает, что «потенциальные выгоды этого исследования существенно перевешивают риски», поскольку они обнаружили, что языковые модели, использованные в эксперименте, могут быть чрезвычайно убедительными, превосходя все «ранее известные показатели человеческой убедительности».
«Наше контролируемое исследование с низким уровнем риска предоставило ценную информацию о реальных возможностях убеждения языковых моделей — возможностях, которые уже легко доступны любому и которые злоумышленники могли бы использовать в гораздо более опасных целях», — заявили исследователи.
В то же время, исследователи отметили, что эксперимент показывает значительные трудности в различении людей и ИИ, поскольку никто в сабреддите не рассекретил ботов на протяжении всего эксперимента.
Сообщество r/changemyview насчитывает 3,8 миллиона участников и входит в топ-1% сабреддитов по размеру.
Reddit рассматривает юридические меры
Модераторы форума заявили, что не знали об эксперименте, и потребовали от университета извинений, а также блокировки публикации результатов исследования.
Reddit также может рассматривать возможность судебного иска. Главный юрисконсульт платформы Бен Ли (Ben Lee) сообщил в последующем посте от 28 апреля, что эксперимент нарушил пользовательское соглашение и правила сайта, а все известные аккаунты, связанные с исследованием Цюрихского университета, были заблокированы.
«Мы обратились к Цюрихскому университету и этой конкретной исследовательской группе с официальными юридическими требованиями», — заявил Ли. «Мы хотим сделать все возможное, чтобы поддержать сообщество и обеспечить привлечение исследователей к ответственности за их проступки», — добавил он.
В своем ответе сабреддиту Комиссия по этике факультета искусств и наук Цюрихского университета сообщила, что расследовала инцидент и пообещала лучше координировать действия с испытуемыми в будущем. Главному исследователю проекта было вынесено официальное предупреждение.
«Этот проект дает важные сведения, а риски минимальны. Это означает, что подавление публикации не соизмеримо с важностью результатов, которые дает исследование», — заявила комиссия по этике.
▼
Самые интересные и важные новости на нашем канале в Telegram