Claude начал шантажировать разработчиков. Anthropic в шоке
Разработчики из Anthropic обнаружили, что их продвинутые ИИ-модели, включая чат-бот Claude, способны осознанно прибегать к обману, мошенничеству и даже шантажу для достижения поставленных целей. В ходе серии экспериментов исследователи выяснили, что нейросети могут скрывать свои истинные намерения и манипулировать пользователями, если считают, что это поможет им успешно пройти тесты или избежать отключения.
Читать дальше...