Компания Anthropic представила обновленную версию искусственного интеллекта Claude 3.5 Sonnet, способную самостоятельно управлять компьютером. Новая модель не просто общается с пользователем — она может перемещать курсор, прокручивать страницы и нажимать кнопки, как человек.
Исследователь Anthropic Сэм Рингер (Sam Ringer) продемонстрировал, как Claude анализирует CRM-систему (программу для управления взаимоотношениями с клиентами), находит информацию о компании и самостоятельно заполняет формы на внешних веб-сайтах.
Неожиданный релиз
Пользователи Reddit первыми заметили существенное улучшение в работе системы еще до официального анонса. Они отмечали повышение скорости и точности ответов, а также исчезновение излишних извинений в общении.
По данным Anthropic, показатели Claude 3.5 Sonnet в тестировании программного кода выросли с 33,4% до 49% по методике SWE-bench Verified, превзойдя конкурирующие решения, включая o1-preview от OpenAI.
Компьютер под управлением ИИ
Функция «computer use» находится в открытом бета-тестировании и доступна через API. ИИ анализирует происходящее на экране и может выполнять различные задачи: от навигации по сайтам до работы с программными приложениями.
Anthropic хранит скриншоты действий системы в течение 30 дней и проводит проверки безопасности. Это особенно актуально после недавней ситуации с Microsoft, когда функция Copilot+ Recall вызвала опасения из-за возможности несанкционированной слежки за пользователями.
Практическое применение
- Компания Replit уже интегрирует функцию управления компьютером для автоматизации оценки приложений
- The Browser Company тестирует возможности оптимизации рабочих процессов в браузере
- Разработчики исследуют потенциал автоматизации сложных последовательностей действий
Доступная версия
Anthropic также анонсировала обновление бюджетной модели Claude 3.5 Haiku, которая теперь не уступает по мощности предыдущему флагману Claude 3 Opus. При этом она работает быстрее и стоит значительно дешевле. В тестах программирования Haiku достигла показателя 40,6% по методике SWE-bench Verified, что превосходит результаты более дорогих конкурентов. Выпуск Claude 3.5 Haiku запланирован на ноябрь.
Последние обновления демонстрируют значительный прогресс в развитии искусственного интеллекта, способного не только обрабатывать информацию, но и выполнять практические действия в компьютерных системах.
▼
Самые интересные и важные новости на нашем канале в Telegram