Блокчейн, финтех, новая экономика, блэкджек

Claude 3.5 Sonnet: ИИ научился управлять компьютером

Новости

Компания Anthropic представила обновленную версию искусственного интеллекта Claude 3.5 Sonnet, способную самостоятельно управлять компьютером. Новая модель не просто общается с пользователем — она может перемещать курсор, прокручивать страницы и нажимать кнопки, как человек.

Исследователь Anthropic Сэм Рингер (Sam Ringer) продемонстрировал, как Claude анализирует CRM-систему (программу для управления взаимоотношениями с клиентами), находит информацию о компании и самостоятельно заполняет формы на внешних веб-сайтах.

Неожиданный релиз

Пользователи Reddit первыми заметили существенное улучшение в работе системы еще до официального анонса. Они отмечали повышение скорости и точности ответов, а также исчезновение излишних извинений в общении.

По данным Anthropic, показатели Claude 3.5 Sonnet в тестировании программного кода выросли с 33,4% до 49% по методике SWE-bench Verified, превзойдя конкурирующие решения, включая o1-preview от OpenAI.

Компьютер под управлением ИИ

Функция «computer use» находится в открытом бета-тестировании и доступна через API. ИИ анализирует происходящее на экране и может выполнять различные задачи: от навигации по сайтам до работы с программными приложениями.

Anthropic хранит скриншоты действий системы в течение 30 дней и проводит проверки безопасности. Это особенно актуально после недавней ситуации с Microsoft, когда функция Copilot+ Recall вызвала опасения из-за возможности несанкционированной слежки за пользователями.

Практическое применение

  • Компания Replit уже интегрирует функцию управления компьютером для автоматизации оценки приложений
  • The Browser Company тестирует возможности оптимизации рабочих процессов в браузере
  • Разработчики исследуют потенциал автоматизации сложных последовательностей действий

Доступная версия

Anthropic также анонсировала обновление бюджетной модели Claude 3.5 Haiku, которая теперь не уступает по мощности предыдущему флагману Claude 3 Opus. При этом она работает быстрее и стоит значительно дешевле. В тестах программирования Haiku достигла показателя 40,6% по методике SWE-bench Verified, что превосходит результаты более дорогих конкурентов. Выпуск Claude 3.5 Haiku запланирован на ноябрь.

Последние обновления демонстрируют значительный прогресс в развитии искусственного интеллекта, способного не только обрабатывать информацию, но и выполнять практические действия в компьютерных системах.


Самые интересные и важные новости на нашем канале в Telegram

Понравилась статья?

Подпишись на e-mail рассылку и будь всегда в курсе последних событий
BTC
66590-1.29%
ETH
2573.28-2.42%
BCH
350.2-2.12%
XRP
0.53-1.36%
Ту зе МУН