Компания OpenAI анонсировала выпуск последней модели искусственного интеллекта — GPT-4o. Это обновление представляет собой значительный прорыв в области генеративных нейросетей и предлагает новые функции популярного чат-бота ChatGPT.
GPT-4o, где «o» означает «omni» (всесторонний), является кульминацией усилий OpenAI по созданию более интуитивно понятного и многофункционального ИИ. Во время ежегодного мероприятия OpenAI Spring Update технический директор Мира Мурати (Mira Murati) сообщила, что новая модель способна работать с аудио, изображениями и текстом.
Бесплатно для всех
OpenAI делает GPT-4o доступным для всех, что включает в себя возможность использования пользовательских чат-ботов и магазина ChatGPT.
Владельцы бесплатных аккаунтов также получают доступ к расширенным инструментам анализа данных и изображений, а также к памяти, что позволит ChatGPT учитывать предыдущие разговоры.
Что касается платных пользователей ($20 в месяц), то, согласно OpenAI, они по-прежнему будут иметь в 5 раз больше возможностей, чем владельцы бесплатных аккаунтов.
Разговорная речь
Новый голосовой ассистент способен воспроизводить разговорную речь в режиме реального времени и реагировать на голосовые команды всего за 320 миллисекунд, что сравнимо с реакцией в обычном разговоре. При этом ассистент обладает способностью менять тон разговора, воспринимать эмоции пользователя и смеяться, что делает его более человечным и доступным для широкой аудитории.
Голосовой перевод в режиме реального времени
Новый мультиязычный ассистент способен переводить речь на лету, что станет настоящей находкой для путешественников.
Во время демонстрации Мурати разговаривала с голосовым ассистентом по-итальянски, который проявил свою способность хорошо переводить с английского на итальянский и с итальянского на английский.
Зрение
ChatGPT получил новую встроенную функцию зрения, которая позволяет нейросети «видеть» с помощью камеры телефона пользователя. Например, незрячий человек может снимать видео, а GPT-4o в реальном времени расскажет, что видит.
Доступность обновления
Все пользователи уже могут пользоваться GPT-4o с 13 мая, а голосовые функции будут доступны для «небольшой группы доверенных партнеров» в ближайшие недели, а затем и для платных подписчиков в июне.
Это обновление открывает новые горизонты для использования ИИ в самых разных областях, включая образование и развлечения, что, без сомнения, укрепит позиции OpenAI в качестве из одного из лидеров в области искусственного интеллекта.
▼
Самые интересные и важные новости на нашем канале в Telegram