В начале 2024 года мы находимся под впечатлением от технологических достижений прошедшего года, которые включают в себя не только взрывной рост генеративного искусственного интеллекта, но и дальнейшее развитие дополненной и виртуальной реальности (AR/VR). Все это вместе вполне соответствует идеям четвертой промышленной революции.
Что такое четвертая промышленная революция?
Четвертая промышленная революция была объявлена в 2015 году экономистом Клаусом Швабом в журнале «Foreign Affairs», позднее расширенная версия статьи была издана в виде отдельной книги.
Согласно этой концепции, мы стоим на пороге эпохи, в рамках которой технологии объединяют виртуальный мир с физическим. Ключевую роль в этом объединении играют умные машины, ставшие неотъемлемой частью повседневной жизни людей, производства и государственного управления. Эти машины обладают способностью объединяться в сети, анализировать данные и самостоятельно принимать решения.
Четвертой промышленной революции предшествовали три важнейших эпохи:
- Изобретение парового двигателя в конце XVII века.
- Массовое производство XIX века.
- Цифровая революция конца XX века.
Основой текущих революционных изменений являются новейшие достижения в области компьютерного зрения, генеративного искусственного интеллекта и смешанной реальности. Нам предстоит еще узнать, станут ли эти мощные инструменты легендарным Прометеем, несущим просвещение и прогресс, или Франкенштейном, вызвавшим непредвиденные последствия, — но уже теперь не приходится сомневаться в том, что ИИ действительно меняет мир.
Метавселенная 1.0: усеченная версия
Не только генеративный ИИ вступил в эпоху бурного развития в 2023 году. Аналогичным образом, AR и VR начали постепенно вырастать из своих игровых и развлекательных корней в целое дерево таких ветвей, как здравоохранение, образование и розничная торговля.
Тем не менее, технологии метавселенной все еще сталкиваются с серьезными препятствиями на пути к широкому распространению. И, хотя AR и VR впечатляют визуально, они во многих отношениях все еще отражают поверхностность графики видеоигр — им не хватает глубины, точности и того уровня взаимодействия, который отличает по-настоящему успешное программное обеспечение. Например, ограниченные возможности по моделированию анатомии человека снижают эффективность обучения в здравоохранении, да и образование в целом страдает от отсутствия реалистичной среды, необходимой для создания полноценного погружения. Гордиевым узлом текущих приложений AR/VR является то, что лишь 40% пользователей по-настоящему испытывают эффект присутствия, то есть получают продуктивный иммерсивный опыт.
Метавселенная 2.0: рассвет искусственного интеллекта
Основным препятствием на пути к полному погружению в виртуальное пространство являются ограничения традиционной компьютерной графики и проблемы компьютерного зрения, особенно в создании реалистичной масштабируемой графики и генерации 3D-среды на основе двухмерных данных. Прорыв в этой области возможен на основе использования ИИ для перехода от простого ввода данных в компьютер к полноценному творчеству. Примером такого подхода является создание стартапом Pinscreen
высокоточных аватаров на основе единственной фотографии.
Этот метод, использующий генеративный искусственный интеллект, новаторски фиксирует и воспроизводит черты и выражения лица человека, что открывает эру беспрецедентного реализма в цифровых технологиях. Мы можем ожидать синергетической эволюции программного и аппаратного обеспечения, кульминацией которой станет реалистичный и увлекательный опыт, доступный через обычные смартфоны. Такие продукты, как очки смешанной реальности Microsoft HoloLens, демонстрируют возможности AR в создании эффекта присутствия, обеспечивая виртуальный личный контакт и «телепортацию» во внутреннюю атмосферу виртуального пространства. Другим примером является использование гарнитуры Apple Vision Pro для повышения реалистичности цифровых аватаров. Мы действительно находимся на пороге революционного прорыва в получении фотореалистичного, иммерсивного и общедоступного доступа к метавселенной.
Переосмысление цифрового взаимодействия
Ключом к преодолению текущих ограничений AR/VR является сотрудничество с ведущими представителями смежных областей. Примером может служить все тот же Pinscreen, партнерство которого с Netflix позволило добиться выдающихся достижений в области визуального дубляжа. Использование искусственного интеллекта для идеального согласования движений губ иностранных актеров с дублированным звуком английской речи позволяет получить полную иллюзию того, что актеры говорят на английском языке.
Этот подход уже начинает выходить за пределы развлечений и находит свое применение в съемке крупномасштабного окружения и динамичных сцен в режиме реального времени, что представляет значительный интерес для таких гигантов отрасли, как компания Google, которые запускают проекты по цифровому воссозданию городов. Эта технология выходит за рамки традиционного 3D-сканирования и использует нейронные сети для точного трехмерного рендеринга в режиме реального времени. Применение генеративного искусственного интеллекта для динамической оцифровки сцен способно революционизировать взаимодействие с пользователем и сделать, в частности, навигацию в Google Street View такой же легкой и захватывающей, как в видеоигре, расширяя наши возможности по виртуальному исследованию реального мира.
Наступлению новой виртуальной эры сопутствует широкое распространение смартфонов, позволяющее сократить цифровой разрыв, то есть неравенство в доступе к цифровым технологиям. Это указывает на важность простоты использования и доступности новых разработок в области AR/VR. В 2024 году ИИ будет служить не только средством устранения существующих ограничений этих технологий, но и решающим фактором их широкого признания. Искусственный интеллект является тем самым магическим ластиком, который позволит стереть границу между цифровой и физической реальностью — именно в этом и заключается суть четвертой промышленной революции.
▼
Канал Anton Elston — это актуальная информация об IT, блокчейне, NFT и онлайн-образовании. Здесь рождается метавселенная DEXART