Маленькие дети — очаровательные существа. Они могут делать удивительные вещи, несмотря на то, что полностью зависят от своих родителей. Малыши обладают врожденным пониманием физики нашего мира и могут быстро осваивать новые концепции и языки в условиях ограниченного объема информации. Даже самые мощные из имеющихся сейчас систем искусственного интеллекта лишены этих способностей. Языковые модели, которые используются такими чат-ботами, как ChatGPT, отлично предсказывают следующее слово в предложении, но не имеют ничего даже близко напоминающее здравый смысл детей.
Обучаться как ребенок
Но что, если бы ИИ мог учиться как ребенок? Модели искусственного интеллекта обучаются на огромных наборах данных, состоящих из миллиардов элементов. Исследователи Нью-Йоркского университета захотели выяснить, на что способны такие модели, когда их обучают на значительно более скромном наборе данных: зрительных образах и звуках, которые воспринимает ребенок, учащийся говорить. К их удивлению, ИИ сумел многому научился благодаря любознательному малышу по имени Сэм.
Исследователи прикрепили к его голове камеру, и он носил ее в течение полутора лет: с того момента, как ему исполнилось шесть месяцев, и до своего второго дня рождения. Собранный материал позволил исследователям научить нейронную сеть сопоставлять слова с объектами.
Для этого эксперимента был отобран 61 час видеозаписи с камеры шлема, которая фиксировала все, на что обращал внимание Сэм. На видео оказались записаны две кошки Сэма, его родители, кроватка и игрушки, дом, еда и многое другое. «Этот набор данных оказался совершенно уникальным», — говорит Бренден Лейк, ученый-когнитивист из Нью-Йоркского университета и автор исследования. «Это лучшее из когда-либо существовавших окно в мир одного ребенка».
Для обучения модели Лейк и его коллеги использовали 600 000 видеокадров в сочетании с фразами, которые произносили родители Сэма или другие люди в комнате в момент съемки изображения — всего 37 500 «высказываний». Иногда слова и предметы совпадали. Иногда нет. Например, на одном из кадров Сэм смотрит на пазл из фигурок, а взрослый говорит: «Тебе нравится эта веревка». В другом случае отец ребенка закрывает рукой несколько кубиков и сообщает: «Тебе тоже нужны кубики».
Способность детей к обучению в таких условиях настолько удивительна, что некоторые психологи утверждают, что для того, чтоы дети имели возможность быстро выучить язык, они должны появляться на свет с врожденными представлениями о его устройстве. Но данное исследование показывает, что язык можно освоить и без врожденных знаний, причем на основе достаточно скромного опыта. Джесс Салливан, детский психолог из Университета Скидмора, которая участвовала в сборе данных с камеры шлема Сэма, так прокомментировала результаты исследования: «Мое представление о мире получило сильную встряску».
Это исследование — лишь один из примеров того, как маленькие дети могут приблизить нас к тому, что компьютеры обретут способность обучаться как люди, чтобы создать более совершенные системы искусственного интеллекта.
Интуитивная физика
Ученых вдохновляет то, что дети проявляют себя в качестве увлеченных наблюдателей и прекрасных учеников. Они учатся методом проб и ошибок и становятся умнее по мере того, как больше узнают об окружающем мире. Детские психологи говорят, что ребенок интуитивно понимает, что будет дальше. Например, он знает, что мяч существует, даже если скрыт от посторонних глаз, что мяч твердый, не может внезапно изменить форму, что он откатывается по непрерывной траектории и не способен внезапно телепортироваться в другое место.
Исследователи из Google DeepMind попытались привить системе искусственного интеллекта аналогичное чувство «интуитивной физики», научив модель фокусироваться на движущихся объектах, а не на отдельных пикселях. Они обучили модель на сотнях тысяч видеороликов, чтобы она могла узнать, как ведет себя объект. Согласно теории, если младенцев удивляет что-то вроде мяча, внезапно вылетающего из окна, то это потому, что объект движется таким образом, который нарушает понимание ребенком физики мира. Исследователям удалось научить систему искусственного интеллекта также демонстрировать «удивление», когда объект начинал двигаться не так, как ее учили.
Ученые признают, что самые современные системы ИИ бледнеют на фоне понимания интуитивной физики даже очень маленькими детьми. Совершаются пытаются устранить этот разрыв между людьми и машинами, опираясь на знание детской психологии. Это включает в себя, во-первых, создание набора данных для машинного обучения, направленного на концептуальное понимание интуитивной физики на основе психологической теории нарушения ожиданий. Во-вторых, они разрабатывают систему глубокого обучения, которая получает представления об интуитивной физике на основе визуальных данных, полученных в процессе изучения зрительного восприятия детей. Исследователи сообщили, что полученная модель оказалась способна к пониманию основ интуитивной физики на уровне восприятия объектов, что полностью согласуется с данными детской психологии.
Модель мира в голове
Ян Лекун, лауреат премии Тьюринга и главный специалист Meta (компания признана экстремистской и запрещена в России) по искусственному интеллекту, утверждает, что обучение систем ИИ смотреть глазами ребенка может стать путем к созданию более умных систем. Он уверен, что у человека в мозгу формируется симуляция или «модель мира», позволяющая интуитивно понимать, что мир трехмерен и что объекты на самом деле никуда не деваются, когда пропадают из поля зрения. Это позволяет людям предсказать, где через несколько секунд окажется прыгающий мяч или мчащийся велосипед. Лекун занят созданием совершенно новой архитектуры ИИ, вдохновляясь тем, как обучаются люди.
Лекун считает, что этот подход однажды наградит машины здравым смыслом и позволит приблизиться к созданию машин, способных рассуждать и планировать, как люди, — то есть к тому, что называют общим искусственным интеллектом, или AGI.
Современные системы ИИ превосходны в решении узких задач, таких как игра в шахматы или генерация текста, который производит впечатление написанного человеком. Но по сравнению с человеческим мозгом — самой мощной из известных нам вычислительных «машин» — эти системы скудны. Им не хватает здравого смысла, который позволил бы гармонично взаимодействовать с хаотичным миром, более утонченно рассуждать и приносить больше пользы людям. Искусственный интеллект сможет раскрыть эти способности, если научится воспринимать информацию как дети.
▼
Канал Anton Elston — это актуальная информация об IT, блокчейне, NFT и онлайн-образовании. Здесь рождается метавселенная DEXART