Криптовалюты, искусственный интеллект, экономика

Роботы пишут интернет: что будет, когда они начнут читать только себя?

Антон Эльстон/Статьи

Утро через десять лет. Вы просыпаетесь под музыку, которую слушают все жители вашего города — алгоритм решил, что именно этот ритм статистически оптимален для пробуждения. Новостной сайт публикует безупречно грамотный текст с позицией, неотличимой от тысячи других изданий. Витрины магазинов заполнены одеждой серых оттенков: генеративные модели оптимизировали ее под усредненные продажи. Стриминговый сервис, который никогда не видел авторского кино — только фильмы других алгоритмов, — предлагает триста картин, неотличимых друг от друга.

Это не фантастика. Это логичный финал пути, по которому мы уже идем.

Интернет меняет хозяина

Статистика не оставляет простора для иллюзий. Исследование Axios в октябре 2025 года показало: около 52% новых онлайн-статей написаны алгоритмами. Пять лет назад, в 2020-м, эта цифра составляла всего 5%. По данным платформы Deezer за ноябрь 2025 года, 34% всех новых ежедневных музыкальных загрузок полностью генерируется нейросетями — около 50 000 ИИ-песен в сутки, причем 97% слушателей не способны отличить их от человеческих в слепом тесте. ИИ-стример Neuro-sama на Twitch собрал 307 295 подписчиков — в четыре раза больше, чем ближайший живой конкурент.

Europol предупреждал еще в 2022 году: к 2026-му до 90% онлайн-контента может иметь синтетическое происхождение. Мы следуем этому прогнозу с пугающей точностью. С 2023 года опубликовано более 10 млрд новых страниц, созданных машинами. При этом накопленный архив человеческого творчества — весь этот океан блогов, статей, форумов и научных работ — уже практически исчерпан как обучающий ресурс. Некоторые исследовательские группы называют предельный срок «истощения» доступных качественных текстовых данных: 2029 год.

Уроборос

Проблема не в самом факте машинного творчества. Проблема — в том, что происходит дальше, когда синтетический контент сам становится сырьем для обучения следующего поколения моделей. Возникает петля обратной связи, которую исследователи называют «коллапсом моделей».

Механизм деградации прост и безжалостен. При каждом цикле переобучения на синтетических данных модель теряет «хвосты» распределения — все редкое, нетипичное, оригинальное. Статистически необычное интерпретируется как ошибка и отсекается. Научная работа, опубликованная в марте 2026 года на OpenReview, подтвердила этот эффект на нескольких архитектурах: итеративное переобучение на собственных выходных данных неизбежно приводит к постепенному и постоянному ухудшению качества.

На конференции RSAC 2026 этот процесс напрямую сравнили с фильмом «Идиократия» — антиутопией о цивилизации, утратившей способность к сложному мышлению. Разница в том, что в фильме на это ушли века. Технологический аналог способен уложиться в несколько лет.

Точнее всего происходящее описывает слово «гомогенизация». Языковые модели, обучающиеся сами на себе, все точнее воспроизводят среднее — и все хуже справляются с крайним, исключительным, по-настоящему новым. Нюанс исчезает первым. Потом — смысл.

Три линии обороны

Хорошая новость: выход из ловушки есть, и он практичнее, чем может показаться.

  • Внешний верификатор. Исследование OpenReview предлагает конкретный механизм: контроль синтетических данных со стороны человека или более сильной модели. Верификатор направляет переобучение и способен обратить вспять тренд коллапса. Без него ранние улучшения закономерно выходят на плато и деградируют.
  • Контроль распределения. Прежде чем добавлять синтетику, необходимо тщательно проанализировать реальные данные: размеры объектов, распределение признаков, кластеры. Эксперимент показал: грамотно подобранная синтетика улучшает качество распознавания. Неграмотно добавленная — разрушает модель. Разница заключается именно в предварительном анализе реального распределения.
  • Живые данные с криптографическим подтверждением. Сама по себе ручная разметка и коллективная проверка фактов являются необходимым, но недостаточным условием: кто гарантирует, что «человеческий» датасет действительно создан человеком? Здесь в игру вступает блокчейн. Запись о происхождении данных в распределенном реестре криптографически неизменяема — это и есть ’on-chain truth‘: доказуемое, верифицируемое свидетельство того, что за контентом стоит живой автор, а не очередная модель. Наращивание вычислительных мощностей без такого якоря не решает проблему коллапса, а ускоряет ее.

Ключевая идея всех трех подходов одна: человеческий контент — не просто топливо для обучения. Это якорь, удерживающий модели от дрейфа в сторону бессвязности.

Два сценария для одного интернета

Если текущий тренд продолжится без коррекции, к концу десятилетия мы получим сеть, в которой синтетический контент доминирует количественно, но постепенно деградирует качественно. Модели будут все активнее обучаться на продуктах друг друга, а оригинальный человеческий текст — становиться все более редким и, следовательно, все более ценным.

Второй сценарий — революционный скачок: появление систем, которые не предсказывают следующее слово, а действительно понимают причинно-следственные связи, физические закономерности, контекст. Систем, которые не уступают человеку в способности производить подлинно новое. Произойдет ли это — открытый вопрос. Когда — еще более открытый. Дискуссия об искусственном общем интеллекте идет десятилетиями, и каждое новое поколение исследователей уверено, что прорыв — за следующим углом.

Наращивание возможностей искусственного интеллекта работает как любая зависимость: на входе — эйфория роста, впечатляющие результаты, ощущение, что процесс необратим и ведет только вверх. Но чем дольше модели питаются собственными выходными данными, тем сильнее усредняется их картина мира — и тем ближе тот момент, когда система, обученная на копиях копий, приведет нас к сценарию 2036 года.


Канал Anton Elston — это актуальная информация об IT, блокчейне, NFT и онлайн-образовании. Здесь развивается метавселенная DEXART и происходит погружение в мир ИИ


Понравилась статья?

Подпишись на e-mail рассылку и будь всегда в курсе последних событий
BTC
67926-4.01%
ETH
1983.87-4.07%
BNB
627.99-1.96%
Ту зе МУН