Главная страница » Статьи » Роботы пишут интернет: что будет, когда они начнут читать только себя?

Роботы пишут интернет: что будет, когда они начнут читать только себя?

Опубликовано 07.03.2026 Антон Эльстон/Статьи Антон Эльстон

Утро через десять лет. Вы просыпаетесь под музыку, которую слушают все жители вашего города — алгоритм решил, что именно этот ритм статистически оптимален для пробуждения. Новостной сайт публикует безупречно грамотный текст с позицией, неотличимой от тысячи других изданий. Витрины магазинов заполнены одеждой серых оттенков: генеративные модели оптимизировали ее под усредненные продажи. Стриминговый сервис, который никогда не видел авторского кино — только фильмы других алгоритмов, — предлагает триста картин, неотличимых друг от друга.

Это не фантастика. Это логичный финал пути, по которому мы уже идем.

Интернет меняет хозяина

Статистика не оставляет простора для иллюзий. Исследование Axios в октябре 2025 года показало: около 52% новых онлайн-статей написаны алгоритмами. Пять лет назад, в 2020-м, эта цифра составляла всего 5%. По данным платформы Deezer за ноябрь 2025 года, 34% всех новых ежедневных музыкальных загрузок полностью генерируется нейросетями — около 50 000 ИИ-песен в сутки, причем 97% слушателей не способны отличить их от человеческих в слепом тесте. ИИ-стример Neuro-sama на Twitch собрал 307 295 подписчиков — в четыре раза больше, чем ближайший живой конкурент.

Europol предупреждал еще в 2022 году: к 2026-му до 90% онлайн-контента может иметь синтетическое происхождение. Мы следуем этому прогнозу с пугающей точностью. С 2023 года опубликовано более 10 млрд новых страниц, созданных машинами. При этом накопленный архив человеческого творчества — весь этот океан блогов, статей, форумов и научных работ — уже практически исчерпан как обучающий ресурс. Некоторые исследовательские группы называют предельный срок «истощения» доступных качественных текстовых данных: 2029 год.

Уроборос

Проблема не в самом факте машинного творчества. Проблема — в том, что происходит дальше, когда синтетический контент сам становится сырьем для обучения следующего поколения моделей. Возникает петля обратной связи, которую исследователи называют «коллапсом моделей».

Механизм деградации прост и безжалостен. При каждом цикле переобучения на синтетических данных модель теряет «хвосты» распределения — все редкое, нетипичное, оригинальное. Статистически необычное интерпретируется как ошибка и отсекается. Научная работа, опубликованная в марте 2026 года на OpenReview, подтвердила этот эффект на нескольких архитектурах: итеративное переобучение на собственных выходных данных неизбежно приводит к постепенному и постоянному ухудшению качества.

На конференции RSAC 2026 этот процесс напрямую сравнили с фильмом «Идиократия» — антиутопией о цивилизации, утратившей способность к сложному мышлению. Разница в том, что в фильме на это ушли века. Технологический аналог способен уложиться в несколько лет.

Точнее всего происходящее описывает слово «гомогенизация». Языковые модели, обучающиеся сами на себе, все точнее воспроизводят среднее — и все хуже справляются с крайним, исключительным, по-настоящему новым. Нюанс исчезает первым. Потом — смысл.

Три линии обороны

Хорошая новость: выход из ловушки есть, и он практичнее, чем может показаться.

Внешний верификатор. Исследование OpenReview предлагает конкретный механизм: контроль синтетических данных со стороны человека или более сильной модели. Верификатор направляет переобучение и способен обратить вспять тренд коллапса. Без него ранние улучшения закономерно выходят на плато и деградируют.

Контроль распределения. Прежде чем добавлять синтетику, необходимо тщательно проанализировать реальные данные: размеры объектов, распределение признаков, кластеры. Эксперимент показал: грамотно подобранная синтетика улучшает качество распознавания. Неграмотно добавленная — разрушает модель. Разница заключается именно в предварительном анализе реального распределения.

Живые данные с криптографическим подтверждением. Сама по себе ручная разметка и коллективная проверка фактов являются необходимым, но недостаточным условием: кто гарантирует, что «человеческий» датасет действительно создан человеком? Здесь в игру вступает блокчейн. Запись о происхождении данных в распределенном реестре криптографически неизменяема — это и есть ’on-chain truth‘: доказуемое, верифицируемое свидетельство того, что за контентом стоит живой автор, а не очередная модель. Наращивание вычислительных мощностей без такого якоря не решает проблему коллапса, а ускоряет ее.

Ключевая идея всех трех подходов одна: человеческий контент — не просто топливо для обучения. Это якорь, удерживающий модели от дрейфа в сторону бессвязности.

Два сценария для одного интернета

Если текущий тренд продолжится без коррекции, к концу десятилетия мы получим сеть, в которой синтетический контент доминирует количественно, но постепенно деградирует качественно. Модели будут все активнее обучаться на продуктах друг друга, а оригинальный человеческий текст — становиться все более редким и, следовательно, все более ценным.

Второй сценарий — революционный скачок: появление систем, которые не предсказывают следующее слово, а действительно понимают причинно-следственные связи, физические закономерности, контекст. Систем, которые не уступают человеку в способности производить подлинно новое. Произойдет ли это — открытый вопрос. Когда — еще более открытый. Дискуссия об искусственном общем интеллекте идет десятилетиями, и каждое новое поколение исследователей уверено, что прорыв — за следующим углом.

Наращивание возможностей искусственного интеллекта работает как любая зависимость: на входе — эйфория роста, впечатляющие результаты, ощущение, что процесс необратим и ведет только вверх. Но чем дольше модели питаются собственными выходными данными, тем сильнее усредняется их картина мира — и тем ближе тот момент, когда система, обученная на копиях копий, приведет нас к сценарию 2036 года.

▼
Канал Anton Elston — это актуальная информация об IT, блокчейне, NFT и онлайн-образовании. Здесь развивается метавселенная DEXART и происходит погружение в мир ИИ

Tags: Антон Эльстон искусственный интеллект

Криптовалюты, искусственный интеллект, экономика

Роботы пишут интернет: что будет, когда они начнут читать только себя?

Интернет меняет хозяина

Уроборос

Три линии обороны

Два сценария для одного интернета

Понравилась статья?

Интернет меняет хозяина

Уроборос

Три линии обороны

Два сценария для одного интернета

Понравилась статья?

А вот еще интересное пишут