В 1960-х годах один из основателей Intel сделал смелое предсказание: количество транзисторов на микрочипе будет удваиваться примерно каждые два года. Это предсказание, известное как «закон Мура», оказалось пророческим. Десятилетиями индустрия неуклонно следовала этому принципу, выпуская все более быстрые и дешевые вычислительные устройства с поразительной регулярностью.
Но вот незадача — искусственный интеллект оказался настолько жадным до вычислительных ресурсов, что даже закон Мура за ним не поспевает. Представьте себе обжору, который съедает в два раза больше еды каждые полгода. Примерно так же растут аппетиты искусственного интеллекта к вычислительной мощности. И это при том, что закон Мура обещает нам лишь удвоение мощности каждые два года!
Когда мощности процессора уже недостаточно
Казалось бы, решение проблемы очевидно — нужно просто наращивать вычислительные мощности. Действительно, специализированное «железо» вроде графических процессоров (GPU) и тензорных процессоров (TPU) стало незаменимым для обучения моделей искусственного интеллекта. Параллельно развиваются инфраструктуры распределенных вычислений, позволяющие эффективнее связывать вычислительные узлы.
Но чем сложнее становятся модели искусственного интеллекта, тем очевиднее, что одной лишь вычислительной мощности недостаточно. Это все равно что пытаться напоить стадо слонов из одного садового шланга — вода есть, но до цели она не доходит.
Сеть как узкое горлышко
Оказывается, настоящим ограничителем для развития искусственного интеллекта становится… сетевая инфраструктура. Когда данные и вычислительные задачи искусственного интеллекта распределяются между множеством узлов, критически важной становится способность сети обеспечивать высокую пропускную способность и низкую задержку.
Представьте, что вы пытаетесь организовать грандиозный симфонический оркестр, где музыканты разбросаны по всему миру. Каждый музыкант виртуозен, но если между ними нет мгновенной связи, вместо симфонии получится какофония. Так же и с искусственным интеллектом — каким бы мощным ни было «железо», без эффективной «нервной системы» в виде сетевой инфраструктуры оно не сможет раскрыть свой потенциал.
Вот несколько ключевых аспектов, где сеть играет решающую роль:
- Распределение данных: Системы искусственного интеллекта часто требуют доступа к огромным объемам данных из разных источников. Эффективные механизмы распределения и доступа к данным, такие как распределенные системы хранения и кэширование, позволяют быстро «скармливать» данные моделям искусственного интеллекта.
- Обучение моделей: Обучение крупных моделей искусственного интеллекта обычно требует параллельной обработки на множестве вычислительных узлов. Критически важно обеспечить эффективную коммуникацию между этими узлами, чтобы минимизировать накладные расходы и гарантировать эффективное масштабирование процесса обучения без ограничений по задержке или пропускной способности сети.
- Распределение моделей и вывод: В сценариях, где модели искусственного интеллекта развертываются в широко распределенных средах, таких как периферийные устройства или облачные серверы, ключевое значение имеют эффективные механизмы распределения. Сети с низкой задержкой позволяют многим приложениям, требующим вывода в реальном времени, обеспечивать быстрые прогнозы и принятие решений на базе искусственного интеллекта. Это касается таких областей, как автономные транспортные средства, системы промышленной автоматизации и периферийные устройства.
Новые вызовы для сетевых центров
Потребность в высокой пропускной способности сетей — не новость. Команды сетевых операционных центров (Network Operations Center, NOC) давно управляют голосовыми, видео и другими чувствительными к задержкам приложениями. Однако по мере расширения организациями моделей и приложений искусственного интеллекта эти команды должны внедрять новые стратегии для решения проблем, возникающих из-за растущих объемов данных искусственного интеллекта, перемещающихся из центров обработки данных в периферийные службы и облако.
Среди этих проблем:
- Растущая сложность: Современные сетевые инфраструктуры становятся все более сложными из-за использования различных технологий и оборудования от разных производителей (мультивендорные сети). Кроме того, внедрение программно-определяемых сетей (SDN) и виртуализации сетей добавляет дополнительный уровень абстракции и управления. Получение единой и полной видимости всей сетевой инфраструктуры становится сложной задачей, что затрудняет быстрое обнаружение и устранение сбоев.
- Увеличение шума сигналов тревоги: С ростом масштабов сетей и количества подключенных устройств увеличивается и количество генерируемых сетевых событий и тревог. Многие из этих тревог могут быть ложными или незначительными, но они затрудняют выявление реальных проблем, которые могут серьезно повлиять на работу сети. Это явление известно как «шум сигналов тревоги». Команды NOC часто сталкиваются с перегрузкой информацией, что замедляет процесс анализа и реагирования на настоящие инциденты. Недостаток квалифицированных специалистов, способных эффективно фильтровать и анализировать этот поток данных, усугубляет проблему.
- Внешне управляемые сети: Традиционные инструменты управления сетью могут не обеспечивать необходимого сквозного покрытия. Например, этим инструментам часто не хватает информации о сетях интернет-провайдеров (ISP) и облачных провайдеров (CSP), от которых теперь зависит пользовательский опыт.
Искусственный интеллект как проблема и решение
Ирония судьбы — искусственный интеллект одновременно создает проблемы для сетевой инфраструктуры и предлагает их решение. Новые методологии и продвинутые инструменты могут помочь справиться с проблемами управления сетями, возникшими из-за широкого внедрения сервисов на базе искусственного интеллекта.
По прогнозам аналитиков Gartner, к 2027 году 90% предприятий будут использовать некоторые функции искусственного интеллекта для улучшения сетевых операций. Решения по управлению сетями с поддержкой искусственного интеллекта могут обеспечить упрощенные рабочие процессы и аналитику, которые помогут команде NOC управлять сложными мультивендорными средами, уменьшать шум сигналов тревоги и получать сквозное представление о производительности сети.
Чтобы обеспечить надежную работу сети и поддержать растущий спрос на современные приложения и сервисы искусственного интеллекта, командам NOC потребуется «апгрейд» с помощью искусственного интеллекта. Это как если бы дирижеру симфонического оркестра дали суперспособности — мгновенно слышать и корректировать игру каждого музыканта в режиме реального времени.
Когда речь идет об управлении современными сетями, искусственный интеллект, несомненно, открывает новые горизонты. Но этот потенциал реализуется только тогда, когда продвинутые возможности рассуждения эффективно адаптированы к сетевой области. Чтобы быть жизнеспособными, решения должны предлагать комбинацию алгоритмов, использующих разнообразный интеллект, включая информацию о сбоях, топологии, конфигурации, производительности, потоках и сетевом опыте.
Соединяя точки
Масштабирование искусственного интеллекта — это не просто вопрос увеличения вычислительной мощности. Это фундаментальная сетевая проблема. Эффективное развертывание искусственного интеллекта требует надежных высокоскоростных сетей, способных справиться с огромным трафиком данных, генерируемым при обучении моделей, и поддерживать требования низкой задержки для приложений реального времени.
Поскольку традиционные инструменты управления сетями часто недостаточны для решения проблем, возникающих при индустриализации искусственного интеллекта, командам NOC стоит рассмотреть решения на базе искусственного интеллекта, которые способны решать проблемы самого искусственного интеллекта, упрощая рабочие процессы и повышая эффективность.
Искусственный интеллект, подобно новому биологическому виду, внедренному в сложившуюся среду, создает новые связи, меняет потоки ресурсов и заставляет всю систему адаптироваться. И подобно тому, как природа находит баланс, интегрируя новые виды, так и наши цифровые экосистемы должны эволюционировать, чтобы полностью раскрыть потенциал искусственного интеллекта.
▼
Канал Anton Elston — это актуальная информация об IT, блокчейне, NFT и онлайн-образовании. Здесь рождается метавселенная DEXART