Nvidia BlueField-4 STX: Решение проблемы узкого места в хранилище для ИИ

2

Nvidia представила BlueField-4 STX, новую эталонную архитектуру, разработанную для устранения критического ограничения производительности в искусственном интеллекте: скорости, с которой ИИ-агенты могут получать доступ к данным и обрабатывать их. Основная проблема заключается не в самих моделях ИИ, а в неспособности традиционных систем хранения данных поспевать за требованиями современных вычислений. Этот узкий участок препятствует способности ИИ поддерживать связную «рабочую память» во время выполнения сложных задач, вызовов инструментов и многошаговых процессов рассуждений.

Проблема с существующими хранилищами

Большие языковые модели (LLM) полагаются на кэш «ключ-значение» (KV) для хранения промежуточных вычислений, позволяя им избежать повторного вычисления одной и той же информации. По мере того как ИИ-агенты обрабатывают более длинные контексты и сложные задачи, этот кэш экспоненциально растет. Когда этот кэш должен получать доступ к медленным традиционным хранилищам, скорость вычислений падает, а загрузка графического процессора (GPU) снижается. Это не теоретическая проблема: производительность ИИ напрямую ограничивается скоростью, с которой он может извлекать ранее обработанные данные.

BlueField-4 STX: Слой контекстной памяти

Решение Nvidia — это не продукт, который они продают напрямую, а эталонный дизайн для партнеров по хранению данных. BlueField-4 STX вставляет выделенный «слой контекстной памяти» между графическими процессорами и обычными хранилищами. Архитектура объединяет центральный процессор Nvidia Vera с суперсетевой картой ConnectX-9, работающей в сети Ethernet Spectrum-X и программируемой с помощью программной платформы DOCA от Nvidia. Цель проста: поддерживать доступность кэша KV со скоростью, соответствующей обработке графическим процессором. Первой реализацией является платформа хранения контекстной памяти CMX, которая расширяет память графического процессора высокопроизводительным слоем для хранения и извлечения данных кэша KV.

Экосистема партнеров и доступность

Nvidia распространяет эту эталонную архитектуру среди своих партнеров по хранению данных для создания инфраструктуры, оптимизированной для ИИ. Компания получила обязательства от крупных игроков, включая Cloudian, Dell Technologies, HPE, IBM, NetApp, VAST Data и WEKA. Облачные провайдеры, такие как CoreWeave, Mistral AI и Oracle Cloud Infrastructure, также обязались внедрить STX для хранения контекстной памяти.

Платформы на базе STX ожидаются от партнеров во второй половине 2026 года. Сочетание известных производителей корпоративных хранилищ и облачных провайдеров, ориентированных на ИИ, сигнализирует о намерении Nvidia позиционировать STX как новый стандарт для ИИ-инфраструктуры.

Реальные преимущества производительности

IBM уже демонстрирует влияние этого подхода. Их система Storage Scale System 6000, сертифицированная на платформах Nvidia DGX, показала значительное улучшение циклов обновления данных для рабочих нагрузок структурированной аналитики. В ходе пилотного проекта с Nestlé обновление данных по 186 странам и 44 таблицам сократилось с 15 минут до всего трех, что привело к экономии затрат в 83% и 30-кратному увеличению соотношения цены и производительности. Хотя этот пример фокусируется на структурированных данных, он иллюстрирует более широкую точку зрения: слой хранения данных часто является основным ограничением в корпоративных развертываниях ИИ.

Почему это важно

Переход к хранилищам, оптимизированным для контекста, имеет решающее значение, поскольку универсальные хранилища не были разработаны с учетом требований к задержке рабочих нагрузок агентного ИИ. По мере интеграции ИИ в корпоративные операции, слой хранения данных станет ключевым инфраструктурным решением, а не дополнением к закупке графических процессоров. Nvidia заявляет, что STX обеспечивает 5-кратную пропускную способность токенов, 4-кратную энергоэффективность и 2-кратную скорость загрузки данных по сравнению с традиционными хранилищами на основе центрального процессора, хотя конкретные исходные конфигурации для этих измерений остаются не указанными.

В заключение, BlueField-4 STX от Nvidia представляет собой фундаментальное изменение в том, как предприятия подходят к ИИ-инфраструктуре. Устраняя узкое место в хранилище, компания прокладывает путь к более быстрым, эффективным и масштабируемым развертываниям ИИ в широком диапазоне отраслей.