додому Останні новини та статті Nvidia BlueField-4 STX: Вирішення проблеми вузького місця в сховищі для ІІ

Nvidia BlueField-4 STX: Вирішення проблеми вузького місця в сховищі для ІІ

Nvidia представила BlueField-4 STX, нову еталонну архітектуру, розроблену для усунення критичного обмеження продуктивності у штучному інтелекті: швидкості, з якою ІІ-агенти можуть отримувати доступ до даних та обробляти їх. Основна проблема полягає не в самих моделях ІІ, а в нездатності традиційних систем зберігання даних встигати за вимогами сучасних обчислень. Ця вузька ділянка перешкоджає здатності ІІ підтримувати зв’язкову «робочу пам’ять» під час виконання складних завдань, викликів інструментів та багатокрокових процесів міркувань.

Проблема з існуючими сховищами

Великі мовні моделі (LLM) покладаються на кеш ключ-значення (KV) для зберігання проміжних обчислень, дозволяючи їм уникнути повторного обчислення однієї і тієї ж інформації. У міру того, як ІІ-агенти обробляють більш довгі контексти та складні завдання, цей кеш експоненційно зростає. Коли цей кеш повинен отримувати доступ до повільних традиційних сховищ, швидкість обчислень падає, а завантаження графічного процесора (GPU) знижується. Це не теоретична проблема: продуктивність ІІ безпосередньо обмежується швидкістю, з якою він може отримувати раніше оброблені дані.

BlueField-4 STX: Шар контекстної пам’яті

Рішення Nvidia — це продукт, який вони продають безпосередньо, а еталонний дизайн для партнерів зі зберігання даних. BlueField-4 STX вставляє виділений «шар контекстної пам’яті» між графічними процесорами та звичайними сховищами. Архітектура поєднує центральний процесор Nvidia Vera з супермережевою картою ConnectX-9, що працює в мережі Ethernet Spectrum-X і програмується за допомогою програмної платформи DOCA від Nvidia. Мета проста: підтримувати доступність кеша KV зі швидкістю, що відповідає обробці графічним процесором. Першою реалізацією є платформа зберігання контекстної пам’яті CMX, яка розширює пам’ять графічного процесора високопродуктивним шаром для зберігання та вилучення даних кешу KV.

Екосистема партнерів та доступність

Nvidia розповсюджує цю еталонну архітектуру серед своїх партнерів із зберігання даних для створення інфраструктури, оптимізованої для ІІ. Компанія отримала зобов’язання від великих гравців, включаючи Cloudian, Dell Technologies, HPE, IBM, NetApp, VAST Data та WEKA. Хмарні провайдери, такі як CoreWeave, Mistral AI та Oracle Cloud Infrastructure, також зобов’язалися впровадити STX для зберігання контекстної пам’яті.

Платформи на базі STX очікуються від партнерів у другій половині 2026 року. Поєднання відомих виробників корпоративних сховищ та хмарних провайдерів, орієнтованих на ІІ, сигналізує про намір Nvidia позиціонувати STX як новий стандарт для ІІ-інфраструктури.

Реальні переваги продуктивності

IBM демонструє вплив цього підходу. Їхня система Storage Scale System 6000, сертифікована на платформах Nvidia DGX, показала значне поліпшення циклів оновлення даних для робочих навантажень структурованої аналітики. Під час пілотного проекту з Nestlé оновлення даних по 186 країнам і 44 таблицям скоротилося з 15 хвилин до всього трьох, що призвело до економії витрат у 83% і 30-кратному збільшенню співвідношення ціни і продуктивності. Хоча цей приклад фокусується на структурованих даних, він ілюструє більш широку розгортаннях ІІ.

Чому це важливо

Перехід до сховищ, оптимізованих для контексту, має вирішальне значення, оскільки універсальні сховища були розроблені з урахуванням вимог до затримки робочих навантажень агентного ІІ. У міру інтеграції ІІ в корпоративні операції, шар зберігання даних стане ключовим інфраструктурним рішенням, а не доповненням до закупівлі графічних процесорів. Nvidia заявляє, що STX забезпечує 5-кратну пропускну здатність токенів, 4-кратну енергоефективність і 2-кратну швидкість завантаження даних у порівнянні з традиційними сховищами вимірів залишаються не зазначеними.

На закінчення, BlueField-4 STX від Nvidia є фундаментальною зміною в тому, як підприємства підходять до ІІ-інфраструктури. Усуваючи вузьке місце у сховищі, компанія прокладає шлях до більш швидких, ефективних та масштабованих розгортань ІІ в широкому діапазоні галузей.

Exit mobile version