Роботы, обученные языком гигантов: MIT взламывает секрет универсального интеллекта

76

Массачусетский технологический институт (MIT) совершил прорыв, предвосхищая новую эру в обучении роботов. Вместо традиционных, узкоспециализированных наборов данных, привычных для “воспитания” роботов в выполнении конкретных задач, исследователи взяли курс на масштабное, **языковое обучение**, заимствуя подход, сделавший большие языковые модели (LLM) такими революционными.

Пройдя за пределы иллюзий “подражания”

Классический метод имитационного обучения, где робот учится, наблюдая человека за работой, сталкивается с **проблемой адаптивности**. Представьте робота, обученного собирать предметы в идеально освещенной лаборатории. Внезапно меняется свет, появляется препятствие или незнакомая обстановка – и наш ученик оказывается беспомощным. Недостаток данных для таких “вне сценария” ситуаций лишает его гибкости. MIT предложил выход, вдохновленный мощью LLM.

HPT: Трансформеры для разнообразия робототехнических данных

Решением стала архитектура **Heterogeneous Pretrained Transformers (HPT)** – своего рода “многоязычный мозг” для роботов. Вместо простого копирования предложений, как в языковом мире, HPT объединяет данные из разных датчиков (визуальные, тактильные, сенсорные) и окружений. Это разнообразие данных структурируется с помощью мощных преобразователей – neuronalных сетей, аналогичных тем, что обучили гигантов вроде GPT-4, но адаптированных для робототехнической реальности. Чем масштабнее этот “преобразователь”, тем глубже понимание и точнее действия робота.

От конфигурации к задаче: пользовательский интерфейс будущего

Представьте: вы словно программист, рисующий “blueprint” своего робота – вводите его конструкцию, оснащение и желаемую задачу. HPT, подобно **”роботизированному наставнику”**, использует полученную информацию для **предобучения** робота, готовя его к действию.

“Наша мечта – создать универсальный роботизированный мозг, загружаемый и применяемый к любому роботу без дополнительной настройки, – делится доцент CMU Дэвид Хелд. – Мы на ранней стадии, но верим, что масштабирование HPT приведёт к революции в робототехнике, подобно тому, как это случилось с большими языковыми моделями.”

Это не просто научная фантастика. MIT открывает дверь к будущему, где роботы, обученные на массивных потоках разнородной информации, будут столь же адаптивны и интеллектуально гибкими, как мы сами, способные решать задачи в постоянно меняющемся мире.