Исследователи из лаборатории искусственного общего интеллекта (AGI Lab) компании Amazon разрабатывают систему «тренажёрных залов» на основе обучения с подкреплением для отработки ИИ-агентами базовых, но критически важных действий в реальных цифровых средах. Цель — создать «нормкор-агентов», исключительно надёжных в выполнении простых операций, таких как скроллинг, клики и заполнение форм.
Эти высокоточные симуляционные среды, или «джимы», изолируют и многократно варьируют конкретные навыки, например, взаимодействие с устаревшими интерфейсами или обработку ошибок ввода. Агенты тренируются на тысячах задач из десятков предметных областей, осваивая не только цель (например, бронирование), но и «рельеф» под ней — непредсказуемость реальных веб-систем.
Проблема в том, что одна команда пользователя (например, «забронируй отпуск») запускает сотни микро-взаимодействий с разными системами. Провал на любом этапе — сбой всей операции. Поэтому ключевой фокус смещён с «интеллектуальных» задач на гарантированно корректное выполнение атомарных действий, что и является основой реальной автономии.
Разработанный «агентный субстрат» — общая основа компетенций — позволяет затем создавать специализированных агентов для конкретных приложений, таких как логистика или финансы, с гарантией надёжного завершения многошаговых транзакций.