Исследователи Хаочэнь Ши, Синди Юань и Банг Лю представили новую архитектуру Programmatic Skill Network для непрерывного обучения ИИ-агентов в открытых средах. Работа опубликована на arXiv.org 7 января 2026 года. Фреймворк позволяет агенту создавать, уточнять и повторно использовать расширяющуюся библиотеку исполняемых навыков.
PSN представляет навыки в виде исполняемых символических программ, которые образуют композиционную сеть. Три ключевых механизма реализованы с помощью больших языковых моделей: REFLECT для структурированной локализации ошибок, прогрессивная оптимизация с управлением обновлениями и канонический рефакторинг структуры с проверкой отката. Это стабилизирует надёжные навыки и сохраняет пластичность для новых.
Подход решает проблему continual learning в embodied AI, где агенту, например в симуляторе Minecraft или Crafter, нужно постоянно адаптироваться к новым задачам, не забывая старые умения. PSN демонстрирует параллели с обучением нейронных сетей, но на уровне программных структур.
Эксперименты на платформах MineDojo и Crafter показали, что система обеспечивает устойчивое повторное использование навыков, быструю адаптацию и сильное обобщение для широкого спектра задач. Код планируется открыть. Работа указывает на путь к созданию более гибких и универсальных ИИ-агентов.