Группа исследователей представила новый метод «композиционного управления» для больших языковых моделей (LLM) с помощью специальных «токенов управления». Работа опубликована на arXiv.org 8 января 2026 года. Метод позволяет одновременно направлять вывод модели на соответствие нескольким заданным требованиям, что является ключевым для реального применения ИИ.
Ключевая инновация — создание «токенов управления», которые встраивают в себя отдельные желаемые поведения, описанные на естественном языке. В отличие от методов, работающих в пространстве активаций нейросети, эти токены существуют на уровне входных данных. Это позволяет более эффективно комбинировать поведения «с нуля». Также был обучен специальный «токен композиции», который обобщает понятие сочетания и работает даже с новыми, ранее не встречавшимися комбинациями поведений.
Проблема контроля вывода LLM для удовлетворения множества условий одновременно — композиционное управление — ранее была мало изучена. Существующие подходы, такие как инструкции на естественном языке, управление через активации или слияние адаптеров LoRA, часто не справляются с такой задачей. Новый метод решает эту проблему, делая ИИ более предсказуемым и управляемым в сложных сценариях, где требуется баланс между разными критериями.
Эксперименты на различных архитектурах LLM показали, что предложенные токены управления превосходят конкурирующие подходы по эффективности многоаспектного контроля. Кроме того, метод не заменяет, а дополняет обычные текстовые инструкции, и их совместное использование даёт ещё лучшие результаты. Это открывает путь к созданию более надёжных и адаптируемых ИИ-систем.