Группа исследователей под руководством Альберто Пурпуры представила новый метод оптимизации промптов для больших языковых моделей (LLM). Работа под названием «Enhancing LLM Instruction Following: An Evaluation-Driven Multi-Agentic Workflow for Prompt Instructions Optimization» была опубликована на arXiv 6 января 2026 года. Предложенный подход позволяет значительно повысить способность моделей следовать формальным ограничениям в инструкциях.
Ключевая идея метода — разделение оптимизации основного описания задачи и формальных ограничений, которые выступают в роли критериев приемлемости ответа. Для этого используется мультиагентный рабочий процесс, где разные агенты отвечают за разные аспекты промпта. Процесс итеративный: на основе количественных оценок качества выполнения инструкций промпты переписываются и улучшаются.
Проблема, которую решает метод, актуальна: современные LLM часто генерируют содержательно верные ответы, но нарушают формальные требования, указанные в инструкции. Это делает их выводы процедурно ошибочными, что критично для автоматизации бизнес-процессов или генерации кода. Традиционные методы доработки промптов фокусируются лишь на перефразировании основной задачи, игнорируя детальные ограничения.
Оценка метода на моделях Llama 3.1 8B и Mixtral-8x7B показала, что доработанные с его помощью промпты приводят к значительно более высоким баллам соответствия формальным требованиям. Это открывает путь к созданию более надежных и предсказуемых систем на основе LLM для задач, требующих строгого соблюдения инструкций.