Исследователь Николай Юдин представил метод, повышающий устойчивость языковых моделей к изменению формата входных данных. Работа, опубликованная на arXiv 7 января 2026 года, показывает, как модели, обученные выполнять модульную арифметику на тексте, перестают ошибаться при сдвиге позиции символов или изменении формулировки задачи.
Базовые модели, достигшие высокой точности на обучающих данных, катастрофически ошибались, когда то же выражение смещалось в другую позицию или подавалось в другой формулировке. Новый рецепт обучения включает маркеры границ выражений, постепенное расширение диапазона позиций, смесь разнообразных шаблонов и согласованное обучение на нескольких вариантах одного примера.
Проблема устойчивости к вариациям во входных данных критична для практического применения ИИ. Модели, которые работают только на строго определённых шаблонах, ненадёжны в реальных условиях, где формулировки и формат могут меняться. Исследование фокусируется на процедурном обобщении — способности модели применять выученное правило в новых условиях.
Предложенный метод значительно улучшил устойчивость к сдвигу позиции и новым шаблонам, сохранив высокую точность на исходных данных. Это показывает, что для надёжного обобщения необходимо явно обучать инвариантности, которые изначально отсутствуют в распределении данных.