Предложен метод Dual-Align для калибровки уверенности языковых моделей - AI Founder

Предложен метод Dual-Align для калибровки уверенности языковых моделей

Предложен метод Dual-Align для калибровки уверенности языковых моделей

Учёные предложили новый метод Dual-Align для исправления систематической излишней уверенности больших языковых моделей, возникающей после их дообучения.

Исследователи представили новый метод Dual-Align для исправления систематической излишней уверенности больших языковых моделей (LLM), возникающей после их дообучения. Метод использует предобученную модель в качестве калибратора для пост-обученной модели, исправляя два типа ошибок.

Авторы работы выявили, что ошибки калибровки возникают из-за двух явлений: «дрейфа уверенности», когда итоговая уверенность модели завышается, и «дрейфа процесса», когда меняются внутренние пути принятия решений. Dual-Align одновременно выравнивает итоговую уверенность и внутренние процессы модели, используя всего один параметр — температуру.

Проблема излишней уверенности у дообученных моделей критична для их практического применения, особенно в областях, где важна надёжность ответов. Существующие методы калибровки часто сосредотачивались только на итоговых распределениях, игнорируя изменения во внутренней динамике модели.

Эксперименты показали, что предложенный метод последовательно улучшает калибровку по сравнению с базовыми подходами, снижая ошибки и приближаясь к качеству контролируемых методов, при этом не снижая полезность модели после дообучения.

Елена Петрова
Автор: Елена Петрова

Продуктовый дизайнер с фокусом на AI-инструментах. Тестирует и сравнивает нейросети для креативных профессий.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x