Исследователь Хорхе Ортис представил препринт работы, посвящённой управлению надёжностью моделей «визуальный язык» (VLM) в задачах видео-вопросов и ответов. Ключевая идея — использование «регуляторов явного воздержания», которые позволяют системе отказываться от генерации ответа, если её внутренняя уверенность ниже заданного порога.
В исследовании использовались набор данных NExT-QA и модель Gemini 2.0 Flash. Основной вывод: регулировка порога уверенности (эпсилон) обеспечивает плавный контроль над компромиссом между «риском» (ошибкой) и «покрытием» (долей отвеченных вопросов). Это даёт механистический контроль над ошибками внутри одного распределения данных.
Работа критически важна для развёртывания ИИ в ответственных сферах, где цена ошибки высока — например, в медицине, автономных системах или безопасности. Способность системы предсказуемо воздерживаться от ответа, а не гадать, повышает её надёжность и доверие пользователей.
Автор отмечает, что следующий важный вопрос — сохраняется ли такой контроль при сдвиге распределения данных, когда модель сталкивается с примерами, отличающимися от обучающих. Это ключевой аспект для реального применения.