Предложена новая функция потерь NCMI для обучения классификаторов - AI Founder

Предложена новая функция потерь NCMI для обучения классификаторов

Предложена новая функция потерь NCMI для обучения классификаторов

Учёные предложили новую функцию потерь на основе нормализованной условной взаимной информации (NCMI) для обучения глубоких нейронных классификаторов.

Группа исследователей представила новую функцию потерь — нормализованную условную взаимную информацию (NCMI). Она служит прямой заменой кросс-энтропии при обучении глубоких нейронных сетей для классификации. Авторы работы — Линфенг Е, Чжисян Чи, Константинос Н. Платаниотис и Эн-Хуэй Ян. Статья опубликована на arXiv 5 января 2026 года.

Ключевое наблюдение: значение NCMI модели обратно пропорционально её точности. На основе этого разработан эффективный чередующийся алгоритм для минимизации NCMI. Вычислительная сложность сравнима с кросс-энтропией. Тесты на ImageNet с ResNet-50 показали рост точности top-1 на 2,77%. На медицинском датасете CAMELYON-17 для субтипирования снимков целых слайдов макро-F1 вырос на 8,6%.

Кросс-энтропия — де-факто стандарт для обучения классификаторов. Однако поиск более эффективных функций потерь остаётся актуальной задачей для повышения точности моделей. Улучшения на ключевых бенчмарках, особенно в медицинской визуализации, демонстрируют практическую ценность подхода.

Улучшения стабильны для разных архитектур и размеров батча. Это делает NCMI практичной и конкурентоспособной альтернативой кросс-энтропии для широкого круга задач классификации.

Александр Чернов
Автор: Александр Чернов

Редактор с бэкграундом в продуктовом менеджменте и разработке. Специализируется на материалах о применении ИИ в EdTech и B2B-сегменте.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x