Учёные разгадали тайну «озарения» нейросетей - AI Founder

Учёные разгадали тайну «озарения» нейросетей

Учёные разгадали тайну «озарения» нейросетей

Нейросети иногда внезапно «понимают» задачу, долго её заучивая. Учёные нашли этому математическое объяснение.

Исследователь Тиберью Мусат опубликовал работу на arXiv. Он объяснил феномен «гроккинга» в машинном обучении.

Нейросеть сначала заучивает тренировочные данные. Потом, после долгой паузы, происходит обобщение.

Учёный связал это с минимизацией нормы весов. Процесс идёт на так называемом многообразии нулевых потерь.

Доказательство работает для бесконечно малых скоростей обучения. Эксперименты подтвердили теорию на двухслойной сети.

Модель точно воспроизвела задержку обобщения. Это ключ к управлению обучением нейросетей.

Мария Соколова
Автор: Мария Соколова

Журналист и аналитик с фокусом на AI-инструменты для стартапов. Пишу о том, как основатели компаний внедряют ИИ для автоматизации и роста выручки.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x