Математики доказали влияние тяжёлых хвостов на спектр нейросетей - AI Founder

Математики доказали влияние тяжёлых хвостов на спектр нейросетей

Математики Алис Гийонне и Ванесса Пикколо доказали, что тяжёлые хвосты в распределении весов нейронных сетей кардинально меняют их спектральные свойства.

Математики Алис Гийонне и Ванесса Пикколо опубликовали исследование, в котором вывели глобальный закон для сопряжённых ядерных случайных матриц с тяжёлыми хвостами. Работа, размещённая на arXiv.org, описывает асимптотическое спектральное распределение матрицы YY^⊤, возникающей в двухслойной нейронной сети.

Учёные рассмотрели модель, где Y = f(WX). Случайные матрицы W и X имеют независимые одинаково распределённые элементы. Ключевое отличие — элементы матрицы весов W следуют распределению с тяжёлыми хвостами, например, симметричному α-устойчивому закону с α ∈ (0,2), а элементы входной матрицы X имеют лёгкие хвосты. Активационная функция f — ограниченная, гладкая, нечётная и нелинейная.

Исследование важно для теории глубокого обучения. Оно показывает, что тяжёлые хвосты в весах создают сильные корреляции между выходами нейронов. Это приводит к более богатому и принципиально иному спектральному поведению по сравнению со случаем лёгких хвостов. Такие распределения встречаются в разреженных матрицах, где в каждой строке лишь O(1) ненулевых элементов.

Результаты работы, изложенные на 48 страницах, расширяют математическое понимание динамики случайных матриц в машинном обучении. Это фундаментальный шаг к анализу нейросетей с нетривиальными статистическими свойствами параметров.

Мария Соколова
Автор: Мария Соколова

Журналист и аналитик с фокусом на AI-инструменты для стартапов. Пишу о том, как основатели компаний внедряют ИИ для автоматизации и роста выручки.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x