Apple ускорила ИИ-модели без их переобучения - AI Founder

Apple ускорила ИИ-модели без их переобучения

Apple ускорила ИИ-модели без их переобучения

Исследователи из Apple нашли способ улучшить большие языковые модели. Они не стали их переучивать. Вместо этого они изменили сам процесс выдачи ответов.

Учёные из Apple представили новый метод RoE. Он работает с моделями Mixture-of-Experts. Метод делает их точнее и требует меньше вычислений.

RoE заставляет модель предлагать несколько вариантов ответа для одного слова. Потом алгоритм выбирает лучший. Это похоже на работу ансамбля внутри одной модели.

Метод вносит контролируемую случайность в выбор экспертов. Так модель находит более точные решения. Всё это происходит без изменения её параметров.

Например, модель на 7 миллиардов параметров стала работать как модель на 10,5 миллиардов. При этом вычислений стало на 30% меньше. Экономия ресурсов значительная.

Исследователи оптимизировали кэширование и пакетную обработку. Это снизило нагрузку на память. Скорость работы почти не изменилась.

Работа опубликована в январе 2026 года. Метод открывает новые возможности для старых моделей. Их можно использовать эффективнее.

Мария Соколова
Автор: Мария Соколова

Журналист и аналитик с фокусом на AI-инструменты для стартапов. Пишу о том, как основатели компаний внедряют ИИ для автоматизации и роста выручки.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x