Pinterest победил ошибки памяти в Apache Spark
Каждый день в Pinterest падали сотни задач из-за нехватки памяти. Инженеры нашли способ заставить их работать.
Каждый день в Pinterest падали сотни задач из-за нехватки памяти. Инженеры нашли способ заставить их работать.
Мой телефон постоянно жаловался на нехватку места. Я нашёл виновника. Им оказалось одно стандартное приложение.
Настройка нейросети — это долго и дорого. Теперь можно сделать это один раз для маленькой модели и перенести на гигантскую.
Исследователи придумали, как заставить ИИ думать быстрее и дешевле. Система генерирует несколько вариантов рассуждения, а потом оставляет лучшие.
NVIDIA открыла код метода KVzap. Он решает главную проблему больших языковых моделей — огромный кэш памяти.
В Microsoft Research представили небольшую, но узкоспециализированную языковую модель. Её назвали OptiMind. Она решает задачи оптимизации лучше больших собратьев.
Оптимизатор Shampoo, победитель крупного конкурса, получил строгое математическое обоснование. Китайские учёные объединили два подхода и вывели формулу.
Исследователи из Apple нашли способ улучшить большие языковые модели. Они не стали их переучивать. Вместо этого они изменили сам процесс выдачи ответов.
Исследователи Массачусетского технологического института предлагают использовать методы машинного обучения для оптимизации работы энергосистем, что может повысить их эффективность и устойчивость.
Исследователи представили RelayLLM — фреймворк для эффективных рассуждений языковых моделей, который снижает вычислительные затраты на 98% за счёт точечного привлечения мощных моделей.
Учёные формализовали концепцию предсказуемых многообразий градиентов, показав, что их эволюция во время обучения нейросетей имеет низкую временную сложность.
Исследователи Amazon Science представили SharpZO — новый гибридный метод оптимизации, позволяющий тонко настраивать визуально-языковые модели на периферийных устройствах, используя только прямое распространение.
Prompt Caching — это метод оптимизации, который помогает сократить расходы на LLM API, выявляя и кэшируя семантически схожие пользовательские запросы.
Исследователи представили систему QUITE, которая использует агентов на основе больших языковых моделей для автоматической оптимизации SQL-запросов, преодолевая ограничения традиционных методов.
Исследователи представили гибридный агент на основе LLM для управления товарными запасами, который снижает общие затраты на 32,1% по сравнению с прямым использованием GPT-4o.