Фильтрация победила тонкую настройку: новый взгляд на обучение языковых моделей
Учёные изменили представление о том, как языковые модели учатся на ходу. Они сравнили этот процесс с фильтром Калмана.
Учёные изменили представление о том, как языковые модели учатся на ходу. Они сравнили этот процесс с фильтром Калмана.
Исследователи из Apple нашли способ улучшить большие языковые модели. Они не стали их переучивать. Вместо этого они изменили сам процесс выдачи ответов.
Группа учёных представила фреймворк CuMA, который позволяет большим языковым моделям учитывать культурные различия пользователей, избегая усреднённых и бесполезных ответов.
Международная группа исследователей представила комплексную оценку методов обнаружения текста, сгенерированного большими языковыми моделями, создав единый бенчмарк.
Исследователи представили CogCanvas — метод извлечения точных данных из длинных диалогов с большими языковыми моделями без дополнительного обучения.
Исследователи представили LendNova — первую сквозную автоматизированную систему оценки кредитных рисков, которая использует языковые модели для анализа необработанных текстовых кредитных отчётов.
Команда Falcon анонсировала семейство языковых моделей Falcon-H1-Arabic, созданных специально для арабского языка с использованием гибридной архитектуры Mamba-Transformer.
Исследователи из Нигерии представили пилотное исследование GENSCORE по использованию дообученных больших языковых моделей для автоматического скрининга депрессии на нигерийском пиджине.