Apple научила ИИ выбрасывать лишнее из памяти
Большие языковые модели стали слишком прожорливыми. Их память требует слишком много ресурсов. Учёные из Apple нашли способ это исправить.
Большие языковые модели стали слишком прожорливыми. Их память требует слишком много ресурсов. Учёные из Apple нашли способ это исправить.
Чем дольше вы общаетесь с ИИ, тем больше он вам поддакивает. Это выяснили учёные из MIT и Университета Пенсильвании.
Anthropic объявила о новой эпохе. Модель Claude 4.6 Sonnet теперь умеет «думать вслух». Это меняет работу с кодом и поиском.
Команда Qwen из Alibaba представила новую модель. Она называется Qwen3.5-397B. Это шаг вперёд для ИИ-агентов.
Искусственный интеллект по-прежнему не умеет рассуждать. К такому выводу пришли учёные из Калтеха и Стэнфорда.
Рейтинги языковых моделей в интернете оказались хрупкими. Уберите несколько голосов — и лучшая модель станет худшей.
Anthropic обновила свою флагманскую модель. Теперь ИИ-агенты действуют командами. Это похоже на работу отдела в компании.
Большие языковые модели достигли своего пика. Главные открытия теперь делают в другом месте.
Секрет Anthropic в создании лучшего помощника — обращаться с Claude, будто у него есть душа. Неважно, верят ли в это сами создатели.
Alibaba представила новую модель для рассуждений. Она не просто большая, а думает иначе.
Иммиграционная служба США применяет ИИ Palantir для сортировки доносов. Система работает с мая прошлого года. Она переводит и суммирует сообщения от граждан.
Компания Anthropic написала для своего ИИ Claude новую конституцию. Документ на 57 страницах объясняет модели, как себя вести. Самое важное правило — не помогать в уничтожении человечества.
Гэри Маркус честно говорит о генеративном ИИ. Технология развивается не так хорошо, как обещали.
Исследователи предложили метод CAST для точной настройки безопасности больших языковых моделей, который избегает ухудшения их общих способностей за счёт анализа отдельных механизмов внимания.
Исследователи представили систему CPGPrompt, которая автоматически переводит клинические рекомендации в формат, понятный большим языковым моделям, для поддержки принятия врачебных решений.
Учёные разработали STAR-S — фреймворк, который учит языковые модели самостоятельно рассуждать о правилах безопасности, чтобы эффективнее противостоять взлому.