Конфликты безопасности в ИИ решаются точечно, а не глобально
Исследователи предложили метод CAST для точной настройки безопасности больших языковых моделей, который избегает ухудшения их общих способностей за счёт анализа отдельных механизмов внимания.