Учёные изучили уязвимость видео-моделей ИИ. Они нашли способ переносить атаки между разными системами.
Метод назвали I2V-MLLM. Он использует модель для изображений как основу для атаки.
Старые методы работали плохо. Они не учитывали разные кадры и мультимодальность.
Новый подход интегрирует пространственную и временную информацию. Помехи создаются в скрытом пространстве модели.
Эффективность проверили на двух задачах. Успешность атаки составила около 58%.
Это исследование показывает слабость современных систем. Безопасность видео-ИИ требует большего внимания.