Исследователи Майкл Дарлинг, Алан Хесу и их коллеги представили научную работу «К сертификации воплощённого ИИ на основе зрелости: Количественная оценка доверия через механизмы измерений». Статья принята в программу AAAI-26 и опубликована на arXiv.org 6 января 2026 года. Авторы предлагают принципиально новый подход к сертификации автономных систем, взаимодействующих с физическим миром.
Ключевая идея фреймворка — переход от бинарной оценки «прошел/не прошел» к градации по уровням зрелости. Для этого необходимы структурированные системы оценки, количественные механизмы подсчёта баллов и методы работы с компромиссами между разными аспектами надёжности. В качестве примера такого механизма в работе рассмотрено количественное определение неопределённости (Uncertainty Quantification). Практическую применимость подхода авторы продемонстрировали на кейсе с системой обнаружения беспилотных летательных аппаратов (БПЛА).
Разработка вызвана острой необходимостью стандартизации и оценки доверия к воплощённому ИИ — роботам, автономным автомобилям, дронам. Такие системы принимают решения в реальном времени в сложной и непредсказуемой среде, что создаёт риски для безопасности. Существующие методы сертификации зачастую не успевают за скоростью развития технологий и не могут адекватно оценить поведение ИИ в непредвиденных ситуациях.
Предложенный подход позволяет создавать более гибкие и адаптивные стандарты, которые могут эволюционировать вместе с технологиями. Это важный шаг к безопасному и ответственному внедрению автономных систем в критически важные области, такие как транспорт, логистика и медицина.