Исследователи Пау Эстеве и Массимилиано Занин представили работу по генерации синтетических временных рядов данных о задержках рейсов в аэропортах. Результаты исследования опубликованы на arXiv.org 7 января 2026 года. Учёные сравнили три модели машинного обучения и показали, что упрощённый генетический алгоритм генерирует данные, почти неотличимые от реальных.
Для создания моделей использовались большие массивы данных об операциях в аэропортах Европы и США. Помимо генетического алгоритма, были протестированы две модели на основе современных алгоритмов глубокого обучения. Генетический алгоритм не только достиг высокой реалистичности синтетических данных, но и сохранил их высокую вариативность, что критически важно для анализа.
Генерация синтетических данных решает ключевые проблемы, такие как нехватка реальных данных и вопросы конфиденциальности. В авиатранспортной отрасли это позволяет моделировать различные сценарии, изучать распространение задержек между аэропортами и тестировать системы управления без рисков, связанных с использованием реальной информации. Авторы также провели валидацию сгенерированных данных на задаче обнаружения распространения задержек.
Все синтетические данные, созданные в ходе исследования, были опубликованы и стали доступны научному сообществу для дальнейшего анализа и разработки приложений. Это может ускорить создание более устойчивых и эффективных систем управления воздушным движением.