Исследователи Джордж Сан и И-Хуэй Чжоу представили новый метод для заполнения пропущенных значений в данных — Generative Conditional Missing Imputation Networks (GCMI). Работа опубликована на arXiv.org 2 января 2026 года. Метод продемонстрировал превосходство над существующими подходами в серии тестов на эталонных наборах данных.
Метод GCMI основан на генеративном условном подходе и предназначен для работы с данными, пропущенные значения в которых возникают случайно (MCAR) или зависят от наблюдаемых данных (MAR). Для повышения устойчивости и точности авторы интегрировали в GCMI фреймворк множественной импутации с использованием цепных уравнений.
Заполнение пропусков — критически важная задача в статистике и машинном обучении, так как неполные данные искажают анализ и снижают качество моделей. Эффективные методы импутации позволяют использовать больше данных и повышать надёжность выводов в медицине, финансах и социальных науках.
Предложенный подход, по заявлению авторов, обеспечивает высокую стабильность модели и улучшает качество восстановления данных. Это делает GCMI перспективным инструментом для практического применения в анализе данных.