Группа исследователей из Германии и США (Стефан Кёнигорски, Йоханнес Веддер, Бабаджиде Аламу Овойеле, Ибрагим Озкан) опубликовала работу, в которой доказывается, что большие базовые модели не могут заменить золотой стандарт персонализированной медицины — N-of-1 испытания. Статья принята на воркшоп AAAI 2026.
Учёные выявили ключевые парадоксы, мешающие персонализации: парадокс обобщаемости (модели, точные в одном исследовании, не работают в других), парадокс приватности и производительности, парадокс масштаба и специфичности, а также парадокс автоматизации и эмпатии. Главный вопрос — способны ли модели к причинно-следственному анализу, а не только к предсказаниям.
N-of-1 испытания — это перекрёстные эксперименты на одном пациенте, которые считаются эталоном для установления индивидуальных причинно-следственных связей. Они решают выявленные парадоксы, обеспечивая доказательства внутри человека и сохраняя приватность через локальные эксперименты.
Авторы предлагают гибридную модель: большие модели генерируют ранжированные гипотезы о вмешательствах с оценкой неопределённости, а затем эти гипотезы проверяются в N-of-1 испытаниях для конкретного пациента. Такой подход сочетает силу моделей в анализе популяционных данных с точностью индивидуальных клинических испытаний.