Группа нигерийских исследователей провела пилотное исследование GENSCORE по использованию дообученных больших языковых моделей для автоматического скрининга депрессии на нигерийском пиджине. Модель GPT-4.1 показала наивысшую точность в 94.5% при прогнозировании тяжести симптомов по шкале PHQ-9, превзойдя Gemma-3-4B-it и Phi-3-mini-4k-instruct. Работа опубликована на arXiv.org 28 ноября 2025 года.
Для обучения моделей использовали датасет из 432 аудиоответов на нигерийском пиджине от молодых людей 18-40 лет. Ответы транскрибировали, аннотировали и оценивали по шкале PHQ-9. Модели оценивали количественно (точность, precision, семантическое соответствие) и качественно (ясность, релевантность, культурная уместность). GPT-4.1 также продемонстрировала наилучшие качественные показатели, выдавая наиболее культурно-адекватные и понятные ответы.
Проблема депрессии в Нигерии усугубляется нехваткой клиницистов, стигмой и языковыми барьерами. Традиционные инструменты вроде опросника PHQ-9 валидированы в странах с высоким доходом и могут быть недоступны для сообществ, где говорят на нигерийском пиджине и более чем 520 местных языках. Автоматизированный скрининг на родном языке может повысить доступность помощи.
Исследование закладывает основу для развертывания инструментов ментального здоровья в лингвистически разнообразных и ресурсно-ограниченных средах. Это пример практического применения ИИ для решения локальных проблем здравоохранения.