Компания OpenAI начала сбор реальных рабочих задач и проектов от внешних подрядчиков для оценки производительности своих новых AI-агентов. Подрядчикам предлагается загружать конкретные результаты работы из их текущей или предыдущей профессиональной деятельности, включая документы Word, PDF, презентации и таблицы Excel.
Согласно внутренним документам, полученным WIRED, OpenAI просит подрядчиков описывать задачи, которые они выполняли на работе, и загружать реальные примеры выполненных проектов. Компания подчёркивает, что примеры должны отражать реальную рабочую деятельность, которую человек фактически выполнял. При этом подрядчики сами отвечают за удаление конфиденциальной информации и персональных данных из загружаемых файлов.
Этот проект является частью новой системы оценки OpenAI, запущенной в сентябре, которая измеряет производительность AI-моделей в сравнении с человеческими профессионалами в различных отраслях. Компания считает такие сравнения ключевым показателем прогресса на пути к созданию искусственного общего интеллекта (AGI).
Юристы по интеллектуальной собственности отмечают, что сбор конфиденциальной информации в таких масштабах может привести к искам о незаконном присвоении коммерческой тайны. OpenAI и компания Handshake AI, занимающаяся сбором данных, отказались от комментариев по этому проекту.