Компания OpenAI проводит внутреннюю реорганизацию, объединяя несколько команд для разработки аудиоустройств на базе искусственного интеллекта. Согласно отчёту The Information, первое устройство, сфокусированное на аудио, планируется выпустить примерно через год, в 2027 году. Компания также анонсирует новую аудиомодель в первом квартале 2026 года.
Инженерные, продуктовые и исследовательские команды объединены в одну инициативу по улучшению аудиомоделей. В OpenAI считают, что текущие голосовые модели отстают от текстовых по точности и скорости. Это одна из причин низкой популярности голосового интерфейса в ChatGPT среди пользователей. Цель — кардинально улучшить качество, чтобы стимулировать переход пользователей на голосовое взаимодействие.
OpenAI планирует выпустить линейку физических устройств в ближайшие годы. Внутри компании обсуждаются различные формы, включая умные колонки и очки, но ключевой акцент сделан на аудиоинтерфейсах, а не на экранных. Этот шаг соответствует общей тенденции: Google, Meta и Amazon также усиливают разработки в области голосовых технологий, например, умных очков Meta.
Новая волна аудиоустройств на базе больших языковых моделей может предложить больше возможностей, чем предыдущее поколение голосовых помощников вроде Alexa или Siri, которые имели существенные ограничения. Некоторые разработчики, включая бывшего дизайн-лидера Apple Джони Айва, также считают, что голосовые интерфейсы менее вызывают зависимость, чем экранные.