CogCanvas: новый метод извлечения данных из длинных диалогов с ИИ - AI Founder

CogCanvas: новый метод извлечения данных из длинных диалогов с ИИ

Исследователи представили CogCanvas — метод извлечения точных данных из длинных диалогов с большими языковыми моделями без дополнительного обучения.

Исследователь Тао Ан представил CogCanvas — новый метод извлечения точных данных из длинных диалогов с большими языковыми моделями. Метод не требует обучения и превосходит стандартный подход RAG на 7,8 процентных пункта по точности.

CogCanvas извлекает ключевые артефакты из диалога — решения, факты и напоминания — и сохраняет их в исходной формулировке. Это позволяет избежать потери важных деталей, которые часто упускаются при обычном суммаризации. Например, метод сохраняет критическое уточнение «везде» в инструкции «использовать подсказки типов», которое теряется в 81% случаев при стандартном подходе.

Метод особенно эффективен в сложных задачах: он превосходит RAG на 20,6 пункта в вопросах, требующих временного контекста, и на 1,1 пункта в многошаговых рассуждениях. Ключевым компонентом успеха является повторное ранжирование BGE, которое добавляет +7,7 пункта к общей точности. Хотя специализированные обученные методы показывают более высокие абсолютные результаты, CogCanvas предлагает готовое к использованию решение.

Новый подход может быть полезен для систем поддержки, где важна точность извлечения деталей из длинных диалогов, например, в технической поддержке или при совместной работе над кодом.

Мария Соколова
Автор: Мария Соколова

Журналист и аналитик с фокусом на AI-инструменты для стартапов. Пишу о том, как основатели компаний внедряют ИИ для автоматизации и роста выручки.

Подпишись на наш Telegram-канал

чтобы не упустить главные AI-новости

Подписаться
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x