Исследователь Тао Ан представил CogCanvas — новый метод извлечения точных данных из длинных диалогов с большими языковыми моделями. Метод не требует обучения и превосходит стандартный подход RAG на 7,8 процентных пункта по точности.
CogCanvas извлекает ключевые артефакты из диалога — решения, факты и напоминания — и сохраняет их в исходной формулировке. Это позволяет избежать потери важных деталей, которые часто упускаются при обычном суммаризации. Например, метод сохраняет критическое уточнение «везде» в инструкции «использовать подсказки типов», которое теряется в 81% случаев при стандартном подходе.
Метод особенно эффективен в сложных задачах: он превосходит RAG на 20,6 пункта в вопросах, требующих временного контекста, и на 1,1 пункта в многошаговых рассуждениях. Ключевым компонентом успеха является повторное ранжирование BGE, которое добавляет +7,7 пункта к общей точности. Хотя специализированные обученные методы показывают более высокие абсолютные результаты, CogCanvas предлагает готовое к использованию решение.
Новый подход может быть полезен для систем поддержки, где важна точность извлечения деталей из длинных диалогов, например, в технической поддержке или при совместной работе над кодом.