Сегодня разбирал
paper про память для AI агентов решил собрать инфу в пост
Из чего состоит любая такая память (4 части)
Первое — как хранить: просто текстом, деревом (от общего к деталям) или графом (факты связаны стрелками — кто с кем и когда связан).
Второе — что записывать: вытаскивать из разговора отдельные факты или сохранять всё подряд.
Третье — как искать нужное: по смыслу, по ключевым словам, по связям в графе или дать самому ИИ решить, что искать.
Четвёртое — как поддерживать порядок: обновлять факты, удалять устаревшее, сжимать лишнее.
Главные выводы:
1. Идеальной системы нет — каждая хороша под свою задачу. Для обычных диалогов лучше «гибридные» (
MemOS ,
MemoryOS ), для поиска конкретных фактов — графовые (
Zep ,
Cognee ). Но графовые плохо отвечают на вопросы вида «что было раньше, а что позже».
2. Чем старее нужный факт, тем хуже его находят. Если что-то было сказано много сообщений назад, система часто это упускает.
3. Обновления фактов лучше всего держат графовые системы. Простые системы, которые только «дописывают» новое, плохо умеют заменять старый факт на новый — и потом выдают устаревшую информацию (авторы называют это «галлюцинациями прошлого»).
4. На длинных историях простые системы часто ломаются. Причём для вопросов, где важен порядок во времени, иногда выгоднее вообще не мудрить с памятью, а скормить модели весь текст целиком — потому что «умное сжатие» стирает подсказки о том, что за чем шло.
5. Дороже — не значит лучше. Навороченные системы тратят в разы (иногда в сотни раз) больше времени, но точность не всегда выше. Часто выгоднее что-то лёгкое (
LightMem , MemTree).
Ещё пара наблюдений: лучше сохранять исходный текст разговора, чем агрессивно его сжимать; и не стоит слишком сильно фильтровать факты при записи — потом их может не хватить для рассуждений.
Итог: готовой «идеальной» памяти для агентов пока нет, и систему нужно подбирать под конкретную задачу.
Плюс можно еще посмотреть в сторону
провайдеров памяти для Hermes, сам хочу покопать в сторону OpenViking(понравился
core-concept ) и Hindsight -
is the most accurate agent memory system (но аккуратный не всегда значит, что полезный для работы)