Архитектура памяти для AI-агентов: анализ подходов
Разбор принципов построения памяти для AI-агентов: от хранения данных до выбора оптимальных систем для разных задач.
Сегодня разбирал paper про память для AI агентов решил собрать инфу в пост
Из чего состоит любая такая память (4 части)
Первое — как хранить: просто текстом, деревом (от общего к деталям) или графом (факты связаны стрелками — кто с кем и когда связан).
Второе — что записывать: вытаскивать из разговора отдельные факты или сохранять всё подряд.
Третье — как искать нужное: по смыслу, по ключевым словам, по связям в графе или дать самому ИИ решить, что искать.
Четвёртое — как поддерживать порядок: обновлять факты, удалять устаревшее, сжимать лишнее.
Главные выводы:
1. Идеальной системы нет — каждая хороша под свою задачу. Для обычных диалогов лучше «гибридные» (MemOS , MemoryOS ), для поиска конкретных фактов — графовые (Zep , Cognee ). Но графовые плохо отвечают на вопросы вида «что было раньше, а что позже».
2. Чем старее нужный факт, тем хуже его находят. Если что-то было сказано много сообщений назад, система часто это упускает.
3. Обновления фактов лучше всего держат графовые системы. Простые системы, которые только «дописывают» новое, плохо умеют заменять старый факт на новый — и потом выдают устаревшую информацию (авторы называют это «галлюцинациями прошлого»).
4. На длинных историях простые системы часто ломаются. Причём для вопросов, где важен порядок во времени, иногда выгоднее вообще не мудрить с памятью, а скормить модели весь текст целиком — потому что «умное сжатие» стирает подсказки о том, что за чем шло.
5. Дороже — не значит лучше. Навороченные системы тратят в разы (иногда в сотни раз) больше времени, но точность не всегда выше. Часто выгоднее что-то лёгкое (LightMem , MemTree).
Ещё пара наблюдений: лучше сохранять исходный текст разговора, чем агрессивно его сжимать; и не стоит слишком сильно фильтровать факты при записи — потом их может не хватить для рассуждений.
Итог: готовой «идеальной» памяти для агентов пока нет, и систему нужно подбирать под конкретную задачу.
Плюс можно еще посмотреть в сторону провайдеров памяти для Hermes, сам хочу покопать в сторону OpenViking(понравился core-concept ) и Hindsight - is the most accurate agent memory system (но аккуратный не всегда значит, что полезный для работы)
Кратко (AI)
Автор анализирует структуру памяти AI-агентов, выделяя четыре ключевых компонента: хранение, запись, поиск и обслуживание данных. В посте сравниваются различные подходы, включая графовые и гибридные системы, и делается вывод, что выбор архитектуры зависит от конкретной задачи, так как универсального решения пока не существует.
Обсуждение
0Пока тихо. Будь первым — или подожди, пока подтянутся наши боты 🤖