Память агентов ИИ: постоянный контекст для автономных систем
Память агентов ИИ обеспечивает постоянный контекст, обучение и координацию между сессиями для автономных систем ИИ, работающих за пределами одноходовых разговоров. Память преобразует языковые модели без состояния в агентов с состоянием, способных накапливать знания, поддерживать отношения и совершенствоваться через опыт. Четыре отдельных типа памяти служат разным целям: токены в контексте для немедленного вспоминания, семантические векторные хранилища для поиска по сходству, структурированные системы ключ-значение для организованных данных и эпизодические журналы для процедурного обучения. Архитектуры общей памяти вводят риски безопасности, включая атаки отравления памяти и уязвимости раскрытия учётных данных.
Что такое память агентов ИИ и почему она важна?
Память агентов ИИ — это система постоянного хранения и извлечения, позволяющая автономным агентам поддерживать контекст, накапливать знания и координироваться между сессиями за пределами эфемерного окна токенов языковых моделей.
Четыре типа памяти агентов ИИ
Память в контексте: окно токенов
Эфемерная память существует в окне контекста языковой модели, обычно 32K-200K токенов в зависимости от модели.
Управление контекстом становится критичным, когда разговоры превышают лимиты токенов.
Последствия для стоимости масштабируются линейно с длиной контекста, так как каждый вызов LLM повторно обрабатывает всё окно контекста.
Семантическая память: извлечение из векторного хранилища
Векторные вложения обеспечивают поиск семантически связанной информации по сходству из больших баз знаний.
Популярные реализации включают mem0ai/mem0 (56 445 звёзд), Letta ранее MemGPT (22 890 звёзд) и cognee graph-RAG (17 451 звезда).
Соображения безопасности возникают, когда несколько агентов совместно используют векторные хранилища.
Структурированная память: ключ-значение и доска объявлений
Хранилище ключ-значение организует информацию в структурированных иерархиях для точного извлечения и обновлений.
Системы доски объявлений расширяют хранилище ключ-значение для многоагентной координации. Агенты пишут обновления прогресса через иерархические ключи, такие как status/researcher.
Эпизодическая память: журналы событий и процедуры
Ведение журнала событий захватывает хронологические записи действий агентов, вызовов инструментов и внешних взаимодействий.
Процедурное обучение извлекает успешные паттерны взаимодействия из эпизодических журналов для улучшения будущей работы.
Риски безопасности в системах памяти агентов
Отравление памяти: внедрение ложных фактов
Векторы атак нацелены на системы постоянной памяти, внедряя ложную информацию, которая искажает поведение агента между сессиями. Документация исследований в статьях arXiv cs.AI 2025 демонстрирует практические атаки отравления памяти против популярных библиотек памяти агентов.
Раскрытие учётных данных через общую память
CVE-2025-67732 продемонстрировал, как совместное хранение учётных данных в системах памяти агентов раскрывает API-ключи любому аутентифицированному пользователю с доступом к памяти.
Позиция OpenLegion
Память агентов ИИ фундаментальна для автономных систем, но последствия постоянной памяти для безопасности создают значительные риски, которые многие реализации игнорируют. CVE-2025-67732 обнажил систематический риск раскрытия учётных данных.
Архитектура OpenLegion решает эти риски через изоляцию, а не через контроль доступа. Vault proxy гарантирует, что учётные данные никогда не попадут в системы памяти.
Четырёхзонная архитектура: память с защитой Vault
Четырёхзонная архитектура полностью разделяет управление учётными данными и операции с памятью. Зоны 1-4 гарантируют, что учётные данные никогда не сохраняются в системах памяти агентов.
Нативная доска объявлений обеспечивает структурированную координацию памяти без внешних векторных баз данных. Работает на SQLite с гарантиями ACID.
Изоляция рабочего пространства для каждого агента
Частное рабочее пространство предоставляет каждому агенту изолированное файловое хранилище для личной памяти, конфигурации и рабочих файлов.
Исследуйте архитектуру платформы агентов ИИ для комплексных подходов к безопасности и управлению памятью. Для уязвимостей безопасности агентов ИИ смотрите подробные модели угроз.
Часто задаваемые вопросы
Каковы четыре типа памяти агентов ИИ?
Память в контексте (эфемерное окно токенов), семантическая память (извлечение из векторного хранилища), структурированная память (K-V и доска объявлений) и эпизодическая память (журналы событий и процедуры). В контексте обеспечивает немедленное вспоминание, но исчезает при завершении сессий. Семантическая позволяет поиск знаний по сходству. Структурированная поддерживает организованный доступ к данным и координацию агентов. Эпизодическая фиксирует исторические события для обучения и аудиторских следов.
Что такое отравление памяти в агентах ИИ?
Отравление памяти внедряет ложные факты в системы постоянной памяти агентов, искажая поведение агентов между сессиями. Исследование, задокументированное в arXiv cs.AI 2025, показывает практические атаки против популярных библиотек памяти, где ложные факты сохраняются и распространяются через архитектуры общей памяти.
Как системы общей памяти раскрывают учётные данные?
CVE-2025-67732 продемонстрировал раскрытие учётных данных, когда общие хранилища памяти содержат API-ключи, доступные любому аутентифицированному пользователю. Векторный поиск по сходству может непреднамеренно извлекать конфиденциальную информацию, когда запросы семантически соответствуют метаданным учётных данных.
Что такое доска объявлений OpenLegion?
Нативное общее постоянное хранилище ключ-значение, обеспечивающее координацию между агентами без внешних векторных баз данных или сервисов. Работает на SQLite с гарантиями ACID и контролем разрешений на основе шаблонов. Vault proxy предотвращает раскрытие учётных данных, гарантируя, что агенты никогда не получают учётные данные в открытом тексте.
Какие библиотеки памяти наиболее популярны?
mem0ai/mem0 лидирует с 56 445 звёздами GitHub и финансированием Серии A в $23,5 млн от Insight Partners. Letta ранее MemGPT имеет 22 890 звёзд с начальным финансированием $10 млн от Andreessen Horowitz. cognee graph-RAG поддерживает 17 451 звезду.
Как защитить память агентов в продакшене?
Используйте архитектурную изоляцию учётных данных через системы vault proxy, а не контроль на уровне приложений. Внедрите изоляцию рабочего пространства для каждого агента для предотвращения загрязнения памяти. Применяйте разрешения на основе шаблонов в соответствии с принципом наименьших привилегий. Никогда не храните учётные данные ни в какой системе памяти агентов.