Память агентов ИИ: постоянный контекст для автономных систем

Память агентов ИИ обеспечивает постоянный контекст, обучение и координацию между сессиями для автономных систем ИИ, работающих за пределами одноходовых разговоров. Память преобразует языковые модели без состояния в агентов с состоянием, способных накапливать знания, поддерживать отношения и совершенствоваться через опыт. Четыре отдельных типа памяти служат разным целям: токены в контексте для немедленного вспоминания, семантические векторные хранилища для поиска по сходству, структурированные системы ключ-значение для организованных данных и эпизодические журналы для процедурного обучения. Архитектуры общей памяти вводят риски безопасности, включая атаки отравления памяти и уязвимости раскрытия учётных данных.

Что такое память агентов ИИ и почему она важна?

Память агентов ИИ — это система постоянного хранения и извлечения, позволяющая автономным агентам поддерживать контекст, накапливать знания и координироваться между сессиями за пределами эфемерного окна токенов языковых моделей.

Четыре типа памяти агентов ИИ

Память в контексте: окно токенов

Эфемерная память существует в окне контекста языковой модели, обычно 32K-200K токенов в зависимости от модели.

Управление контекстом становится критичным, когда разговоры превышают лимиты токенов.

Последствия для стоимости масштабируются линейно с длиной контекста, так как каждый вызов LLM повторно обрабатывает всё окно контекста.

Семантическая память: извлечение из векторного хранилища

Векторные вложения обеспечивают поиск семантически связанной информации по сходству из больших баз знаний.

Популярные реализации включают mem0ai/mem0 (56 445 звёзд), Letta ранее MemGPT (22 890 звёзд) и cognee graph-RAG (17 451 звезда).

Соображения безопасности возникают, когда несколько агентов совместно используют векторные хранилища.

Структурированная память: ключ-значение и доска объявлений

Хранилище ключ-значение организует информацию в структурированных иерархиях для точного извлечения и обновлений.

Системы доски объявлений расширяют хранилище ключ-значение для многоагентной координации. Агенты пишут обновления прогресса через иерархические ключи, такие как status/researcher.

Эпизодическая память: журналы событий и процедуры

Ведение журнала событий захватывает хронологические записи действий агентов, вызовов инструментов и внешних взаимодействий.

Процедурное обучение извлекает успешные паттерны взаимодействия из эпизодических журналов для улучшения будущей работы.

Риски безопасности в системах памяти агентов

Отравление памяти: внедрение ложных фактов

Векторы атак нацелены на системы постоянной памяти, внедряя ложную информацию, которая искажает поведение агента между сессиями. Документация исследований в статьях arXiv cs.AI 2025 демонстрирует практические атаки отравления памяти против популярных библиотек памяти агентов.

Раскрытие учётных данных через общую память

CVE-2025-67732 продемонстрировал, как совместное хранение учётных данных в системах памяти агентов раскрывает API-ключи любому аутентифицированному пользователю с доступом к памяти.

Позиция OpenLegion

Память агентов ИИ фундаментальна для автономных систем, но последствия постоянной памяти для безопасности создают значительные риски, которые многие реализации игнорируют. CVE-2025-67732 обнажил систематический риск раскрытия учётных данных.

Архитектура OpenLegion решает эти риски через изоляцию, а не через контроль доступа. Vault proxy гарантирует, что учётные данные никогда не попадут в системы памяти.

Четырёхзонная архитектура: память с защитой Vault

Четырёхзонная архитектура полностью разделяет управление учётными данными и операции с памятью. Зоны 1-4 гарантируют, что учётные данные никогда не сохраняются в системах памяти агентов.

Нативная доска объявлений обеспечивает структурированную координацию памяти без внешних векторных баз данных. Работает на SQLite с гарантиями ACID.

Изоляция рабочего пространства для каждого агента

Частное рабочее пространство предоставляет каждому агенту изолированное файловое хранилище для личной памяти, конфигурации и рабочих файлов.

Исследуйте архитектуру платформы агентов ИИ для комплексных подходов к безопасности и управлению памятью. Для уязвимостей безопасности агентов ИИ смотрите подробные модели угроз.

Часто задаваемые вопросы

Каковы четыре типа памяти агентов ИИ?

Память в контексте (эфемерное окно токенов), семантическая память (извлечение из векторного хранилища), структурированная память (K-V и доска объявлений) и эпизодическая память (журналы событий и процедуры). В контексте обеспечивает немедленное вспоминание, но исчезает при завершении сессий. Семантическая позволяет поиск знаний по сходству. Структурированная поддерживает организованный доступ к данным и координацию агентов. Эпизодическая фиксирует исторические события для обучения и аудиторских следов.

Что такое отравление памяти в агентах ИИ?

Отравление памяти внедряет ложные факты в системы постоянной памяти агентов, искажая поведение агентов между сессиями. Исследование, задокументированное в arXiv cs.AI 2025, показывает практические атаки против популярных библиотек памяти, где ложные факты сохраняются и распространяются через архитектуры общей памяти.

Как системы общей памяти раскрывают учётные данные?

CVE-2025-67732 продемонстрировал раскрытие учётных данных, когда общие хранилища памяти содержат API-ключи, доступные любому аутентифицированному пользователю. Векторный поиск по сходству может непреднамеренно извлекать конфиденциальную информацию, когда запросы семантически соответствуют метаданным учётных данных.

Что такое доска объявлений OpenLegion?

Нативное общее постоянное хранилище ключ-значение, обеспечивающее координацию между агентами без внешних векторных баз данных или сервисов. Работает на SQLite с гарантиями ACID и контролем разрешений на основе шаблонов. Vault proxy предотвращает раскрытие учётных данных, гарантируя, что агенты никогда не получают учётные данные в открытом тексте.

Какие библиотеки памяти наиболее популярны?

mem0ai/mem0 лидирует с 56 445 звёздами GitHub и финансированием Серии A в $23,5 млн от Insight Partners. Letta ранее MemGPT имеет 22 890 звёзд с начальным финансированием $10 млн от Andreessen Horowitz. cognee graph-RAG поддерживает 17 451 звезду.

Как защитить память агентов в продакшене?

Используйте архитектурную изоляцию учётных данных через системы vault proxy, а не контроль на уровне приложений. Внедрите изоляцию рабочего пространства для каждого агента для предотвращения загрязнения памяти. Применяйте разрешения на основе шаблонов в соответствии с принципом наименьших привилегий. Никогда не храните учётные данные ни в какой системе памяти агентов.