AI智能體記憶體:自主系統的持久上下文
AI智能體記憶體使自主AI系統在單次對話之外運作,跨工作階段實現持久上下文、學習和協調。記憶體將無狀態語言模型轉變為有狀態智能體,能夠積累知識、維護關係並透過經驗提高效能。四種不同的記憶體類型服務於不同的目的:用於即時回憶的上下文內令牌、用於相似性檢索的語義向量儲存、用於組織資料的結構化鍵值系統,以及用於程式學習的情節日誌。共享記憶體架構引入了安全風險,包括記憶體投毒攻擊和憑證暴露漏洞。
AI智能體記憶體是什麼,為什麼重要?
AI智能體記憶體是持久儲存和檢索系統,使自主智能體能夠在語言模型的短暫令牌視窗之外跨工作階段維護上下文、積累知識和協調。記憶體對於生產系統中的智能體自主性、學習和多智能體協調至關重要。
AI智能體記憶體的四種類型
上下文內記憶體:令牌視窗
短暫記憶體存在於語言模型的上下文視窗內,根據模型通常為32K-200K個令牌。
上下文管理在對話超出令牌限制時變得至關重要。
成本影響隨上下文長度線性擴展,因為每次LLM呼叫都重新處理整個上下文視窗。
記憶體壓縮技術包括總結舊對話、將事實提取到結構化儲存以及選擇性保留高價值上下文。
語義記憶體:向量儲存檢索
向量嵌入使從大型知識庫中進行語義相關資訊的相似性檢索成為可能。
流行實作包括mem0ai/mem0(56,445星)、Letta前身MemGPT(22,890星)和cognee graph-RAG(17,451星)。
安全考量在多個智能體共享向量儲存時出現。當一個智能體的記憶出現在另一個智能體的檢索結果中時,就會發生交叉污染。
結構化記憶體:鍵值和黑板
鍵值儲存在結構化層次中組織資訊,實現精確檢索和更新。
黑板系統擴展鍵值儲存用於多智能體協調。智能體透過status/researcher或output/analyst/report_draft等層次鍵寫入進度更新。
情節記憶體:事件日誌和程序
事件日誌捕獲智能體動作、工具呼叫、外部互動和效能指標的時間順序記錄。
程式學習從情節日誌中提取成功的互動模式,以提高未來效能。
智能體記憶體系統中的安全風險
記憶體投毒:注入虛假事實
攻擊向量透過注入破壞智能體跨工作階段行為的虛假資訊來針對持久記憶體系統。arXiv cs.AI 2025論文的研究文件展示了針對流行智能體記憶體庫的實際記憶體投毒攻擊。
透過共享記憶體暴露憑證
CVE-2025-67732展示了智能體記憶體系統中共享憑證儲存如何將API金鑰暴露給任何具有記憶體存取權限的已驗證使用者。
向量搜尋漏洞在API金鑰或其他敏感資料被嵌入並索引到共享向量儲存中時出現。
OpenLegion的觀點
AI智能體記憶體對自主系統至關重要,但持久記憶體的安全影響創造了許多實作忽視的重大風險。CVE-2025-67732揭示了憑證暴露的系統性風險。
OpenLegion的架構透過隔離而非存取控制來應對這些風險。vault代理確保憑證永遠不會進入記憶體系統。每智能體工作區隔離防止智能體之間的記憶體污染。
四區架構:Vault保護記憶體
四區架構將憑證管理與記憶體操作完全分離。1-4區確保憑證永遠不會在智能體記憶體系統中持久化。
原生黑板無需外部向量資料庫即可提供結構化記憶體協調。在SQLite上執行,具有ACID保證。
每智能體工作區隔離
私有工作區為每個智能體提供隔離的檔案儲存,用於個人記憶體、設定和工作檔案。
**探索AI智能體平台架構**以獲取全面的安全性和記憶體管理方法。有關AI智能體安全漏洞,請參閱詳細的威脅模型和CVE涵蓋範圍。
常見問題
AI智能體記憶體的四種類型是什麼?
上下文內記憶體(短暫令牌視窗)、語義記憶體(向量儲存檢索)、結構化記憶體(K-V和黑板)和情節記憶體(事件日誌和程序)。上下文內提供即時回憶,但在工作階段結束時消失。語義使基於相似性的知識檢索成為可能。結構化支援有組織的資料存取和智能體協調。情節捕獲歷史事件用於學習和稽核追蹤。
AI智能體中的記憶體投毒是什麼?
記憶體投毒向持久智能體記憶體系統注入虛假事實,破壞跨工作階段的智能體行為。arXiv cs.AI 2025中記錄的研究展示了針對流行記憶體庫的實際攻擊,其中虛假事實透過共享記憶體架構持續存在並傳播。
共享記憶體系統如何暴露憑證?
CVE-2025-67732展示了當共享記憶體儲存包含任何具有記憶體存取權限的已驗證使用者可存取的API金鑰時的憑證暴露。當查詢詞語義上匹配憑證元資料時,向量相似性搜尋可能無意中檢索敏感資訊。
OpenLegion黑板是什麼?
一個原生共享鍵值持久儲存,使智能體間協調無需外部向量資料庫或服務。在SQLite上執行,具有ACID保證和基於模式的權限控制。vault代理透過確保智能體從不接收明文憑證來防止憑證暴露。
哪些記憶體庫最受歡迎?
mem0ai/mem0以Insight Partners 2350萬美元A輪融資領先,擁有56,445個GitHub星。Letta前身MemGPT擁有來自Andreessen Horowitz的1000萬美元種子融資,22,890星。cognee graph-RAG維持17,451星。ByteDance的deer-flow SuperAgent自2025年5月起達到69,136星。
如何在生產中保護智能體記憶體?
使用vault代理系統進行架構憑證隔離,而不是應用程式層級控制。實作每智能體工作區隔離以防止記憶體污染。遵循最小權限原則套用基於模式的權限。永遠不要在任何智能體記憶體系統中儲存憑證。