Claude Opus 4.8:代理效能、快速模式定價及與Opus 4.7的變化
Claude Opus 4.8是Anthropic於2026年5月28日發布的Opus類升級版本。在Online-Mind2Web瀏覽器代理精確度上達到84%,是首款以GPT-5.5成本完成Super-Agent基準全部案例的模型,並修復了Opus 4.7的工具呼叫冗餘退化問題。快速模式以2.5倍速度運行,定價比以往Opus模型的快速模式便宜3倍。標準API定價相較4.7保持不變。API模型識別符為claude-opus-4-8-20260528。
什麼是Claude Opus 4.8?
Claude Opus 4.8是Anthropic於2026年5月發布的Opus模型類升級,這是一款為長時間代理任務、多步驟推理和自主工具使用最佳化的前沿大型語言模型,相比Opus 4.7具有改善的基準效能,修復了工具呼叫可靠性退化問題,並提供快速模式(2.5倍速擴展思考),定價比以往Opus模型快速模式便宜3倍。
OpenLegion的觀點:改變代理經濟的模型
Opus 4.8是我們從2026年5月起推薦給所有執行實質性代理工作的代理的模型。相比Opus 4.7,有三個對生產代理叢集重要的變化。
第一:工具呼叫可靠性修復。Scott Wu(Cognition / Devin CEO)公開確認Opus 4.7引入了註解冗餘和工具呼叫不一致性,降低了Devin的自主工程可靠性。Opus 4.8修復了兩者。對於在緊密工具使用迴圈中的代理,這是需要頻繁修正的模型與乾淨完成任務的模型之間的差別。
第二:Online-Mind2Web達到84%(超越GPT-5.5),以及以GPT-5.5成本完成Super-Agent基準的首次完整通過。Online-Mind2Web衡量真實的基於瀏覽器的任務完成情況。Super-Agent基準涵蓋翻譯、深度研究、投影片製作和端到端分析。Opus 4.8完成了每個案例;GPT-5.5沒有。
第三:快速模式成本降低3倍。Databricks報告在Genie代理上比Opus 4.7便宜61%的token成本。對於之前因成本選擇Sonnet並接受較低品質的長時間任務,Opus 4.8的快速模式改變了計算方式。
Anthropic的公告與其965億美元後估值的650億美元H輪融資同日發布。
OpenLegion支援完整的Anthropic API模型目錄。將claude-opus-4-8-20260528設定為叢集預設值只需一次設定變更。保險庫隔離API呼叫、每代理預算上限和容器隔離執行自動套用。AI代理平台為運行帶預算控制和保險庫隔離的Opus 4.8提供的服務。
基準效能:數字說明什麼
Online-Mind2Web:84%瀏覽器代理精確度
Online-Mind2Web是基於瀏覽器代理任務完成的基準:填寫表單、導航多頁面流程、從即時網頁介面提取資訊。Claude Opus 4.8在2026年5月的Online-Mind2Web上獲得84%,超越Claude Opus 4.7和GPT-5.5。
Super-Agent基準:以GPT-5.5成本完成的首次完整通過
聯合創始人兼CTO Kay Zhu報告稱,Claude Opus 4.8是首款端到端完成其內部Super-Agent基準所有案例的模型,涵蓋:規模化翻譯、深度研究綜合、從原始資料構建簡報和多來源分析。
CursorBench:每個努力級別更高效的工具呼叫
Cursor的內部編碼基準衡量程式碼生成品質和工具使用效率。Claude Opus 4.8在CursorBench的每個努力級別上都超越以往Opus模型。
Legal Agent基準:首款突破10% all-pass標準
Leya(法律AI平台),由應用研究負責人Niko Grupen報告,確認Claude Opus 4.8是首款在Legal Agent基準的all-pass標準上突破10%的模型。
Databricks Genie:比Opus 4.7便宜61%
Databricks報告Claude Opus 4.8在其Genie代理上提供比Opus 4.7便宜61%的token成本。
與Opus 4.7的變化
工具呼叫修復:影響Devin和自主工作負載的冗餘退化
Claude Opus 4.7引入了工具呼叫行為退化,多個生產團隊獨立發現:代理產生過多內聯註解,用不必要的說明性文字包裝輸出,偶爾進行重複或冗餘的工具呼叫。
Scott Wu(Cognition / Devin CEO)公開確認Opus 4.7存在Opus 4.8修復的「註解冗餘和工具呼叫問題」。
Claude Code中的動態工作流程
Opus 4.8為Claude Code帶來動態工作流程:透過建立、排序和管理多步驟工作流程結構來處理大規模問題的能力。Claude Code可以規劃大型程式碼庫遷移,建立子任務,在追蹤中間狀態的同時按順序執行,並根據每一步的結果調整計畫。
快速模式:2.5倍速,便宜3倍
Claude Opus 4.8的快速模式使用擴展思考以標準Opus 2.5倍速度運行,定價比包括Opus 4.7在內的以往Opus模型快速模式便宜3倍。快速模式透過API擴展思考設定中的budget_tokens參數啟用。
API參考與定價
模型識別符
Claude Opus 4.8的API模型識別符為claude-opus-4-8-20260528。在任何Anthropic API呼叫的model參數、Amazon Bedrock模型ID欄位或Google Cloud Vertex AI模型參考中使用此字串。
可用性
Claude Opus 4.8透過三個管道提供:直接透過Anthropic API(api.anthropic.com)、Amazon Bedrock和Google Cloud Vertex AI。三個管道均支援包括擴展思考和快速模式在內的相同功能集。
上下文視窗
Claude Opus 4.8使用與Opus 4.7相同的上下文視窗(200K tokens)和相同的標準輸入/輸出token定價。
何時使用Opus 4.8 vs Sonnet 4 vs Opus 4.7
Opus 4.8:長時間代理任務、瀏覽器自動化、大規模編碼
當任務品質是限制條件時選擇Opus 4.8。在緊密工具使用迴圈中的長時間自主代理受益於工具呼叫可靠性修復。對於透過Anthropic API存取Claude Opus 4.8的AI代理框架,遷移路徑是將模型識別符替換為claude-opus-4-8-20260528。
Sonnet 4:高量、延遲敏感管道
當量和延遲是限制條件時選擇Sonnet 4。高頻API呼叫中每token成本決定單位經濟效益,延遲對最終使用者可見的即時回應管道。
Opus 4.7仍然適用的情況
保留Opus 4.7的唯一情況:專門針對其冗餘模式調整的提示。若您的管道後處理Opus輸出並依賴Opus 4.7生成的註解結構,在有時間適應之前保留4.7。
OpenLegion與Claude Opus 4.8
OpenLegion將claude-opus-4-8-20260528作為叢集模型選項支援:
model: anthropic/claude-opus-4-8-20260528
所有OpenLegion安全控制自動套用於Opus 4.8呼叫:保險庫代理憑證注入、每代理每日和每月預算上限、Docker容器隔離、完整稽核記錄。
有關多代理比較,請參見在圖形與平面叢集架構中部署Opus 4.8的OpenLegion vs LangGraph和共享程序與隔離容器多代理系統中Opus 4.8的OpenLegion vs AutoGen。
在OpenLegion上開始使用Claude Opus 4.8
將claude-opus-4-8-20260528設定為您的叢集預設值。保險庫隔離、預算限制、生產就緒。
開始構建 | 閱讀文件 | 查看平台
常見問題
什麼是Claude Opus 4.8?
Claude Opus 4.8是Anthropic於2026年5月28日宣布的Opus模型類升級。基於Claude Opus 4.7,具有更好的代理判斷力、更強的編碼/推理/專業知識工作基準效能,以及修復影響Opus 4.7自主工作負載的工具呼叫冗餘問題。引入Claude Code中的動態工作流程用於大規模多步驟問題,以及現在比以往Opus模型快速模式便宜3倍的2.5倍速快速模式。
Claude Opus 4.8與GPT-5.5相比如何?
在與代理任務相關的基準上,Claude Opus 4.8在多項獨立評估中超越或持平GPT-5.5。在Online-Mind2Web上,Opus 4.8獲得84%,超越GPT-5.5。在內部Super-Agent基準上,Opus 4.8是首款端到端完成每個案例的模型,以成本同等性擊敗GPT-5.5。在Legal Agent基準上,Opus 4.8是首款在all-pass標準上突破10%的模型。
Claude Opus 4.8快速模式比Opus 4.7便宜多少?
Claude Opus 4.8的快速模式使用擴展思考以正常速度2.5倍運行,定價比包括Opus 4.7在內的以往Opus模型快速模式便宜3倍。標準Opus 4.8定價(不含快速模式)相較Opus 4.7不變。Databricks報告在Genie代理上比Opus 4.7便宜61%的token成本。
Opus 4.7的工具呼叫問題是什麼,Opus 4.8如何修復?
Claude Opus 4.7引入了降低自主工程工作負載可靠性的註解冗餘和工具呼叫不一致性。Cognition(自主編碼代理Devin的製造商)透過CEO Scott Wu報告Opus 4.7比Opus 4.6一致性更低,Opus 4.8修復了兩者。
Claude Opus 4.8的API模型識別符是什麼?
Claude Opus 4.8的API模型識別符為claude-opus-4-8-20260528。透過Anthropic API直接、Amazon Bedrock和Google Cloud Vertex AI提供。快速模式透過擴展思考設定中的budget_tokens參數啟用。標準定價與Opus 4.7相同;快速模式定價比以往Opus模型快速模式低3倍。
Opus 4.8 Claude Code中的動態工作流程是什麼?
動態工作流程是與Opus 4.8一起推出的Claude Code功能,允許透過動態建立、排序和管理多步驟工作流程結構來處理大規模問題。Claude Code可以規劃大型重構或遷移,建立子任務,在追蹤狀態的同時按順序執行,並根據中間結果進行調整。這使Claude Code適用於大型程式碼庫遷移、跨多個檔案和服務的完整功能構建以及跨多個儲存庫的變更。