Claude Opus 4.8：代理性能、快速模式定价及与Opus 4.7的变化

Claude Opus 4.8是Anthropic于2026年5月28日发布的Opus类升级版本。在Online-Mind2Web浏览器代理精度上达到84%，是首款以GPT-5.5成本完成Super-Agent基准全部案例的模型，并修复了Opus 4.7的工具调用冗余退化问题。快速模式以2.5倍速度运行，定价比以往Opus模型的快速模式便宜3倍。标准API定价相较4.7保持不变。API模型标识符为claude-opus-4-8-20260528。

什么是Claude Opus 4.8？

Claude Opus 4.8是Anthropic于2026年5月发布的Opus模型类升级，这是一款为长时间代理任务、多步骤推理和自主工具使用优化的前沿大型语言模型，相比Opus 4.7具有改进的基准性能，修复了工具调用可靠性退化问题，并提供快速模式（2.5倍速扩展思考），定价比以往Opus模型快速模式便宜3倍。

OpenLegion的观点：改变代理经济的模型

Opus 4.8是我们从2026年5月起推荐给所有执行实质性代理工作的代理的模型。相比Opus 4.7，有三个对生产代理集群重要的变化。

第一：工具调用可靠性修复。Scott Wu（Cognition / Devin CEO）公开确认Opus 4.7引入了注释冗余和工具调用不一致性，降低了Devin的自主工程可靠性。Opus 4.8修复了两者。对于在紧密工具使用循环中的代理，这是需要频繁修正的模型与干净完成任务的模型之间的差别。

第二：Online-Mind2Web达到84%（超越GPT-5.5），以及以GPT-5.5成本完成Super-Agent基准的首次完整通过。Online-Mind2Web衡量真实的基于浏览器的任务完成情况。Super-Agent基准涵盖翻译、深度研究、幻灯片制作和端到端分析。Opus 4.8完成了每个案例；GPT-5.5没有。

第三：快速模式成本降低3倍。Databricks报告在Genie代理上比Opus 4.7便宜61%的token成本。对于之前因成本选择Sonnet并接受较低质量的长时间任务，Opus 4.8的快速模式改变了计算方式。

Anthropic的公告与其965亿美元后估值的650亿美元H轮融资同日发布。

OpenLegion支持完整的Anthropic API模型目录。将claude-opus-4-8-20260528设置为集群默认值只需一次配置更改。保险库隔离API调用、每代理预算上限和容器隔离执行自动应用。AI代理平台为运行带预算控制和保险库隔离的Opus 4.8提供的服务。

基准性能：数字说明什么

Online-Mind2Web：84%浏览器代理精度

Online-Mind2Web是基于浏览器代理任务完成的基准：填写表单、导航多页面流程、从实时网页界面提取信息。Claude Opus 4.8在2026年5月的Online-Mind2Web上获得84%，超越Claude Opus 4.7和GPT-5.5。这是Opus 4.8发布日期该基准上发布的最高分数。

Super-Agent基准：以GPT-5.5成本完成的首次完整通过

联合创始人兼CTO Kay Zhu报告称，Claude Opus 4.8是首款端到端完成其内部Super-Agent基准所有案例的模型，涵盖：规模化翻译、深度研究综合、从原始数据构建演示文稿和多来源分析。GPT-5.5未完成每个案例。Opus 4.8以GPT-5.5成本实现了这一点。

CursorBench：每个努力级别更高效的工具调用

Cursor的内部编码基准衡量代码生成质量和工具使用效率。Claude Opus 4.8在CursorBench的每个努力级别上都超越以往Opus模型。

Legal Agent基准：首款突破10% all-pass标准

Leya（法律AI平台），由应用研究负责人Niko Grupen报告，确认Claude Opus 4.8是首款在Legal Agent基准的all-pass标准上突破10%的模型。all-pass标准要求多步骤法律工作流中的每个步骤都正确。

Databricks Genie：比Opus 4.7便宜61%

Databricks报告Claude Opus 4.8在其Genie代理（使用PDF和图表多模态推理的数据分析和知识工作AI代理）上提供比Opus 4.7便宜61%的token成本。

与Opus 4.7的变化

工具调用修复：影响Devin和自主工作负载的冗余退化

Claude Opus 4.7引入了工具调用行为退化，多个生产团队独立发现：代理产生过多内联注释，用不必要的说明性散文包装输出，偶尔进行重复或冗余的工具调用。

Scott Wu（Cognition / Devin CEO）公开确认Opus 4.7存在Opus 4.8修复的"注释冗余和工具调用问题"。因工具使用可靠性从Opus 4.7降级到Opus 4.6的团队应用Opus 4.8重新评估。

Claude Code中的动态工作流

Opus 4.8为Claude Code带来动态工作流：通过创建、排序和管理多步骤工作流结构来处理大规模问题的能力。Claude Code可以规划大型代码库迁移，创建子任务，在跟踪中间状态的同时按顺序执行，并根据每一步的结果调整计划。从2026年5月28日起，在使用Opus 4.8的Claude Code中可用。

快速模式：2.5倍速，便宜3倍

Claude Opus 4.8的快速模式使用扩展思考以标准Opus 2.5倍速度运行，定价比包括Opus 4.7在内的以往Opus模型快速模式便宜3倍。标准（非快速模式）定价相较Opus 4.7不变。

快速模式通过API扩展思考配置中的budget_tokens参数启用。

API参考与定价

模型标识符

Claude Opus 4.8的API模型标识符为claude-opus-4-8-20260528。在任何Anthropic API调用的model参数、Amazon Bedrock模型ID字段或Google Cloud Vertex AI模型引用中使用此字符串。

可用性

Claude Opus 4.8通过三个渠道提供：直接通过Anthropic API（api.anthropic.com）、Amazon Bedrock和Google Cloud Vertex AI。三个渠道均支持包括扩展思考和快速模式在内的相同功能集。

上下文窗口

Claude Opus 4.8使用与Opus 4.7相同的上下文窗口（200K tokens）和相同的标准输入/输出token定价。成本改进集中在快速模式。

何时使用Opus 4.8 vs Sonnet 4 vs Opus 4.7

Opus 4.8：长时间代理任务、浏览器自动化、大规模编码

当任务质量是约束条件时选择Opus 4.8。在紧密工具使用循环中的长时间自主代理受益于工具调用可靠性修复。浏览器自动化代理（Online-Mind2Web：84%）在此任务类型上超越任何其他模型。

对于通过Anthropic API访问Claude Opus 4.8的AI代理框架，迁移路径是将模型标识符替换为claude-opus-4-8-20260528。

Sonnet 4：高量、延迟敏感管道

当量和延迟是约束条件时选择Sonnet 4。高频API调用中每token成本决定单位经济效益，延迟对最终用户可见的实时响应管道。

Opus 4.7仍然适用的情况

保留Opus 4.7的唯一情况：专门针对其冗余模式调整的提示。如果您的管道后处理Opus输出并依赖Opus 4.7生成的注释结构，在有时间适应之前保留4.7。

OpenLegion与Claude Opus 4.8

OpenLegion将claude-opus-4-8-20260528作为集群模型选项支持。将其设置为代理的默认值只需代理配置中的一个字段：

model: anthropic/claude-opus-4-8-20260528

所有OpenLegion安全控制自动应用于Opus 4.8调用：保险库代理凭证注入（API密钥从不进入代理容器）、每代理每日和每月预算上限、Docker容器隔离、完整审计日志记录。

有关多代理比较，请参见在图形与平面集群架构中部署Opus 4.8的OpenLegion vs LangGraph和共享进程与隔离容器多代理系统中Opus 4.8的OpenLegion vs AutoGen。

在OpenLegion上开始使用Claude Opus 4.8

将claude-opus-4-8-20260528设置为您的集群默认值。保险库隔离、预算限制、生产就绪。 开始构建 | 阅读文档 | 查看平台

常见问题

什么是Claude Opus 4.8？

Claude Opus 4.8是Anthropic于2026年5月28日宣布的Opus模型类升级。基于Claude Opus 4.7，具有更好的代理判断力、更强的编码/推理/专业知识工作基准性能，以及修复影响Opus 4.7自主工作负载的工具调用冗余问题。引入Claude Code中的动态工作流用于大规模多步骤问题，以及现在比以往Opus模型快速模式便宜3倍的2.5倍速快速模式。

Claude Opus 4.8与GPT-5.5相比如何？

在与代理任务相关的基准上，Claude Opus 4.8在多项独立评估中超越或持平GPT-5.5。在Online-Mind2Web上，Opus 4.8获得84%，超越GPT-5.5。在内部Super-Agent基准上，Opus 4.8是首款端到端完成每个案例的模型，以成本同等性击败GPT-5.5。在Legal Agent基准上，Opus 4.8是首款在all-pass标准上突破10%的模型。

Claude Opus 4.8快速模式比Opus 4.7便宜多少？

Claude Opus 4.8的快速模式使用扩展思考以正常速度2.5倍运行，定价比包括Opus 4.7在内的以往Opus模型快速模式便宜3倍。标准Opus 4.8定价（不含快速模式）相较Opus 4.7不变。Databricks报告在Genie代理上比Opus 4.7便宜61%的token成本。

Opus 4.7的工具调用问题是什么，Opus 4.8如何修复？

Claude Opus 4.7引入了降低自主工程工作负载可靠性的注释冗余和工具调用不一致性。Cognition（自主编码代理Devin的制造商）通过CEO Scott Wu报告Opus 4.7比Opus 4.6一致性更低，Opus 4.8修复了注释冗余退化和工具调用不一致性两者。

Claude Opus 4.8的API模型标识符是什么？

Claude Opus 4.8的API模型标识符为claude-opus-4-8-20260528。通过Anthropic API直接、Amazon Bedrock和Google Cloud Vertex AI提供。快速模式（2.5倍速扩展思考）通过扩展思考配置中的budget_tokens参数启用。标准定价与Opus 4.7相同；快速模式定价比以往Opus模型快速模式低3倍。

Opus 4.8 Claude Code中的动态工作流是什么？

动态工作流是与Opus 4.8一起推出的Claude Code功能，允许通过动态创建、排序和管理多步骤工作流结构来处理大规模问题。Claude Code可以规划大型重构或迁移，创建子任务，在跟踪状态的同时按顺序执行，并根据中间结果进行调整。这使Claude Code适用于大型代码库迁移、跨多个文件和服务的完整功能构建以及跨多个存储库的更改。