Claude Opus 4.8: агентная производительность, тарифы быстрого режима и что изменилось по сравнению с Opus 4.7

Claude Opus 4.8 — обновление класса Opus от Anthropic, выпущенное 28 мая 2026 года. Достигает 84% точности агента-браузера на Online-Mind2Web, является первой моделью, завершившей все кейсы Super-Agent при паритете стоимости с GPT-5.5, и исправляет регрессию многословности вызовов инструментов в Opus 4.7. Быстрый режим работает на скорости 2,5x и тарифицируется в 3 раза дешевле быстрого режима предыдущих моделей Opus. Стандартные тарифы API не изменились по сравнению с 4.7. Идентификатор модели API: claude-opus-4-8-20260528.

Что такое Claude Opus 4.8?

Claude Opus 4.8 — обновление Anthropic класса моделей Opus за май 2026 года: фронтирная большая языковая модель, оптимизированная для длительных агентных задач, многоэтапных рассуждений и автономного использования инструментов. Обладает улучшенной производительностью в тестах по сравнению с Opus 4.7, исправлениями регрессий надёжности вызовов инструментов и быстрым режимом (расширенное мышление на скорости 2,5x) в 3 раза дешевле быстрого режима предыдущих моделей Opus.

Мнение OpenLegion: модель, меняющая экономику агентов

Opus 4.8 — модель, которую мы рекомендуем для любого агента, выполняющего существенную агентную работу начиная с мая 2026 года. Три вещи изменились по сравнению с Opus 4.7, которые важны для производственных флотов агентов.

Во-первых: исправление надёжности вызовов инструментов. Скотт Ву (CEO Cognition / Devin) публично подтвердил, что Opus 4.7 привнёс несоответствия в многословности комментариев и вызовах инструментов, снизившие надёжность автономной инженерии Devin. Opus 4.8 исправляет оба недостатка. Для агентов в жёстких циклах использования инструментов это разница между моделью, требующей частых исправлений, и той, что выполняет задачи чисто.

Во-вторых: 84% на Online-Mind2Web (превзойдя GPT-5.5) и первое полное прохождение Super-Agent при паритете стоимости с GPT-5.5. Online-Mind2Web измеряет реальное выполнение браузерных задач. Super-Agent охватывал перевод, глубокие исследования, создание слайдов и сквозной анализ. Opus 4.8 завершил каждый кейс; GPT-5.5 — нет.

В-третьих: быстрый режим в 3 раза дешевле. Databricks сообщила о снижении стоимости токенов на 61% по сравнению с Opus 4.7 на агенте Genie. Для длительных задач, где раньше выбирали Sonnet из-за стоимости в ущерб качеству, быстрый режим Opus 4.8 меняет расчёт.

Объявление Anthropic вышло в тот же день, что и раунд Series H на 65 млрд долларов при оценке после инвестиций в 965 млрд долларов.

OpenLegion поддерживает полный каталог моделей Anthropic API. Установить claude-opus-4-8-20260528 как флотовый стандарт — это одно изменение конфигурации. Вызовы API с изоляцией в хранилище, бюджетные ограничения для каждого агента и выполнение в изолированных контейнерах применяются автоматически. Что обеспечивает платформа агентов ИИ для запуска Opus 4.8 с бюджетным контролем и изоляцией хранилища.

Производительность в тестах: что показывают цифры

Online-Mind2Web: 84% точности агента-браузера

Online-Mind2Web — тест на выполнение агентных задач через браузер: заполнение форм, навигация по многостраничным потокам, извлечение информации из живых веб-интерфейсов. Claude Opus 4.8 набрал 84% на Online-Mind2Web по состоянию на май 2026 года, превзойдя Claude Opus 4.7 и GPT-5.5.

Super-Agent: первое полное прохождение при паритете стоимости с GPT-5.5

Соучредитель и технический директор Кей Чжу сообщил, что Claude Opus 4.8 — первая модель, завершившая каждый кейс внутреннего Super-Agent сквозным образом, охватывая: крупномасштабный перевод, синтез глубоких исследований, построение презентаций из сырых данных и многоисточниковый анализ. GPT-5.5 не завершил каждый кейс.

CursorBench: более эффективные вызовы инструментов на каждом уровне усилий

Внутренний тест Cursor на программирование измеряет качество генерации кода и эффективность использования инструментов. Claude Opus 4.8 превосходит предыдущие модели Opus на каждом уровне усилий в CursorBench.

Legal Agent Benchmark: первая модель, преодолевшая порог all-pass в 10%

Leya (платформа юридического ИИ), по информации Нико Групена (руководителя прикладных исследований), подтвердила, что Claude Opus 4.8 — первая модель, преодолевшая 10% по стандарту all-pass в Legal Agent Benchmark.

Databricks Genie: на 61% дешевле Opus 4.7

Databricks сообщила, что Claude Opus 4.8 обеспечивает стоимость токенов на 61% ниже по сравнению с Opus 4.7 для агента Genie.

Что изменилось по сравнению с Opus 4.7

Исправление вызовов инструментов: регрессия многословности, навредившая Devin и автономным нагрузкам

Claude Opus 4.7 привнёс регрессию поведения вызовов инструментов, замеченную несколькими производственными командами независимо: агенты генерировали избыточные встроенные комментарии, оборачивали вывод ненужной объяснительной прозой и иногда делали дублирующие вызовы инструментов.

Скотт Ву (CEO Cognition / Devin) публично подтвердил, что Opus 4.7 имел «проблемы с многословностью комментариев и вызовами инструментов», которые Opus 4.8 исправляет.

Динамические рабочие процессы в Claude Code

Opus 4.8 добавляет Claude Code динамические рабочие процессы: возможность решать крупномасштабные задачи, создавая, упорядочивая и управляя многоэтапными структурами рабочих процессов. Claude Code может планировать крупную миграцию кодовой базы, создавать подзадачи, выполнять их последовательно, отслеживая промежуточное состояние, и адаптировать план по результатам каждого шага.

Быстрый режим: скорость 2,5x при стоимости в 3 раза ниже

Быстрый режим Claude Opus 4.8 работает на скорости 2,5x от стандартного Opus с использованием расширенного мышления и тарифицируется в 3 раза дешевле быстрого режима предыдущих моделей Opus, включая Opus 4.7. Быстрый режим активируется через параметр budget_tokens в конфигурации расширенного мышления API.

Справочник по API и тарифам

Идентификатор модели API для Claude Opus 4.8: claude-opus-4-8-20260528. Используйте эту строку в параметре model любого вызова Anthropic API, поле идентификатора модели Amazon Bedrock или ссылке на модель Google Cloud Vertex AI. Доступен через три канала: напрямую через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI.

Когда использовать Opus 4.8 вместо Sonnet 4 и Opus 4.7

Выбирайте Opus 4.8, когда качество задачи является ограничивающим фактором. Агенты-браузеры (Online-Mind2Web: 84%) превосходят любую другую модель для этого типа задач.

Для фреймворков агентов ИИ, обращающихся к Claude Opus 4.8 через Anthropic API, путь миграции — замена идентификатора модели на claude-opus-4-8-20260528.

Выбирайте Sonnet 4, когда объём и задержка являются ограничивающими факторами.

Единственный случай для сохранения Opus 4.7: промпты, специально настроенные под его паттерны многословности. Если ваш конвейер постобрабатывает вывод Opus и опирается на структуру комментариев, которую генерировал Opus 4.7, оставайтесь на 4.7, пока не будет времени для адаптации.

OpenLegion и Claude Opus 4.8

OpenLegion поддерживает claude-opus-4-8-20260528 как флотовую опцию модели:

model: anthropic/claude-opus-4-8-20260528

Все средства контроля безопасности OpenLegion автоматически применяются к вызовам Opus 4.8. Для сравнений с несколькими агентами смотрите OpenLegion vs LangGraph при развёртывании Opus 4.8 в архитектуре флота на основе графа и плоской и OpenLegion vs AutoGen с Opus 4.8 в многоагентных системах с общим процессом и изолированным контейнером.

Начните работу с Claude Opus 4.8 на OpenLegion

Установите claude-opus-4-8-20260528 как флотовый стандарт. Изоляция хранилища, бюджетный лимит, готовность к продакшену. Начать разработку | Читать документацию | Посмотреть платформу

Часто задаваемые вопросы

Что такое Claude Opus 4.8?

Claude Opus 4.8 — обновление Anthropic класса моделей Opus, анонсированное 28 мая 2026 года. Основывается на Claude Opus 4.7 с улучшенным агентным суждением, более высокой производительностью в тестах кодирования, рассуждений и профессиональной работы со знаниями, а также исправлениями проблем многословности вызовов инструментов, влиявших на автономные нагрузки Opus 4.7.

Как Claude Opus 4.8 сравнивается с GPT-5.5?

По тестам, релевантным для агентных задач, Claude Opus 4.8 превосходит или сравнивается с GPT-5.5 в нескольких независимых оценках. На Online-Mind2Web Opus 4.8 набрал 84%, превзойдя GPT-5.5. На внутреннем Super-Agent Opus 4.8 был первым, завершившим каждый кейс, победив GPT-5.5 при паритете стоимости. На Legal Agent Benchmark Opus 4.8 первым преодолел 10% по стандарту all-pass.

Насколько дешевле быстрый режим Claude Opus 4.8 по сравнению с Opus 4.7?

Быстрый режим Claude Opus 4.8 работает на скорости 2,5x от обычной с использованием расширенного мышления и тарифицируется в 3 раза дешевле быстрого режима предыдущих моделей Opus, включая Opus 4.7. Databricks сообщила о снижении стоимости токенов на 61% по сравнению с Opus 4.7 для агента Genie.

Какие проблемы вызовов инструментов Opus 4.7 исправляет Opus 4.8?

Claude Opus 4.7 привнёс несоответствия в многословности комментариев и вызовах инструментов, снизившие надёжность для автономных инженерных нагрузок. Cognition (создатели автономного агента кодирования Devin) через CEO Скотта Ву сообщили, что Opus 4.7 был менее последовательным, чем Opus 4.6, и что Opus 4.8 исправляет как регрессию многословности комментариев, так и несоответствия вызовов инструментов.

Каков идентификатор модели API Claude Opus 4.8?

Идентификатор модели API для Claude Opus 4.8: claude-opus-4-8-20260528. Доступен через Anthropic API напрямую, Amazon Bedrock и Google Cloud Vertex AI. Быстрый режим активируется через параметр budget_tokens в конфигурации расширенного мышления. Стандартные тарифы идентичны Opus 4.7; тарифы быстрого режима в 3 раза ниже предыдущих.

Что такое динамические рабочие процессы в Claude Code с Opus 4.8?

Динамические рабочие процессы — функция Claude Code, запущенная вместе с Opus 4.8, позволяющая решать крупномасштабные задачи путём динамического создания, упорядочивания и управления многоэтапными структурами рабочих процессов. Claude Code может планировать крупный рефакторинг, создавать подзадачи, выполнять их последовательно, отслеживая состояние, и адаптироваться по промежуточным результатам.