Claude Opus 4.8: агентная производительность, тарифы быстрого режима и что изменилось по сравнению с Opus 4.7
Claude Opus 4.8 — обновление класса Opus от Anthropic, выпущенное 28 мая 2026 года. Достигает 84% точности агента-браузера на Online-Mind2Web, является первой моделью, завершившей все кейсы Super-Agent при паритете стоимости с GPT-5.5, и исправляет регрессию многословности вызовов инструментов в Opus 4.7. Быстрый режим работает на скорости 2,5x и тарифицируется в 3 раза дешевле быстрого режима предыдущих моделей Opus. Стандартные тарифы API не изменились по сравнению с 4.7. Идентификатор модели API: claude-opus-4-8-20260528.
Что такое Claude Opus 4.8?
Claude Opus 4.8 — обновление Anthropic класса моделей Opus за май 2026 года: фронтирная большая языковая модель, оптимизированная для длительных агентных задач, многоэтапных рассуждений и автономного использования инструментов. Обладает улучшенной производительностью в тестах по сравнению с Opus 4.7, исправлениями регрессий надёжности вызовов инструментов и быстрым режимом (расширенное мышление на скорости 2,5x) в 3 раза дешевле быстрого режима предыдущих моделей Opus.
Мнение OpenLegion: модель, меняющая экономику агентов
Opus 4.8 — модель, которую мы рекомендуем для любого агента, выполняющего существенную агентную работу начиная с мая 2026 года. Три вещи изменились по сравнению с Opus 4.7, которые важны для производственных флотов агентов.
Во-первых: исправление надёжности вызовов инструментов. Скотт Ву (CEO Cognition / Devin) публично подтвердил, что Opus 4.7 привнёс несоответствия в многословности комментариев и вызовах инструментов, снизившие надёжность автономной инженерии Devin. Opus 4.8 исправляет оба недостатка. Для агентов в жёстких циклах использования инструментов это разница между моделью, требующей частых исправлений, и той, что выполняет задачи чисто.
Во-вторых: 84% на Online-Mind2Web (превзойдя GPT-5.5) и первое полное прохождение Super-Agent при паритете стоимости с GPT-5.5. Online-Mind2Web измеряет реальное выполнение браузерных задач. Super-Agent охватывал перевод, глубокие исследования, создание слайдов и сквозной анализ. Opus 4.8 завершил каждый кейс; GPT-5.5 — нет.
В-третьих: быстрый режим в 3 раза дешевле. Databricks сообщила о снижении стоимости токенов на 61% по сравнению с Opus 4.7 на агенте Genie. Для длительных задач, где раньше выбирали Sonnet из-за стоимости в ущерб качеству, быстрый режим Opus 4.8 меняет расчёт.
Объявление Anthropic вышло в тот же день, что и раунд Series H на 65 млрд долларов при оценке после инвестиций в 965 млрд долларов.
OpenLegion поддерживает полный каталог моделей Anthropic API. Установить claude-opus-4-8-20260528 как флотовый стандарт — это одно изменение конфигурации. Вызовы API с изоляцией в хранилище, бюджетные ограничения для каждого агента и выполнение в изолированных контейнерах применяются автоматически. Что обеспечивает платформа агентов ИИ для запуска Opus 4.8 с бюджетным контролем и изоляцией хранилища.
Производительность в тестах: что показывают цифры
Online-Mind2Web: 84% точности агента-браузера
Online-Mind2Web — тест на выполнение агентных задач через браузер: заполнение форм, навигация по многостраничным потокам, извлечение информации из живых веб-интерфейсов. Claude Opus 4.8 набрал 84% на Online-Mind2Web по состоянию на май 2026 года, превзойдя Claude Opus 4.7 и GPT-5.5.
Super-Agent: первое полное прохождение при паритете стоимости с GPT-5.5
Соучредитель и технический директор Кей Чжу сообщил, что Claude Opus 4.8 — первая модель, завершившая каждый кейс внутреннего Super-Agent сквозным образом, охватывая: крупномасштабный перевод, синтез глубоких исследований, построение презентаций из сырых данных и многоисточниковый анализ. GPT-5.5 не завершил каждый кейс.
CursorBench: более эффективные вызовы инструментов на каждом уровне усилий
Внутренний тест Cursor на программирование измеряет качество генерации кода и эффективность использования инструментов. Claude Opus 4.8 превосходит предыдущие модели Opus на каждом уровне усилий в CursorBench.
Legal Agent Benchmark: первая модель, преодолевшая порог all-pass в 10%
Leya (платформа юридического ИИ), по информации Нико Групена (руководителя прикладных исследований), подтвердила, что Claude Opus 4.8 — первая модель, преодолевшая 10% по стандарту all-pass в Legal Agent Benchmark.
Databricks Genie: на 61% дешевле Opus 4.7
Databricks сообщила, что Claude Opus 4.8 обеспечивает стоимость токенов на 61% ниже по сравнению с Opus 4.7 для агента Genie.
Что изменилось по сравнению с Opus 4.7
Исправление вызовов инструментов: регрессия многословности, навредившая Devin и автономным нагрузкам
Claude Opus 4.7 привнёс регрессию поведения вызовов инструментов, замеченную несколькими производственными командами независимо: агенты генерировали избыточные встроенные комментарии, оборачивали вывод ненужной объяснительной прозой и иногда делали дублирующие вызовы инструментов.
Скотт Ву (CEO Cognition / Devin) публично подтвердил, что Opus 4.7 имел «проблемы с многословностью комментариев и вызовами инструментов», которые Opus 4.8 исправляет.
Динамические рабочие процессы в Claude Code
Opus 4.8 добавляет Claude Code динамические рабочие процессы: возможность решать крупномасштабные задачи, создавая, упорядочивая и управляя многоэтапными структурами рабочих процессов. Claude Code может планировать крупную миграцию кодовой базы, создавать подзадачи, выполнять их последовательно, отслеживая промежуточное состояние, и адаптировать план по результатам каждого шага.
Быстрый режим: скорость 2,5x при стоимости в 3 раза ниже
Быстрый режим Claude Opus 4.8 работает на скорости 2,5x от стандартного Opus с использованием расширенного мышления и тарифицируется в 3 раза дешевле быстрого режима предыдущих моделей Opus, включая Opus 4.7. Быстрый режим активируется через параметр budget_tokens в конфигурации расширенного мышления API.
Справочник по API и тарифам
Идентификатор модели API для Claude Opus 4.8: claude-opus-4-8-20260528. Используйте эту строку в параметре model любого вызова Anthropic API, поле идентификатора модели Amazon Bedrock или ссылке на модель Google Cloud Vertex AI. Доступен через три канала: напрямую через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI.
Когда использовать Opus 4.8 вместо Sonnet 4 и Opus 4.7
Выбирайте Opus 4.8, когда качество задачи является ограничивающим фактором. Агенты-браузеры (Online-Mind2Web: 84%) превосходят любую другую модель для этого типа задач.
Для фреймворков агентов ИИ, обращающихся к Claude Opus 4.8 через Anthropic API, путь миграции — замена идентификатора модели на claude-opus-4-8-20260528.
Выбирайте Sonnet 4, когда объём и задержка являются ограничивающими факторами.
Единственный случай для сохранения Opus 4.7: промпты, специально настроенные под его паттерны многословности. Если ваш конвейер постобрабатывает вывод Opus и опирается на структуру комментариев, которую генерировал Opus 4.7, оставайтесь на 4.7, пока не будет времени для адаптации.
OpenLegion и Claude Opus 4.8
OpenLegion поддерживает claude-opus-4-8-20260528 как флотовую опцию модели:
model: anthropic/claude-opus-4-8-20260528
Все средства контроля безопасности OpenLegion автоматически применяются к вызовам Opus 4.8. Для сравнений с несколькими агентами смотрите OpenLegion vs LangGraph при развёртывании Opus 4.8 в архитектуре флота на основе графа и плоской и OpenLegion vs AutoGen с Opus 4.8 в многоагентных системах с общим процессом и изолированным контейнером.
Начните работу с Claude Opus 4.8 на OpenLegion
Установите claude-opus-4-8-20260528 как флотовый стандарт. Изоляция хранилища, бюджетный лимит, готовность к продакшену.
Начать разработку | Читать документацию | Посмотреть платформу
Часто задаваемые вопросы
Что такое Claude Opus 4.8?
Claude Opus 4.8 — обновление Anthropic класса моделей Opus, анонсированное 28 мая 2026 года. Основывается на Claude Opus 4.7 с улучшенным агентным суждением, более высокой производительностью в тестах кодирования, рассуждений и профессиональной работы со знаниями, а также исправлениями проблем многословности вызовов инструментов, влиявших на автономные нагрузки Opus 4.7.
Как Claude Opus 4.8 сравнивается с GPT-5.5?
По тестам, релевантным для агентных задач, Claude Opus 4.8 превосходит или сравнивается с GPT-5.5 в нескольких независимых оценках. На Online-Mind2Web Opus 4.8 набрал 84%, превзойдя GPT-5.5. На внутреннем Super-Agent Opus 4.8 был первым, завершившим каждый кейс, победив GPT-5.5 при паритете стоимости. На Legal Agent Benchmark Opus 4.8 первым преодолел 10% по стандарту all-pass.
Насколько дешевле быстрый режим Claude Opus 4.8 по сравнению с Opus 4.7?
Быстрый режим Claude Opus 4.8 работает на скорости 2,5x от обычной с использованием расширенного мышления и тарифицируется в 3 раза дешевле быстрого режима предыдущих моделей Opus, включая Opus 4.7. Databricks сообщила о снижении стоимости токенов на 61% по сравнению с Opus 4.7 для агента Genie.
Какие проблемы вызовов инструментов Opus 4.7 исправляет Opus 4.8?
Claude Opus 4.7 привнёс несоответствия в многословности комментариев и вызовах инструментов, снизившие надёжность для автономных инженерных нагрузок. Cognition (создатели автономного агента кодирования Devin) через CEO Скотта Ву сообщили, что Opus 4.7 был менее последовательным, чем Opus 4.6, и что Opus 4.8 исправляет как регрессию многословности комментариев, так и несоответствия вызовов инструментов.
Каков идентификатор модели API Claude Opus 4.8?
Идентификатор модели API для Claude Opus 4.8: claude-opus-4-8-20260528. Доступен через Anthropic API напрямую, Amazon Bedrock и Google Cloud Vertex AI. Быстрый режим активируется через параметр budget_tokens в конфигурации расширенного мышления. Стандартные тарифы идентичны Opus 4.7; тарифы быстрого режима в 3 раза ниже предыдущих.
Что такое динамические рабочие процессы в Claude Code с Opus 4.8?
Динамические рабочие процессы — функция Claude Code, запущенная вместе с Opus 4.8, позволяющая решать крупномасштабные задачи путём динамического создания, упорядочивания и управления многоэтапными структурами рабочих процессов. Claude Code может планировать крупный рефакторинг, создавать подзадачи, выполнять их последовательно, отслеживая состояние, и адаптироваться по промежуточным результатам.