Claude Opus 4.8: 에이전트 성능, 빠른 모드 가격, Opus 4.7에서 변경된 사항

Claude Opus 4.8은 Anthropic의 2026년 5월 28일 Opus 클래스 업그레이드입니다. Online-Mind2Web 브라우저 에이전트 정확도에서 84%를 기록하고, GPT-5.5 비용 동등성으로 Super-Agent 벤치마크의 모든 케이스를 완료한 첫 번째 모델이며, Opus 4.7의 도구 호출 장황성 회귀를 수정합니다. 빠른 모드는 2.5배 속도로 실행되며 이전 Opus 모델의 빠른 모드보다 3배 저렴합니다. 표준 API 가격은 4.7과 동일합니다. API 모델 식별자는 claude-opus-4-8-20260528입니다.

Claude Opus 4.8이란 무엇입니까?

Claude Opus 4.8은 2026년 5월 Anthropic의 Opus 모델 클래스 업그레이드로, 장시간 에이전트 작업, 다단계 추론, 자율 도구 사용에 최적화된 프론티어급 대규모 언어 모델입니다. Opus 4.7 대비 향상된 벤치마크 성능, 도구 호출 신뢰성 회귀 수정, 이전 Opus 모델 빠른 모드보다 3배 저렴한 빠른 모드(2.5배 속도의 확장 사고)를 특징으로 합니다.

OpenLegion의 견해: 에이전트 경제를 바꾸는 모델

Opus 4.8은 2026년 5월 이후 실질적인 에이전트 작업을 수행하는 모든 에이전트에 권장하는 모델입니다. 프로덕션 에이전트 플리트에 중요한 세 가지 변경 사항이 있습니다.

첫째: 도구 호출 신뢰성 수정. Scott Wu(Cognition / Devin CEO)는 Opus 4.7이 코멘트 장황성 및 도구 호출 불일치를 도입하여 Devin의 자율 엔지니어링 신뢰성을 저하시켰다고 공개적으로 확인했습니다. Opus 4.8은 둘 다 수정합니다. 타이트한 도구 사용 루프의 에이전트에게 이것은 빈번한 수정이 필요한 모델과 작업을 깔끔하게 완료하는 모델의 차이입니다.

둘째: Online-Mind2Web에서 84%(GPT-5.5 능가)와 GPT-5.5 비용 동등성에서의 Super-Agent 벤치마크 최초 완전 클리어. Online-Mind2Web은 실제 브라우저 기반 작업 완료를 측정합니다. Super-Agent 벤치마크는 번역, 심층 조사, 슬라이드 제작, 분석을 엔드투엔드로 포함했습니다. Opus 4.8은 모든 케이스를 완료했으며 GPT-5.5는 그렇지 않았습니다.

셋째: 3배 저렴한 빠른 모드. Databricks는 Genie 에이전트에서 Opus 4.7 대비 61% 저렴한 토큰 비용을 보고했습니다. 이전에 비용 때문에 Sonnet을 선택하고 낮은 품질을 수용했던 장시간 작업에서 Opus 4.8의 빠른 모드는 계산식을 바꿉니다.

Anthropic의 발표는 9,650억 달러 포스트머니 가치의 650억 달러 시리즈 H와 같은 날에 있었습니다.

OpenLegion은 전체 Anthropic API 모델 카탈로그를 지원합니다. claude-opus-4-8-20260528를 플리트 기본값으로 설정하는 것은 단일 구성 변경입니다. 볼트 격리 API 호출, 에이전트별 예산 한도, 컨테이너 격리 실행이 자동으로 적용됩니다. 예산 제어와 볼트 격리로 Opus 4.8을 실행하기 위해 AI 에이전트 플랫폼이 제공하는 것.

벤치마크 성능: 수치가 보여주는 것

Online-Mind2Web: 84% 브라우저 에이전트 정확도

Online-Mind2Web은 브라우저 기반 에이전트 작업 완료를 위한 벤치마크입니다. 양식 작성, 다중 페이지 흐름 탐색, 라이브 웹 인터페이스에서 정보 추출. Claude Opus 4.8은 2026년 5월 기준 Online-Mind2Web에서 84%를 기록하며 Claude Opus 4.7과 GPT-5.5를 모두 능가했습니다.

Super-Agent 벤치마크: GPT-5.5 비용 동등성에서의 최초 완전 클리어

공동 창업자 겸 CTO Kay Zhu는 Claude Opus 4.8이 번역 스케일, 심층 조사 합성, 원시 데이터에서 슬라이드 덱 구성, 다중 소스 분석을 포함하는 내부 Super-Agent 벤치마크의 모든 케이스를 엔드투엔드로 완료한 최초의 모델이라고 보고했습니다. GPT-5.5는 모든 케이스를 완료하지 못했습니다.

CursorBench: 모든 노력 수준에서 더 효율적인 도구 호출

Cursor의 내부 코딩 벤치마크는 코드 생성 품질과 도구 사용 효율성을 측정합니다. Claude Opus 4.8은 CursorBench의 모든 노력 수준에서 이전 Opus 모델을 능가합니다.

Legal Agent Benchmark: 10% 전체 통과 기준을 초과한 최초

Leya(법률 AI 플랫폼), 응용 연구 책임자 Niko Grupen 보고에 따르면, Claude Opus 4.8은 Legal Agent Benchmark의 전체 통과 기준에서 10%를 초과한 최초의 모델입니다. 전체 통과 기준은 다단계 법률 워크플로의 모든 단계가 정확해야 합니다.

Databricks Genie: Opus 4.7보다 61% 저렴

Databricks는 Genie 에이전트에서 Opus 4.7 대비 61% 저렴한 토큰 비용을 보고했습니다.

Opus 4.7에서 변경된 사항

도구 호출 수정: Devin과 자율 워크로드를 손상시킨 장황성 회귀

Claude Opus 4.7은 여러 프로덕션 팀이 독립적으로 발견한 도구 호출 동작의 회귀를 도입했습니다. 에이전트가 과도한 인라인 댓글을 생성하고, 불필요한 설명적 산문으로 출력을 감싸고, 때로는 중복 또는 불필요한 도구 호출을 했습니다.

Scott Wu(Cognition / Devin CEO)는 Opus 4.7이 Opus 4.8이 수정한 "코멘트 장황성 및 도구 호출 문제"를 가지고 있었다고 공개적으로 확인했습니다.

Claude Code의 동적 워크플로

Opus 4.8로 Claude Code에 동적 워크플로가 추가됩니다. 다단계 워크플로 구조를 생성, 시퀀싱, 관리하여 대규모 문제를 해결하는 능력. Claude Code는 대규모 코드베이스 마이그레이션을 계획하고, 하위 작업을 생성하고, 중간 상태를 추적하면서 순차적으로 실행하고, 각 단계의 결과에 따라 계획을 적응시킬 수 있습니다. 2026년 5월 28일부터 Opus 4.8을 사용하는 Claude Code에서 사용 가능합니다.

빠른 모드: 2.5배 속도, 3배 저렴

Claude Opus 4.8의 빠른 모드는 확장 사고를 사용하여 표준 Opus의 2.5배 속도로 실행되며, Opus 4.7을 포함한 이전 Opus 모델의 빠른 모드보다 3배 저렴합니다. 표준(빠른 모드 비활성) 가격은 Opus 4.7과 동일합니다.

빠른 모드는 API의 확장 사고 구성에서 budget_tokens 매개변수를 통해 활성화됩니다.

API 참조 및 가격

모델 식별자

Claude Opus 4.8의 API 모델 식별자는 claude-opus-4-8-20260528입니다. 모든 Anthropic API 호출의 model 매개변수, Amazon Bedrock 모델 ID 필드 또는 Google Cloud Vertex AI 모델 참조에서 이 문자열을 사용하세요.

가용성

Claude Opus 4.8은 세 가지 채널을 통해 사용 가능합니다: Anthropic API 직접(api.anthropic.com), Amazon Bedrock, Google Cloud Vertex AI. 세 채널 모두 확장 사고 및 빠른 모드를 포함한 동일한 기능 세트를 지원합니다.

컨텍스트 창

Claude Opus 4.8은 Opus 4.7과 동일한 컨텍스트 창(200K 토큰)과 동일한 표준 입출력 토큰 가격을 사용합니다. 비용 개선은 빠른 모드에 집중되어 있습니다.

Opus 4.8 vs Sonnet 4 vs Opus 4.7 사용 시기

Opus 4.8: 장시간 에이전트 작업, 브라우저 자동화, 대규모 코딩

작업 품질이 제약인 경우 Opus 4.8을 선택하세요. 타이트한 도구 사용 루프의 장시간 자율 에이전트는 도구 호출 신뢰성 수정의 혜택을 받습니다. 브라우저 자동화 에이전트(Online-Mind2Web: 84%)는 이 작업 유형에서 다른 모델을 능가합니다.

Anthropic API를 통해 Claude Opus 4.8에 접근하는 AI 에이전트 프레임워크의 경우, 마이그레이션 경로는 claude-opus-4-8-20260528로의 모델 식별자 교체입니다.

Sonnet 4: 고볼륨, 레이턴시 민감 파이프라인

볼륨과 레이턴시가 제약인 경우 Sonnet 4를 선택하세요. 토큰당 비용이 단위 경제를 결정하는 고빈도 API 호출, 레이턴시가 최종 사용자에게 보이는 실시간 응답 파이프라인.

Opus 4.7이 여전히 적용되는 경우

Opus 4.7에 머무르는 유일한 경우: 특정 장황성 패턴에 맞게 조정된 프롬프트. 파이프라인이 Opus 출력을 후처리하고 Opus 4.7이 생성한 코멘트 구조에 의존하는 경우, 적응할 시간이 생길 때까지 4.7에 머무르세요.

OpenLegion과 Claude Opus 4.8

OpenLegion은 claude-opus-4-8-20260528를 플리트 모델 옵션으로 지원합니다. 에이전트의 기본값으로 설정하는 것은 에이전트 구성의 단일 필드입니다:

model: anthropic/claude-opus-4-8-20260528

모든 OpenLegion 보안 제어가 Opus 4.8 호출에 자동으로 적용됩니다: 볼트 프록시 자격증명 주입(API 키가 에이전트 컨테이너에 진입하지 않음), 에이전트별 일간 및 월간 예산 한도, Docker 컨테이너 격리, 완전한 감사 로깅.

자세한 비교를 위해 그래프 기반 vs 플랫 플리트 아키텍처에서 Opus 4.8 배포 시 OpenLegion vs LangGraph와 공유 프로세스 vs 격리 컨테이너 멀티 에이전트 시스템에서의 Opus 4.8에 대한 OpenLegion vs AutoGen을 참조하세요.

OpenLegion에서 Claude Opus 4.8 시작하기

claude-opus-4-8-20260528를 플리트 기본값으로 설정하세요. 볼트 격리, 예산 상한, 프로덕션 준비 완료. 구축 시작 | 문서 읽기 | 플랫폼 보기

자주 묻는 질문

Claude Opus 4.8이란 무엇입니까?

Claude Opus 4.8은 2026년 5월 28일 발표된 Anthropic의 Opus 모델 클래스 업그레이드입니다. Claude Opus 4.7을 기반으로 향상된 에이전트 판단력, 코딩, 추론, 전문 지식 작업에서의 더 강한 벤치마크 성능, Opus 4.7 자율 워크로드에 영향을 미친 도구 호출 장황성 문제 수정이 추가되었습니다. 대규모 다단계 문제를 위해 Claude Code에 동적 워크플로를 도입하고, 이전 Opus 모델의 빠른 모드보다 3배 저렴한 2.5배 속도의 빠른 모드를 제공합니다.

Claude Opus 4.8은 GPT-5.5와 어떻게 비교됩니까?

에이전트 작업과 관련된 벤치마크에서 Claude Opus 4.8은 여러 독립적인 평가에서 GPT-5.5를 능가하거나 동등합니다. Online-Mind2Web에서 Opus 4.8은 84%를 기록하며 GPT-5.5를 능가했습니다. 내부 Super-Agent 벤치마크에서 Opus 4.8은 비용 동등성으로 모든 케이스를 엔드투엔드로 완료한 최초의 모델이었습니다. Legal Agent Benchmark에서 Opus 4.8은 전체 통과 기준에서 10%를 초과한 최초입니다.

Claude Opus 4.8 빠른 모드는 Opus 4.7 대비 얼마나 저렴합니까?

Claude Opus 4.8의 빠른 모드는 확장 사고를 사용하여 정상 속도의 2.5배로 실행되며 Opus 4.7을 포함한 이전 Opus 모델의 빠른 모드보다 3배 저렴합니다. 표준 Opus 4.8 가격(빠른 모드 비활성)은 Opus 4.7과 동일합니다. Databricks는 Genie 에이전트에서 Opus 4.7 대비 61% 저렴한 토큰 비용을 보고했습니다.

Opus 4.7의 도구 호출 문제란 Opus 4.8이 수정하는 무엇입니까?

Claude Opus 4.7은 자율 엔지니어링 워크로드의 신뢰성을 감소시킨 코멘트 장황성 및 도구 호출 불일치를 도입했습니다. Cognition(자율 코딩 에이전트 Devin 제조사)은 CEO Scott Wu를 통해 Opus 4.7이 Opus 4.6보다 일관성이 낮았으며 Opus 4.8이 코멘트 장황성 회귀와 도구 호출 불일치 모두를 수정한다고 보고했습니다.

Claude Opus 4.8 API 모델 식별자는 무엇입니까?

Claude Opus 4.8의 API 모델 식별자는 claude-opus-4-8-20260528입니다. Anthropic API 직접, Amazon Bedrock, Google Cloud Vertex AI를 통해 사용 가능합니다. 빠른 모드(2.5배 속도의 확장 사고)는 확장 사고 구성의 budget_tokens 매개변수를 통해 활성화됩니다. 표준 가격은 Opus 4.7과 동일하며 빠른 모드 가격은 이전 Opus 모델의 빠른 모드보다 3배 낮습니다.

Opus 4.8을 사용한 Claude Code의 동적 워크플로란 무엇입니까?

동적 워크플로는 Opus 4.8과 함께 출시된 Claude Code의 기능으로, 다단계 워크플로 구조를 동적으로 생성, 시퀀싱, 관리하여 대규모 문제를 해결할 수 있게 합니다. Claude Code는 대규모 리팩토링 또는 마이그레이션을 계획하고, 하위 작업을 생성하고, 상태를 추적하면서 순차적으로 실행하고, 중간 결과에 따라 적응할 수 있습니다. 이를 통해 Claude Code가 대규모 코드베이스 마이그레이션, 여러 파일 및 서비스에 걸친 전체 기능 빌드, 다중 저장소 변경에 실용적으로 사용될 수 있습니다.