한눈에 보기
결론부터 — Fable 5는 "더 크고 더 똑똑하지만 2배 비싼" 프런티어 모델, Opus 4.8은 여전히 합리적인 프로덕션 기본값.
Fable 5
프런티어 · 장기 복잡 작업
- 작업이 길고 복잡할수록 격차가 벌어짐
- 코딩·멀티모달·에이전트 전 영역 최상위
- 며칠치 작업을 하루에 — 장기 자율 수행
- 고위험 주제는 Opus 4.8으로 자동 폴백
가격 $10 / $50 per M 토큰 (입력/출력)
Opus 4.8
검증된 프로덕션 기본값
- 짧고 잘 정의된 작업에선 거의 동급
- 비용 절반 — 트래픽 대량 처리에 유리
- 안정성·예측 가능성 입증됨
- Fable 폴백 시 응답 주체이기도 함
가격 $5 / $25 per M 토큰 (Fable의 절반)
벤치마크 격차
짧은 과제에선 박빙, 길고 복잡한 과제에서 Fable 5가 크게 앞섭니다.
SWE-bench Verified 실제 GitHub 이슈 해결
Fable +6.4pt
SWE-bench Pro 고난도 엔지니어링
Fable +11pt
멀티모달 · Grounded 다이어그램/차트/PDF 이해
Fable +16.3pt
코딩 평균 다중 코딩 평가 종합
Fable +9.2pt
에이전트 작업 도구 사용·장기 실행
Fable +5.1pt
지식 작업 knowledge work
Fable +4.7pt
잠정 종합 점수(provisional overall): Fable 5 96 vs Opus 4.8 94 — 종합 격차는 작아 보여도, 과제 길이가 길수록 실질 격차가 커집니다.
핵심 차이 정리
| 항목 | Fable 5 | Opus 4.8 |
|---|---|---|
| 포지션 | 최초 공개 Mythos급 프런티어 | 검증된 주력 프로덕션 모델 |
| 강점 구간 | 길고 복잡한 장기 작업 | 짧고 잘 정의된 작업 |
| 가격 (입/출력 per M) | $10 / $50 | $5 / $25 (절반) |
| SWE-bench Pro | 80.3% | 69.2% |
| 멀티모달 | 92.4 (비전만으로 복잡 과제 완수) | 76.1 |
| 안전장치 | 사이버·생화학·증류 3분류기 → 고위험 시 Opus로 폴백 | 자체 표준 정책 |
| 폴백 빈도 | 전체 세션의 5% 미만에서만 발동 | 해당 없음 |
| 대표 사례 | Stripe: 2개월 분량 마이그레이션을 1일로 | 대량 트래픽 안정 처리 |
커뮤니티 반응
Simon Willison(개발자·평론가) — 약 5.5시간 실사용 리뷰.
"제시한 모든 작업을 해냈다. 오히려 이 모델이 못 하는 작업을 찾는 게 도전 과제일 정도다."
"Datasette Agent 기능 추가에서 며칠치 작업처럼 느껴지는 결과를 하루 만에 냈고, 기저 LLM 라이브러리의 문제 4건까지 스스로 찾아 고쳤다."
"내 오픈소스 프로젝트를 구체적 날짜와 함께 수십 개 나열했다 — 이런 지식의 깊이는 모델 규모를 가늠하는 합리적 지표다. (Opus는 '부정확할 수 있다'며 신중했던 부분)"
— Simon Willison, "Initial impressions of Claude Fable 5" (2026.06.09)안전장치 — Fable의 새로운 점
Fable 5는 Mythos급 능력을 일반 공개하면서 3종 분류기 기반 가드레일을 탑재했습니다. 사이버보안 · 생물/화학 · 모델 증류(distillation) 관련 고위험 쿼리는 Fable이 직접 답하지 않고 Opus 4.8로 자동 폴백합니다. Anthropic에 따르면 전체 Fable 세션의 95% 이상은 폴백 없이 진행됩니다. "AI가 너무 위험해지고 있다"는 경고 며칠 뒤 공개된 모델이라는 점에서, 능력 공개와 위험 통제를 동시에 노린 설계입니다.
언제 무엇을 쓸까
Fable 5를 선택
- 대규모 코드베이스 마이그레이션·리팩터링
- 장시간 개입 없이 도는 에이전트 워크플로
- 차트·PDF·다이어그램 등 멀티모달 분석
- 과학·금융·법률 등 심층 지식 작업
Opus 4.8을 선택
- 짧고 명확한 작업 (체감 차이 미미)
- 비용 민감한 대량 프로덕션 트래픽
- 예측 가능성·안정성이 최우선일 때
- 지연/비용 예산이 빠듯한 실시간 경로