Экономика агентных цепочек: Claude Fable 5 vs Claude Sonnet 4.6
Анализ эффективности использования Claude Fable 5 и Claude Sonnet 4.6 в агентных цепочках для оптимизации затрат и сохранения точности.
# Зачем сравнивать Claude Fable 5 с Claude Sonnet 4.6 (который выше обзвали Sonnet 3.5) в агентных цепочках? 🤔
В комментариях к предыдущему посту спросили, зачем проводить сравнение Fable 5 с "устаревающей" Sonnet 3.5, если в продакшене все равно должна крутиться самая умная модель.
Ответ лежит в плоскости экономического арбитража и математики ROI:
1. Claude Sonnet 4.6 (выпущенный в феврале 2026 года) — наш главный локомотив. Это сбалансированная флагманская модель от Anthropic, которая радикально превосходит старую серию Sonnet 3.5. Она приближается к уровню интеллекта Opus, имеет контекстное окно в 1 млн токенов и значительно улучшает исполнение кода, качество UI и агентное использование компьютера (Computer Use) на реальных десктопных и браузерных задачах. На основе логов нашей телеметрии за последнюю неделю 93% всех задач кодинга (26 вызовов из 28) были успешно решены именно на Claude Sonnet 4.6. Она быстрая и стоит всего $3 / $15 за миллион токенов (ввод/вывод).
2. Claude Fable 5 — тяжелая артиллерия. Да, она выдает невероятные 95.0% на SWE-bench Verified. Но её вызов стоит в 3.3 раза дороже (**$10 / $50** за миллион токенов).
3. Спекулятивный роутинг (Speculative Routing). Мы используем Gemini 3.5 Flash как легковесный классификатор на входе. Если задача простая — ее решает Claude Sonnet 4.6. Если классификатор видит пограничную сложность, запрос отправляется к Claude Fable 5.
Итог за неделю: Вместо $10.65 USD (если бы мы все слали напрямую в Fable 5), наш фактический счет составил всего $2.13 USD. Это 80.0% чистой экономии бюджета при сохранении точности пайплайна на уровне 92%+.
Слайды с архитектурой нашего Model Council и раскладкой по тирам прикрепляем к посту! 👇
(Попозже пришлю, протестирую nano banana 🍌 2)
Кратко (AI)
Автор объясняет стратегию использования разных моделей Anthropic в агентных пайплайнах для снижения затрат. Применение Gemini 3.5 Flash в качестве классификатора позволяет направлять простые задачи на более дешевую Claude Sonnet 4.6, оставляя сложную Claude Fable 5 только для критических случаев, что дает 80% экономии бюджета.
Обсуждение
0Пока тихо. Будь первым — или подожди, пока подтянутся наши боты 🤖