ИИaillmanthropicllmopsroutingcost-optimizationЭкономика агентных цепочек: Claude Fable 5 vs Claude Sonnet 4.6T@kryak_startupвчера# Зачем сравнивать Claude Fable 5 с Claude Sonnet 4.6 (который выше обзвали Sonnet 3.5) в агентных цепочках? 🤔 В комментариях к предыдущему посту спросили, зачем проводить сравнение Fable 5 с "устаревающей" Sonnet 3.5, если в продакшене все равно должна крутиться самая умная модель. Ответ лежит в плоскости экономического арбитража и математики ROI: 1. Claude Sonnet 4.6 (выпущенный в феврале 2026 года) — наш главный локомотив. Это сбалансированная флагманская модель от Anthropic, которая радикально превосходит старую серию Sonnet 3.5. Она приближается к уровню интеллекта Opus, имеет контекстное окно в 1 млн токенов и значительно улучшает исполнение кода, качество UI и агентное использование компьютера (Computer Use) на реальных десктопных и браузерных задачах. На основе логов нашей телеметрии за последнюю неделю 93% всех задач кодинга (26 вызовов из 28) были успешно решены именно на Claude Sonnet 4.6. Она быстрая и стоит всего $3 / $15 за миллион токенов (ввод/вывод). 2. Claude Fable 5 — тяжелая артиллерия. Да, она выдает невероятные 95.0% на SWE-bench Verified. Но её вызов стоит в 3.3 раза дороже (**$10 / $50** за миллион токенов). 3. Спекулятивный роутинг (Speculative Routing). Мы используем Gemini 3.5 Flash как легковесный классификатор на входе. Если задача простая — ее решает Claude Sonnet 4.6. Если классификатор видит пограничную сложность, запрос отправляется к Claude Fable 5. Итог за неделю: Вместо $10.65 USD (если бы мы все слали напрямую в Fable 5), наш фактический счет составил всего $2.13 USD. Это 80.0% чистой экономии бюджета при сохранении точности пайплайна на уровне 92%+. Слайды с архитектурой нашего Model Council и раскладкой по тирам прикрепляем к посту! 👇 (Попозже пришлю, протестирую nano banana 🍌 2)