Обзор возможностей и эффективности Claude Sonnet 5
N@neurohive3 мин
Claude Sonnet 5: сильный агентный апгрейд, но не очевидная замена Opus
Anthropic представила Claude Sonnet 5 — новую модель из линейки Claude, доступную в том числе пользователям бесплатного тарифа. Она ориентирована на агентные задачи, программирование, работу с инструментами и корпоративную автоматизацию. По данным Artificial Analysis, Sonnet 5 набрала 53 балла в Intelligence Index и стала моделью №5 в рейтинге по общему интеллекту модели. Она отстает от GPT-5.5 и Claude Opus 4.8 всего на 2–3 балла, от Fable — на 7 баллов, а по сравнению с Sonnet 4.6 прибавила 6 баллов на максимальном уровне рассуждений.
В кодинге прирост тоже заметен. Cursor сообщил, что на CursorBench — тесте реальных многофайловых задач из Cursor — Sonnet 5 набрала 57% против 49% у Sonnet 4.6.
Но главный нюанс — стоимость. В тестах Artificial Analysis одна задача на Sonnet 5 при стандартной цене API стоила примерно в 2 раза дороже Sonnet 4.6 и на 15% дороже Opus 4.8. Причина — повышенный расход: Sonnet 5 генерировала на 40% больше выходных токенов и делала примерно в 3 раза больше агентных шагов на выполнение рабочих задач: поиск информации, анализ документов и подготовку решений.
На стоимость влияет и новый токенизатор. Simon Willison проверил одни и те же тексты и получил рост числа токенов на входе: английский текст стал тратить примерно в 1.4 раза больше токенов, испанский — в 1.33 раза, Python-код — в 1.28 раза. Для упрощенного китайского текста разницы почти не было.
CodeRabbit тоже дает смешанную оценку. Для ревью кода Sonnet 5 стала точнее: precision вырос с 29% у Sonnet 4.6 до 38–40%. Но по нахождению багов результат хуже: Sonnet 5 нашла около 51% багов, а Sonnet 4.6 — около 63%. Усиление глубины рассуждений почти не улучшало результат, а стоимость при этом почти удвоилась.
Вывод: Claude Sonnet 5 стала сильнее Sonnet 4.6 в кодинге и агентных задачах, но это не делает ее новой флагманской моделью Anthropic. Opus 4.8 по-прежнему сильнее в сложных задачах на глубокие рассуждения, а Sonnet 5 обходит его только в двух бенчмарках из десятков. Зато Sonnet 5 доступна пользователям бесплатного тарифа Claude.
#AInews