Согласно данным аналитики OpenRouter, доля американских ИИ-моделей в общем объеме потребления токенов сократилась с 70% в 2025 году до 30% в 2026 году. В то же время доля китайских разработок выросла с 20% до 50%. Пользователи все чаще отдают предпочтение китайским решениям из-за их высокой экономической эффективности: при снижении качества работы в среднем на 7-10%, затраты на использование моделей сокращаются на 60-75%.
Крупные технологические компании начали массовый отказ от американских провайдеров в пользу альтернатив из КНР. В частности, Lindy перешли на Deepseek v4, Cursor — на Kimi k2.5, Coinbase — на GLM-5.2 и Kimi 2.7, а Shopify, Airbnb, Uber Eats, Siemens и Chapsvision интегрировали модели Qwen. По имеющимся данным, Microsoft также тестирует Deepseek v4. Инженеры отмечают, что для рутинных задач, таких как код-ревью, разница в качестве между моделями практически не ощущается.
Техническое сравнение показывает, что китайские модели успешно конкурируют с американскими аналогами. Например, GLM-5.2 демонстрирует показатели в кодинге, превосходящие GPT-5.5, при стоимости в 5-10 раз ниже. В генерации видео Kling 3.0 показывает результаты, сопоставимые с Veo 3.1, при двукратной экономии. Для генерации изображений используется Seedream 4.5, а для массовых задач — MiMo V2.5.
На фоне этого исхода индустрия фокусируется на оптимизации инфраструктуры. NVIDIA и Microsoft работают над чипом RTX Spark, который позволит запускать модели со 120 миллиардами параметров и окном в миллион токенов локально на ноутбуках, исключая необходимость в серверных мощностях.