Плагин Caveman: как режим «пещерного человека» экономит до 75% токенов нейросетей

Разработчики и AI-компании начали массово использовать плагин Caveman, который переводит общение нейросетей в максимально лаконичный стиль «пещерного человека». Инструмент принудительно удаляет из ответов LLM вежливые обороты, вводные фразы и пояснения, оставляя только техническую суть. По данным пользователей и автора проекта, такой подход позволяет сократить потребление токенов на 65–75%, что существенно снижает расходы на API-интерфейсы.

Проект, созданный весной 2026 года, быстро набрал популярность: репозиторий на GitHub (автор JuliusBrussee) собрал около 80 тысяч звезд. Изначально задуманный как скилл для Claude Code, Caveman эволюционировал в отдельный плагин и полноценного кодинг-агента Caveman Code. Также доступна LoRA-адаптация для локальной модели Gemma4-31b.

Эффективность метода подтверждают сотрудники крупных технологических корпораций, включая Nvidia, GitHub и OpenAI. Технический директор OpenAI Шейн Суини лично внес вклад в развитие репозитория, добавив поддержку модели Codex. В компании Legrand использование Caveman стало рекомендованной практикой для сотрудников, чтобы не превышать лимиты на использование токенов.

Популярность инструмента связывают с тем, что современные языковые модели по умолчанию склонны к избыточной вежливости и многословности, что увеличивает счета за инференс. Переход на «телеграфный» стиль общения позволяет компаниям оптимизировать затраты на разработку без потери технического качества рекомендаций.