Разработчики и AI-компании начали массово использовать плагин Caveman, который переводит общение нейросетей в максимально лаконичный стиль «пещерного человека». Инструмент принудительно удаляет из ответов LLM вежливые обороты, вводные фразы и пояснения, оставляя только техническую суть. По данным пользователей и автора проекта, такой подход позволяет сократить потребление токенов на 65–75%, что существенно снижает расходы на API-интерфейсы.
Проект, созданный весной 2026 года, быстро набрал популярность: репозиторий на GitHub (автор JuliusBrussee) собрал около 80 тысяч звезд. Изначально задуманный как скилл для Claude Code, Caveman эволюционировал в отдельный плагин и полноценного кодинг-агента Caveman Code. Также доступна LoRA-адаптация для локальной модели Gemma4-31b.
Эффективность метода подтверждают сотрудники крупных технологических корпораций, включая Nvidia, GitHub и OpenAI. Технический директор OpenAI Шейн Суини лично внес вклад в развитие репозитория, добавив поддержку модели Codex. В компании Legrand использование Caveman стало рекомендованной практикой для сотрудников, чтобы не превышать лимиты на использование токенов.
Популярность инструмента связывают с тем, что современные языковые модели по умолчанию склонны к избыточной вежливости и многословности, что увеличивает счета за инференс. Переход на «телеграфный» стиль общения позволяет компаниям оптимизировать затраты на разработку без потери технического качества рекомендаций.