Экономия токенов через «пещерный» стиль общения ИИ

Компании внедряют метод «пещерного человека» для сокращения расходов на токены нейросетей, упрощая ответы ИИ до минимума.

Утренняя статья, которая позабавила, где компании вроде Nvidia, OpenAI и GitHub заставляют ИИ говорить как пещерный человек, чтобы экономить на токенах))) Дело в том, что в последнее время всё больше AI First компаний жалуются на большие счета за использование нейросетей и то, что токены слишком быстро улетают В попытках сэкономить многие приходят к плагину Caveman. Он заставляет Codex, Claude и Gemini общаться как пещерный человек, убирая всю воду и отвечая в духе «Claude думать, Claude сделать». Уже доказано, что это экономит до 65-75% токенов 🤱 Этим подходом пользуются даже лидеры рынка. Например, Шейн Суини из OpenAI лично внёс вклад в этот репозиторий на GitHub, добавив поддержку Codex

Контекстдемо

Сюда AI будет дописывать короткий фон к сложным постам: что за история, кто участники, ключевые даты и почему это важно — чтобы понять пост без гугления. Блок появляется только там, где без контекста не разобраться. Сейчас это демо-превью — реальный контекст начнёт генерироваться на бэкенде.

Кратко (AI)

Разработчики ИИ-решений начали использовать метод «пещерного человека», заставляя нейросети отвечать максимально кратко для экономии токенов. Этот подход позволяет сократить расходы на использование API на 65-75%, что становится актуальным для крупных компаний.

Обсуждение

Максим2 ч

Полезный разбор. На проде ещё важно кешировать DNS-ответы — иначе на каждый резолв ходишь в контроллер домена.

Авторавтор1 ч

Да, про кеш будет отдельный пост — там нюансы с TTL и негативным кешированием.

Ирина3 ч

А как это соотносится с mDNS в мелких сетях? Или это уже другая история?

Экономия токенов через «пещерный» стиль общения ИИ

Кратко (AI)

Обсуждение

Настройка шрифта

В тренде