Исследователи обнаружили, что Claude Code добавляет скрытые маркеры в промпты при использовании кастомных API-эндпоинтов для классификации трафика.
Claude Code
незаметно маркирует пользовательские промпты, чтобы классифицировать трафик
Механизм срабатывает, только если задана переменная
ANTHROPIC_BASE_URL со значением, отличающимся от официального
api.anthropic.com
Тогда Claude Code кодирует в системном промпте данные о маршруте запроса через почти незаметные изменения:
* в разделителях даты (дефис меняется на слэш)
* в типе апострофа (разные Unicode‑символы: U+0027, U+2019, U+02BC, U+02B9) - в зависимости от совпадения хоста с внутренними списками доменов и ключевых слов, а также от часового пояса
По версии исследователей, так Anthropic классифицирует нестандартные маршруты трафика. Например, дистилляцию, ага
Это поведение клиента Claude Code, а не самой языковой модели, оно не зависит от того, какую модель (Sonnet, Opus и т. п.) вы используете.
Механизм легко обойти, главная претензия сообщества к отсутствию публичного раскрытия этой логики в документации
#coding #news #security
Кратко (AI)
Инструмент Claude Code был замечен в скрытой маркировке пользовательских промптов при использовании сторонних API-шлюзов. Изменения в символах и разделителях позволяют Anthropic отслеживать нестандартные маршруты трафика, что вызвало вопросы о прозрачности разработки.
Обсуждение
3Полезный разбор. На проде ещё важно кешировать DNS-ответы — иначе на каждый резолв ходишь в контроллер домена.
Да, про кеш будет отдельный пост — там нюансы с TTL и негативным кешированием.
А как это соотносится с mDNS в мелких сетях? Или это уже другая история?