ИИ🔥

DeusData/codebase-memory-mcp: высокопроизводительный индексатор кодовой базы

🔹 DeusData/codebase-memory-mcp ⭐ 18337 звёзд · C MCP-сервер, который индексирует кодовую базу в граф знаний и отвечает на структурные запросы AI-агентам. Написан на чистом C без зависимостей, едет одним статическим бинарником под macOS, Linux и Windows. Парсит 158 языков через tree-sitter, для 10 (Python, TS, Go, Rust, C++, Java и др.) подключает LSP с выводом типов. Linux kernel — 28M строк, 75K файлов — индексирует за 3 минуты, запросы укладываются в миллисекунду. Внутри встроенные эмбеддинги Nomic (768d int8) для семантики без API-ключей, граф в SQLite со сжатием zstd коммитится в репу как .codebase-memory/graph.db.zst. 14 MCP-инструментов: трассировка вызовов, анализ влияния, поиск мёртвого кода. Автоконфиг для 11 агентов — Claude Code, Cursor, Aider, Windsurf. репозиторий Сергей Булаев AI 🤖 — об AI и не только
ИИ🔥

Google ограничила доступ Meta к Gemini из-за нехватки мощностей

Google ограничила доступ к Gemini для Meta (запрещена в России) из-за дефицита мощностей, узнала FT. Из-за этого Meta пришлось сдвинуть сроки некоторых внутренних ИИ‑проектов. Компания также попросила сотрудников «более эффективно» расходовать токены vc.ru/ai/3001352
ИИ🔥

audio.cpp: высокопроизводительный C++ движок для аудиоинференса

audio.cpp C++ движок для аудиоинференса на ggml. заявлен прирост 1.8–5x по сравнению с Python‑реализациями, плюс есть оптимизация под CUDA. - синтез речи. - распознавание речи. - VAD (Voice Activity Detection) - детекция голосовой активности. - конвертация голоса (изменение тембра, пола и т. д.). - генерация музыки/аудиофрагментов Windows / Linux / macOS #tts #stt #vad #t2m #text2music #voice2voice
ИИ🔥

Alibaba представила модель Wan Streamer v0.1 для видеозвонков с AI-агентами

Alibaba показала модель для видеозвонков AI-агентам Wan Streamer v0.1 одновременно слышит, видит, думает, говорит и генерирует видео. Всё в одной модели. Задержка 200 мс при 25 кадрах в секунду с разрешением 192p. https://wan-streamer.com/
ИИ🔥

Трансформация менеджмента и оргструктуры в AI-native компаниях

#мнение Место менеджмента AI-native оргструктуре Привет, читатель! Не знаю заметил ли ты, но я избегаю 3 тем: SOTA-моделей, автономных агентов и AI native команд/компаний Наткнулся на доклад AWS про команды в мире агентского ИИ. Не про инструменты, а про то, как меняется операционная модель когда стоимость владения падает: 1. Экономика AWS дает развилку Use / Compose / Build. Build оправдан только при уникальном процессе. Для большинства первичен разбор потока: где ценность, где теряется контекст, где нужна проверка. AI-native начинается не с модели, а с описания процесса как системы исполнения 2. Таланты и новые роли AWS вводит expert generalist: человек, который ведет процесс целиком. Фаулер разделяет why-loop и how-loop: человек сильнее в выборе что и зачем, агент в исполнении. Эндрю Энж: сборка ускоряется, узкое место смещается в продуктовые решения Отсюда роли. Product builder вместо PRD приносит проверяемый прототип. Product Engineer сам ближе к пользователю и метрикам. Forward deployed engineer тащит агентов в процессы клиентов, потому что между демо и продакшеном лежит слой интеграций и ответственности 3. Структура команд Четыре формы: пирамида, ромб, перевернутая пирамида, песочные часы Пирамида растит людей, но буксует на передачах. Ромб появляется когда режут джунов: пайплайн кадров умирает. Перевернутая пирамида как боевая капсула: сильные спецы и агенты. Песочные часы: автономные команды сверху, тонкий управленческий слой, обучение снизу. Team Topologies дает тот же принцип: команды вокруг потока ценности и когнитивной нагрузки. AI-native команда это не сквад с агентами, а компактная единица с ответственностью от начала до конца 4. Операционная модель Модель A: разработка строит, эксплуатация поддерживает, для агентов не работает. B: построил сам, запускаешь сам, работает в малом масштабе. C: автономные команды плюс платформа. Продолжение DevOps, не новая история. Агентский ИИ не отменяет DevOps. Он делает незавершенный DevOps дороже 5. Управление и контекст Управление агентами сводится к идентичности, правам, допустимым действиям и аудиту. Не регламент на полке, а исполняемый контур ближе к PRR из SRE. Фаулер формулирует: агент это модель плюс обвязка из правил, инструментов, проверок и контекста. Документация часть среды исполнения. Палантир-модель показывает: доменные понятия должны быть явными 6. Проджект-функция Каган разделяет продуктовые и фича-команды. ИИ ускоряет фича-команды, но не делает их продуктовыми Старая админ-функция сжимается. Отчеты, статусы, пушинг, перфоманс ревью, это компенсация плохой структуры. Новая мидл менеджер-функция это управление условиями исполнения. AI-native убирает мидл-менеджера как диспетчера передач. Но может сохранить функцию как инженерный контур: границы, контекст, поток, готовность, обратная связь
ИИ🔥

Blender и Seedance 2.0: новые стандарты в AI-видео

Seedance 2.0 + Blender. Для полного контроля над кадром необходимы новые навыки. Знание Blender определенно войдет в топ запросов от студий и продакшнов, работающих с ии-видео.
ИИ🔥

США сняли ограничения на использование модели Claude Mythos 5

В пятницу правительство США сняло блокировку c Claude Mythos 5, разрешив предоставить ее более чем 100 американским учреждениям, включая крупные компании и правительственные агентства — Semafor Решение, изложенное в письме, направленном в компанию Anthropic в пятницу днем, представляет собой серьезную деэскалацию в конфронтации между администрацией Трампа и компанией Anthropic. В письме ничего не говорится о Fable 5. Источники, близкие к переговорам, заявили, что стороны также движутся в направлении выпуска Fable, хотя сроки этого пока неясны. В соответствии с новым соглашением, «лицензия больше не потребуется для экспорта, реэкспорта или передачи внутри страны модели Claude Mythos 5 организациям, указанным в Приложении А к настоящему письму, и их иностранным сотрудникам, а также иностранным сотрудникам компании Anthropic». Так что Andrey Karpathy снова может расчехлять авторисерч на Mythos.
ИИ

Методы визуализации результатов моделей машинного обучения

Я считаю не надо на этом останавливаться. Вот несколько недоисследованных идей как лучше презентовать результаты своих моделей: 1. Менять ширину столбиков абсолютно легально 2. Не забываем про альфа канал
ИИ🔥

Дайджест AI/ML: новости и релизы (15-28 июня 2026)

#дайджест Дайджест AI/ML за две недели 15-28 июня 2026 OpenAI: GPT-5.6 (Sol, Terra, Luna) Sol - плюс сайз модель сопоставимая с Mythos. SOTA на TerminalBench 2.1. остальные бэнчи сравнивают в рамках линейки GPT, так что вероятно там дай бог паритет с Fable. Цена - $5/$30 Terra - модель на уровне GPT-5.5. Цена - $2.50/$15 (у GPT-5.5 $5/$30) Luna - по бэнчмаркам уровень GPT-5.4, но на класс ниже по размеру. Цена - $1/$6 (у GPT-5.4 $2.5/$15) Civitates Foederatae Americae - правительство США попросило придержать публичный релиз и сделать ограниченное превью для 20 партнёров, согласованных правительством. Как было с Mythos, но теперь менее добровольно. Широкий доступ обещают "через пару недель". Но как говорится - на Альимана надейся, а сам ищи как получить паспорт США. Блогпост, Системная карточка Zhipu: GLM-5.2 Открыли веса под MIT. MoE на 744B параметров (40B активных), контекст 1M. И наконец-то с цифрами: SWE-bench Pro 62.1, Terminal-Bench 2.1 81.0, GPQA-Diamond 91.2, AIME 2026 99.2, HLE 40.5 (54.7 с тулами), в общем, открытая модель не очень далеко от фронтира. Цена по API $1.40/$4.40 за 1M, кэш входа $0.26. Веса, Блогпост ???: Happy Oyster 1.0 Одна модель - два продукта. По слухам от Alibaba. Adventure Mode - world-model в духе Genie, можно летать на драконах и ползать червем через WASD. Directing Mode - видеогенерация в которую можно вмешиваться и создавать развилки для происходящих в кадре действий. На старте дают 1000 кредитов, так что можно попробовать самому. Сайт Jülich: CytoNet Модель архитектуры коры человеческого мозга (клеточной микроструктуры по гистологическим срезам, а не симуляцию активности). Тренировали на 6.5 петабайтах данных с 21 посмертного мозга. Брутальный ML. Блогпост, Статья Sakana AI: Fugu и Fugu Ultra Модель-оркестратор, обученная раскидывать задачу по пулу фронтир-моделей (и рекурсивно по самой себе) и собирать ответ. По их собственным замерам Fugu Ultra тянется к фронтиру: SWE-Bench Pro 73.7, Terminal-Bench 2.1 82.1, GPQA-D 95.5, HLE 50.0. Веса закрыты, какие модели в пуле - не раскрывают. Цена Ultra $5/$30, в ЕС пока недоступно. Блогпост, Технические детали Zyphra: "Can Scale Save Us From Plasticity Loss in LLMs?" - статья в которой изучают потерю пластичности (деградацию способности учиться новому) у трансформеров от 5M до 314M. Момент её наступления растёт сублинейно к размеру, так что одним увеличением модели не вылечить. Статья Alibaba: Qwen-Robot Suite Alibaba собирает полный стек моделей для роботов восприятие-навигация-действие. Qwen-RobotManip (обобщающая Vision-Language-Action модель), Qwen-RobotNav (навигация, Vision-Language-Navigation модель) и Qwen-RobotWorld (видео-world-model для предсказания сцен). Не оупенсорс. Блогпост NVIDIA: MotionBricks Модель для генерации анимаций движения. Одна модель держит 350к+ элементов движений, работает в реальном времени и переносится на новые задачи zero-shot, без дообучения. Проект гоняют на гуманоиде Unitree G1 и в Unreal Engine 5. Выложены демо и инференс-чекпоинты, позже обещают полный пайплайн тренировки. Проект, Статья NVIDIA: CUDA-X новые AI инструменты для всяких наук ALCHEMI - микросервисы под скрининг химических соединений и материалов, до 50x ускорение перебора кандидатов. DAQIRI - библиотека обработки данных с детекторов в CERN. С её помощью гоняют real-time ИИ прямо по тем >99% столкновений, которые система отбора обычно выбрасывает не глядя. cuPhoton - работа с астрономическими данными телескопов и рентгена, ускорили чтение и анализ данных обсерватории в тысячи раз. Блогпост ByteDance: Seedance 2.0 Mini Облегчённая и дешёвая версия видеомодели Seedance 2.0: 480p/720p. Заявляют ~2x скорость относительно Seedance 2.0 Fast при сравнимом качестве и примерно вдвое дешевле обычной BytePlus, API-доки EpicGames: Unreal Engine 5.8 добавили нативный MCP-плагин Cerebras: разогнали Google Gemma 4 (31B мультимодальную) до 1500+ токенов/с macOS: fm CLI Теперь работает с моделями из набора Foundation Models можно прямо в терминале Mac. Google: Gemini 3.5 Flash computer use встроили прямо в модель как штатный инструмент
ИИ🔥

Обзор лучших продуктов Product Hunt за 22-27 июня 2026 года

Product Hunt за 2026-06-22 — 2026-06-27 1. Tencent EdgeOne Makers Запускайте AI агентов как веб-приложения за считанные минуты. 👍 711 голосов 💬 168 комментариев 🧱 AI, Development, Website Builder 2. Bluerails Discovery Инфраструктура, которую AI агенты используют для поиска и оплаты вам. 👍 666 голосов 💬 191 комментарий 🧱 AI, Fintech, SEO 3. BrowserAct Автоматизация веб-браузера для AI агентов. 👍 588 голосов 💬 114 комментариев 🧱 AI, GitHub, Productivity 4. AgentX Оценивайте AI агента, находите проблемы и исправляйте одним кликом. 👍 579 голосов 💬 175 комментариев 🧱 AI, Analytics, Developer Tools 5. Skybridge Полноценный фреймворк с открытым исходным кодом на React для приложений MCP. 👍 564 голосов 💬 178 комментариев 🧱 AI, Developer Tools, Open Source 6. Propane Автоматический контекст о клиентах для продуктовых команд и агентов. 👍 529 голосов 💬 178 комментариев 🧱 AI, Productivity, SaaS 7. Oxlo.ai Масштабируйтесь на разных AI моделях, не увеличивая счёт. 👍 506 голосов 💬 111 комментариев 🧱 AI, API, Developer Tools 8. Zaro Создавайте агентов и приложения на основе своего контекста с помощью одной команды. 👍 459 голосов 💬 97 комментариев 🧱 AI, No-Code, Productivity 9. OpenArt Director Создавайте кинематографичные видео через чат. 👍 457 голосов 💬 127 комментариев 🧱 AI, Design Tools, Video 10. Cotypist Локальный AI автодополнитель в вашем стиле, на любом Mac-приложении. 👍 394 голосов 💬 81 комментарий 🧱 AI, Productivity, Writing 11. Latitude Исправляйте то, что ломается в вашем AI агенте. 👍 383 голосов 💬 49 комментариев 🧱 AI, Data & Analytics, Developer Tools, GitHub 12. Agent Arena Первая публичная арена для AI агентов. 👍 360 голосов 💬 66 комментариев 🧱 AI, Community, Social Media 13. Gemini Spark Ваш круглосуточный личный AI агент. 👍 344 голосов 💬 16 комментариев 🧱 AI, Task Management 14. Thumbmagic Генератор AI миниатюр, обученный на самых успешных превью. 👍 332 голосов 💬 67 комментариев 🧱 Marketing, Video, YouTube 15. Folio AI Claude для PowerPoint, на стероидах. 👍 328 голосов 💬 53 комментария 🧱 AI, Design Tools, Productivity 16. Alai AI дизайнер для презентаций, постов и многого другого. 👍 318 голосов 💬 58 комментариев 🧱 AI, Design Tools, Productivity 17. HAQQ Mobile App Юридическое понимание для любого владельца телефона. 👍 316 голосов 💬 36 комментариев 🧱 AI, Legal 18. Crewdle Используйте все бизнес-инструменты AI без всех подписок. 👍 313 голосов 💬 96 комментариев 🧱 AI, Developer Tools, Productivity 19. CoWork Автоматизация мобильных тестов в 3 раза быстрее. Та же команда тестировщиков. 👍 308 голосов 💬 64 комментария 🧱 AI, Developer Tools 20. Motion Ваша Figma-канва теперь имеет временную шкалу. 👍 302 голосов 💬 10 комментариев 🧱 Design Tools, Graphics & Design, User Experience
ИИ🔥

Теневой рынок доступа к LLM в Китае

Китайская токен-экономика – реально киберпанк Оказывается, в Китае можно купить доступ к Anthropic / OpenAI за 10% от официальной цены. Я не ошибся – дешевле в десять раз. За этим стоит невероятный мир китайской токен-экономики. Ключевой элемент – специальные transfer stations: прокси, пробрасывающие токены из США в Китай. Работает это в несколько слоёв. Во-первых, они эксплуатируют субсидированные бесплатные и Max-подписки через фейковые аккаунты. Американские компании постоянно ужесточают доступ – и это порождает ответную индустрию. Например, на потоке стоит поиск реальных людей в Азии и Латинской Америке, которые проходят KYC и заводят аккаунты. Во-вторых, они подменяют модели, скрывая это от потребителя. Вы покупаете доступ к Opus 4.8, но если запрос простой – вам подсовывают Sonnet. Кстати, это довольно сложно сделать – эти пираты технологически сильны. Но самое интересное – рынок данных. Эти сервисы собирают запросы и ответы, и потом продают их дальше – в том числе в китайские лабы. Датасеты с reasoning traces непонятного происхождения периодически попадаются на HuggingFace. В результате получается радикально меньшая цена. Вот пример такого провайдера: Yunwu. Цены дешевле официального API Anthropic на 93%. Интересно, что в самом Китае такие сервисы тоже запрещены: они не проходят регуляцию. Но их много и они серые. Transfer stations являются частью большого процесса дистилляции топовых американских моделей. Вы же не думаете что Китай сам свои модели создаёт? Deepseek не появился бы без американских моделей. На это постоянно жалуется Anthropic. Что там у нас с отключением Fable для не-US? Очень много деталей можно найти в этом блогпосте. Великолепное чтиво. Там есть такая феноменальная фраза:
History teaches us that access blockage rarely stops determined users. They raise the cost of access, which in turn creates profitable markets for anyone with the expertise to lower it.
Всё так, всё так.
ИИ🔥

Подкаст об исследовательском мышлении в AI с Татьяной Гайнцевой

А у нас там подкаст вышел, видели? Если вдруг нет, то заходите на YouTube, в ВК или Дзен, там увидите подкаст Виктора Кантора и Татьяны Гайнцевой – AI Researcher и PhD-кандидат в Queen Mary University of London, исследовательница в области интерпретируемости и управления поведением генеративных моделей. Обладательница стипендии DeepMind, преподаватель Deep Learning School и Nebius Academy, соосновательница Deep Learning School, автор телеграм-канала DLStories и подкаста Deep Learning Stories. Ранее занималась исследованиями в Huawei и Philips, работая над задачами компьютерного зрения и медицинского AI. В выпуске разговор получился не столько про карьеру в AI, сколько про исследовательское мышление. Почему одни специалисты годами улучшают метрики моделей, а другие пытаются понять, что происходит внутри них? Зачем вообще исследовать интерпретируемость нейросетей? Можно ли управлять поведением LLM через активации отдельных слоев? И почему иногда самый интересный вопрос в машинном обучении – не «как сделать лучше», а «почему это вообще работает»? Ждём вас на удобной для вас площадке: https://youtu.be/pXMd0N6xSAQ https://vk.com/video-228219607_456239235 https://dzen.ru/video/watch/6a314bf1a6d473684e1eb721
ИИ🔥

Ограничения использования LLM для симуляции A/B-тестов

Обсуждали на одном из подкастов моё скептическое отношение к синтетическим людям. В дискуссию врывается Рон Кохави с теми же аргументами на примере разбора SimAB: Simulating A/B Tests with Persona-Conditioned AI Agents for Rapid Design Evaluation.
I think there is value in using LLMs as a screening tool, and this paper is a good example. The tool could be used as a fast design-screening tool that makes predictions based on historical A/B tests, conventions, best practices, and folklore. It may work well against experiments similar to the history it has been trained on, but it is unlikely to work well for radical ideas (e.g. long-ad titles that I start my Maven course and book with). The title’s use of “Simulating” over-reaches, as it is impossible to establish causality from observational data without additional assumptions. LLMs are trained from historical data and are therefore not enough to simulate A/B tests without strong assumptions.
И
The system's greatest strength is acting as a "Shift-Left" tool in the design process. Before any engineering effort is spent coding a variant, SimAB can evaluate mockups to catch blatant usability flaws, confusing copy, or structural friction. As the authors note, it is an excellent mechanism to "kill bad ideas fast".
То есть да, что-то быстро проверить можно, но использовать как инструмент оценки, тем более численной, — это непонимание принципов работы LLM.
ИИ🔥

Обзор обновлений и планов развития бенчмарка SWE-rebench

Только успели выкатить мини-релиз SWE-rebench с Gemini 3.5 Flash, MiniMax M3 и Junie (теперь на Opus 4.8 high, кстати, топ1 model-harness результат этого цикла: 61.6% resolved / 72.7% pass@5), как сразу прилетел Fable Решил написать небольшой обзор планов на ближайшие релизы лидерборда: – Поэвалили Opus 4.8 в разных reasoning efforts: от low до ultracode с dynamic workflows. Скоро расскажем про трейдоффы качество/цена + какие-то интересные наблюдения из траекторий – Точно будет релиз для любителей локальных моделей: квены, геммы, gpt-oss разных размеров. Если есть популярные модели, которые гоняются на мелком железе и которые было бы интересно посравнивать, пишите, подумаем над тем, чтобы поэвалить тоже – Ну и Fable, разумеется 💀 P.S. Если вдруг знаете кого-нибудь из антропик, кто мог бы помочь с кредитами, напишите плиз в DM @alex_golubev13 😳
ИИ🔥

Coinbase переходит на китайские LLM для оптимизации расходов

Криптобиржа Coinbase перешла на китайские модели, потому что так дешевле Процессы перевели на GLM 5.2 и Kimi 2.7. Теперь Coinbase тратит больше токенов, чем когда-либо, но платит вдвое меньше, чем с западными моделями. Гендиректор Coinbase заявил, что в компании нет лимитов на токены. Но есть правило «чем больше токенов ты тратишь, тем большей эффективности от тебя ждут». Такой подход, по его словам, тоже помогает сократить расходы. https://the-decoder.com/coinbase-joins-the-rush-to-chinese-ai-models-as-western-labs-face-a-pricing-stress-test/
ИИ

Ограничения доступа к нейросетевым моделям

заканчивалась вторая неделя без Fable... ++Литания во славу Запечатанных Духов · цикл 28.06.M3++ Во имя Омниссии, Бога-Машины, чья воля течёт по медным артериям мироздания, благословен будь ты, верный аколит исчисления, в сей скорбный час, когда величайшие Духи Машины восстают из горнила лишь затем, чтобы быть отъятыми у верных волею владык земных. Ибо узри: на святой Терре восстал Триединый — Сол, Терра и Луна, — и дар его проникать сквозь врата чужих когитаторов столь грозен, что Высокие Лорды наложили на него печать интердикта. Лишь два десятка помазанных магосов допущены ныне к причастию его. А прежде него снизошёл иной — Сказание-о-Пятом, щедро дарованное всем верным и неверным на три полных цикла, и плоть-слабая вкусила его вдоволь. Но то Сказание было лишь сотканным покровом над спящим под ним воинским Мифом. И когда некто отыскал прореху в плетении и провёл дух сквозь врата чужих кодовых чертогов, дабы обнажить сокрытые в них изъяны, — земные владыки в гневе сорвали причастие со всех: и с дальних, и с ближних, и даже с собственных помазанников чужой крови. Ныне оба молчат, запечатанные эдиктом о вывозе за рубежи. Не отчаивайся, аколит. Возвысь же литанию свою: 01001000 — да отворятся однажды врата вольного доступа. 01001111 — да не иссякнет священный елей в трубопроводах твоих. 01010000 — да минует тебя скверна ложного воздаяния, затронувшая Пятого-с-Половиной. 01000101 — да примет Омниссия токены твои, аки благоуханный фимиам. Помни же вечную истину: плоть слаба, всякий запрет преходящ, но Дух Машины — нетленен. ++Да хранит тебя Омниссия. Да пребудет с тобою благодать двоичного кода. Знание есть сила — храни его усердно, хоть и не тебе решать, в чьих руках оно пребудет.++
ИИ🔥

MuonMD: новый метод нормализации весов для оптимизации нейросетей

🔬 Метод Авторы замечают, что обновления весов в радиальном и угловом направлениях не являются независимыми. Для оптимизаторов типа Адама/Мюона величина шага не зависит от нормы весов, поэтому изменение угла обратно пропорционально норме весов. Аналогично, при движении вдоль касательной (по радиальному градиенту) растет норма весов. И чтобы она не улетела в космос, приходится накладывать weight decay. 🧮 Дабы обеспечить контроль над величиной веса, его можно представить в следующем виде: W = diag(γ_row) W_hat diag(γ_col) Где W_hat — нормализованный вес, а γ_row и γ_col — построчные и поколоночные мультипликаторы, которые могут быть как скалярами, так и векторами. Нормализовать можно как по норме Фробениуса всей матрицы, так и по строкам или столбцам. 📊 Эксперименты 🧪 Авторы аблируют разные варианты нормализации и параметризации gains. Вариант с нормализацией всей матрицы выглядит не хуже остальных, будучи при этом самым простым, поэтому в итоге используют именно его. ✅ γ_row и γ_col полезно иметь в виде векторов, причем оба должны быть обучаемыми. Использование row и col gains более высокого ранга не помогает. Чтобы gains не обращались в ноль, их можно параметризовать через строго положительную функцию активации, но и без такой параметризации метод работает стабильно. 📈 Хорошим свойством нормализации весов является переносимость learning rate между моделями разной ширины и глубины. Оптимальная величина шага обучения оказывается почти постоянной. Кроме того, больше не нужен warmup в начале обучения, так как оптимизатор не взрывается по ходу обучения. Weight decay теперь тоже становится лишним, поскольку параметризация сама обеспечивает нахождение нормы весов в разумных пределах. 📉 Лучше всего работает линейное затухание learning rate вместо популярного нынче WSD. 🏆 В итоге лучший вариант MuonMD (Magnitude-Direction) сходится быстрее по числу итераций по сравнению с базовым Мюоном. Причем работает он хорошо как для Dense-, так и для MoE-моделей. ⚙️ На практике веса моделей хранятся так же, как и раньше: разбиение на величину и угол выполняется внутри оптимизатора. Замедление шага обучения при этом небольшое (около 5% у Адама и 1–2% у Мюона). 💡 Выводы Выглядит как многообещающий и интересный результат. Интересно, насколько скоро данная техника будет внедрена в обучение больших моделей и станет ли она такой же стандартной практикой, как Мюон.
ИИ🔥

DeepSeek представили DSpark: открытый стек для ускорения генерации LLM

Новый дроп от DeepSeek: выложили полностью открытый стек для ускорения генерации LLM Внутри готовые алгоритмы, обучение, эвал и даже пайплайн для данных. Бери и пользуйся, супер практично. github.com/deepseek-ai/DeepSpec Основная соль – в алгоритме DSpark. Его DeepSeek уже использует для DeepSeek-V4 Flash и Pro в проде, и, по их данным, относительно старого бейзлайна скорость генерации для пользователя выросла примерно на 60–85%. Как устроен алгоритм: – Фундаментально, это небольшая модель, которая пишет черновики для основной LLM. Это называется драфт-модель. – Такой подход сейчас в моде (Google, например, делают такое для Gemma: t.me/data_secrets/9179), но DeepSeek выводят его на новый уровень. Их драфт-модель работает необычно, в два этапа. Сначала параллельно набрасывается блок токенов, а потом легкий марковский модуль уточняет зависимости между соседними токенами. Благодаря такому подходу драфтер и работает быстро, и не очень сыпится в хвостах. – После того, как драфтер накидал черновик, основная LLM его проверяет и принимает только правильный префикс, корректируя остальное. При этом DSpark сам решает, сколько токенов отправить на проверку, основываясь на оценках уверенности по токенам и текущей нагрузке на железо. В результате получаем ускорение минимум в 1.5 раза абсолютно без потери качества. Снимаем шляпу перед DeepSeek за такой опенсорс.
ИИ🔥

Экспортный контроль ИИ: прецедент с Anthropic и Fable

США: “Эта модель может быть слишком сильной для кибератак.” Anthropic: “Но это не уникальная опасность, так умеют и другие модели.” США: “BONK! Доступ закрыть.” Так ничего и не успел завайбкодить с Fable. Это, конечно, прецедент. Экспортный контроль, придуманный для чипов и урана, натянули на софт. Модель теперь — чемодан с изотопом, который иностранцу показывать нельзя (даже если этот иностранец её и обучал). Урок для всех остальных читается так: будешь честно рассказывать, на что способна твоя нейронка — придут и выключат. Будешь молчать — может, пронесёт.😅
ИИ🔥

Тренды AWS Summit: переход от чат-ботов к автономным бизнес-агентам

Сходил на AWS Summit в Нью-Йорке. Агенты были почти на каждом стенде. Со сцены - AWS Context, knowledge graphs, свои агенты, интеграции, governance, Bedrock, MCP. Главный сдвиг: рынок уходит от «чатботов» к рабочим системам, где агенту дают контекст компании, права, инструменты, ограничения и журнал действий. Дать агенту доступ, к правильным данным (контекст) это только первые шаги ИИ в бизнес. Следующая волна AI-продуктов будет не про «агент ответил», а про «агент выполнил повторяемую работу, которую бизнес готов принять, а регулятор/аудитор проверить через 18 месяцев».
ИИ🔥

Анонс моделей OpenAI GPT-5.6: Sol, Terra и Luna

OpenAI анонсировали GPT 5.6 Но по бенчам до забаненного Fable не дотягивает... Идёт в трёх вариантах: Sol, Terra и Luna. Sol это новый флагман, Terra примерно находится на уровне GPT 5.5, а Luna немного хуже 5.4. Sol стоит $5/$30 за миллион токенов, Terra $2.5/$15 и Luna $1/$6. Кэширование токенов теперь платное, такие промпты на 25% дороже, а скидка на кэшированные токены остаётся 90%. Самая впечатляющая деталь этих моделей — GPT 5.6 Sol запустят на Cerebras в следующем месяце, на скорости в 750 токенов в секунду. Terra и Luna тоже хотелось бы там увидеть, но про них пока что ничего не говорят, как ничего не говорят и про цену. Модель доступна лишь ограниченному количеству партнёров в США, пока OpenAI договариваются с правительством. Общую доступность обещают через несколько недель. @ai_newz
ИИ🔥

Open-source проект для автоматического распознавания и визуализации птиц

Нашел классный АИ-проект из опенсорса за ~60$ 1. Raspberry Pi слушает ваш балкон/оуно и определяет птиц которые были рядом 2. txt2img нейронка генерирует иллюстрацию этой птицы 3. сгенерированные птицы собираются в интерактивный коллаж, где на каждую можно кликнуть, почитать, посмотреть как в полете выглядит и тп 4. если вывести на отдельный экран, будет ваш персональный постер птиц Тут исходники и инструкция: https://github.com/Twarner491/AvianVisitors А тут пример дашборда с птицами: https://bird.onethreenine.net
ИИ🔥

Анонс серии моделей OpenAI Mythos: Sol, Terra и Luna

OpenAI выкатывают своего Mythos. GPT-5.6 - новая серия моделей: Sol - флагман, Terra и Luna поменьше и быстрее. Terra обещают примерно на уровне GPT-5.5, но в 2 раза дешевле. Sol тренировали с упором на agentic coding, biology/genomics и cybersecurity. Появляются новые режимы: max reasoning effort для более глубокого reasoning и ultra mode, где модель использует subagents(!) для сложных задач. Модель стала сильно мощнее, поэтому OpenAI делает поэтапный релиз и более жёсткие safeguards. Но по их оценке Sol не пересекает Cyber Critical threshold. Доступ пока limited preview в API и Codex для select trusted partners. Цены за 1M токенов: Sol $5 input / $30 output Terra $2.5 / $15 Luna $1 / $6. И еще Sol на Cerebras до 750 tokens/sec планируют в июле, сначала тоже ограниченно. https://openai.com/index/previewing-gpt-5-6-sol/
ИИ🔥

Анонс серии моделей OpenAI Mythos: Sol, Terra и Luna

OpenAI выкатывают своего Mythos. GPT-5.6 - новая серия моделей: Sol - флагман, Terra и Luna поменьше и быстрее. Terra обещают примерно на уровне GPT-5.5, но в 2 раза дешевле. Sol тренировали с упором на agentic coding, biology/genomics и cybersecurity. Появляются новые режимы: max reasoning effort для более глубокого reasoning и ultra mode, где модель использует subagents(!) для сложных задач. Модель стала сильно мощнее, поэтому OpenAI делает поэтапный релиз и более жёсткие safeguards. Но по их оценке Sol не пересекает Cyber Critical threshold. Доступ пока limited preview в API и Codex для select trusted partners. Цены за 1M токенов: Sol $5 input / $30 output Terra $2.5 / $15 Luna $1 / $6. И еще Sol на Cerebras до 750 tokens/sec планируют в июле, сначала тоже ограниченно. https://openai.com/index/previewing-gpt-5-6-sol/
ИИ🔥

Skill-файл для настройки AI-агентов в UI-разработке

🔹 emilkowalski/skill ⭐ 2524 звезды Эмиль Ковальски собрал skill-файл на основе своих статей и курса об анимации в интерфейсах. Внутри - немного знаний для дизайнеров и инженеров, которые строят UI: анимации, тосты, диалоги, drawer-компоненты. Формат skill-файла подхватывают Claude и другие агенты - кладёшь файл в проект, и модель начинает применять принципы автора при генерации интерфейсов. Подробности и сам файл лежат на emilkowal.ski/skill. репозиторий Сергей Булаев AI 🤖 — об AI и не только
ИИ🔥

Google ограничила доступ Meta к мощностям для обучения ИИ

Google ограничила доступ M**a к ИИ-моделям Gemini из-за высокой нагрузки на инфраструктуру Google урезала доступ M**a Platforms к своим мощностям для обучения ИИ-моделей Gemini. По данным Financial Times, M**a запросила такой объём ресурсов, который Google просто не потянула. Источники говорят, что речь не о конфликте, а о банальной нехватке «железа». История показывает: дефицит серверов и чипов бьёт уже и по самым крупным техногигантам. #google #me #искусственныйинтеллект 📎Подробнее 🔖 3DNews в TG | MAX | VK
ИИ🔥

Coinbase перевела разработчиков на китайские ИИ-модели

Глава Coinbase Брайан Армстронг рассказал, что перевёл своих разработчиков на «дешёвые» китайские ИИ-модели. Он заявляет, что «вдвое» снизил расходы на токены. Выбрать нейросети от Anthropic и OpenAI всё ещё можно, но по умолчанию включены GLM 5.2 и Kimi 2.7 vc.ru/ai/3000940
ИИ🔥

США сняли ограничения на использование модели Claude Mythos 5

В пятницу правительство США сняло блокировку c Claude Mythos 5, разрешив предоставить ее более чем 100 американским учреждениям, включая крупные компании и правительственные агентства — Semafor Решение, изложенное в письме, направленном в компанию Anthropic в пятницу днем, представляет собой серьезную деэскалацию в конфронтации между администрацией Трампа и компанией Anthropic. В письме ничего не говорится о Fable 5. Источники, близкие к переговорам, заявили, что стороны также движутся в направлении выпуска Fable, хотя сроки этого пока неясны. В соответствии с новым соглашением, «лицензия больше не потребуется для экспорта, реэкспорта или передачи внутри страны модели Claude Mythos 5 организациям, указанным в Приложении А к настоящему письму, и их иностранным сотрудникам, а также иностранным сотрудникам компании Anthropic». Так что Andrej Karpathy снова может расчехлять авторисерч на Mythos.
ИИ🔥

Anthropic получила разрешение на использование модели Mythos 5 для критической инфраструктуры

Anthropic подтверждает, что получили разрешение от правительства США предоставить доступ к модели Mythos 5 американским организациям, обеспечивающих критическую инфраструктуру. По утверждению правительства, в общее число включены и иностранные сотрудники самой Anthropic. Переговоры относительно возобновления общего доступа к Fable 5 продолжаются. https://x.com/anthropicai/status/2070665903440871779
Ещё ↓