ИИ🔥

OpenClaw выпустил мобильные приложения для self-hosted ИИ-агентов

🦞 OpenClaw залез в карман - личный ИИ-агент теперь в смартфоне Open-source фреймворк для self-hosted ассистентов выпустил нативные приложения под iOS и Android. Телефон становится «телом» агента, а данные остаются у тебя. Что может: ✧ Подключается к твоему Gateway по QR ✧ Голос, чат, задачи, пуши и одобрение действий ✧ Доступ к камере, гео и календарю с разрешения Бесплатно, без сбора данных, но релиз сырой: первые юзеры ловят баги и краши. Скачать в ✴️ App Store или ✴️ Google Play #openclaw
ИИ🔥

Калифорния вводит меры защиты работников от ИИ-увольнений

⚖️ ИИ-увольнения стали вопросом государственной важности Губернатор Калифорнии Гэвин Ньюсом подписал указ, который поручает государственным органам подготовить меры поддержки работников, пострадавших от внедрения ИИ. Что предлагается: 🔵 изучить программы поддержки и компенсаций для уволенных сотрудников, 🔵 расширить возможности переобучения, 🔵 рассмотреть модели совместного владения бизнесом для работников, 🔵 проанализировать влияние ИИ на рынок труда Калифорнии, 🔵 изучить, как профсоюзы ведут переговоры по вопросам ИИ, 🔵 ограничить увольнения, основанные исключительно на решениях алгоритмов. Поводом стали массовые сокращения в технологическом секторе. Meta, Cisco и Block уже напрямую связывали увольнения с ИИ-трансформацией компаний. Сам факт появления подобных инициатив показывает, что дискуссия вокруг ИИ выходит за пределы технологий и бизнеса. Вопросы занятости, защиты работников и распределения выгод от автоматизации постепенно становятся предметом государственной политики. Интересно, что профсоюзы и часть экспертов всё чаще подчёркивают:
массовая потеря рабочих мест из-за ИИ не является неизбежностью.
Во многом это вопрос управленческих и политических решений. При этом подходы начинают расходиться. Если в США на федеральном уровне преобладает курс на минимальное регулирование, то отдельные штаты уже пытаются выстроить собственую систему защиты работников. ✅ Вывод Мы постепенно переходим от обсуждения возможностей ИИ к обсуждению его социальных последствий. Если раньше автоматизация была внутренним вопросом компаний, то теперь она становится предметом переговоров между бизнесом, государством и обществом. И, возможно, главный спор ближайших лет будет не о том, способен ли ИИ заменить человека, а о том, кто получит выгоду от этого перехода и кто заплатит за его последствия.
ИИ🔥

DSpark: оптимизация параллельного драфтинга для LLM

🔧 Метод Параллельный драфтинг хорош тем, что он действительно параллелен, но не учитывает последовательную зависимость между токенами. А авторегрессионную модель нужно гонять каждый раз для каждого токена. Отсюда предлагают гибридное решение — такую же параллельную тушку, как в DFlash, поверх которой обучают легковесный авторегрессионный модуль. Рассматривают два варианта: * 🔹 Простая линейная марковская голова (с малоранговым боттлнеком), которая принимает на вход прошлый токен. * 🔹 Небольшая RNN. Далее, основываясь на народной мудрости и опыте, делают два важных замечания: * 📈 Acceptance length сильно разнится между областями. У кода следующие токены более предсказуемы, и она больше; в диалогах — меньше. * 📦 Чем больше размер батча, тем меньше выигрыш от использования спекдека и тем более заметно ощущается стоимость верификации. Отсюда возникает идея обучить дополнительную голову, которая будет предсказывать, будет ли токен отринут или нет. За счет этого можно не утруждать таргет проверкой того, что наверняка не примется. Так как предсказания классификатора выдают уверенность выше, чем надо (overconfidence), полученные вероятности дополнительно калибруют на некоторой выборке. Оптимальные длины драфтов подбирают при помощи некоего жадного алгоритма. На вход подаются текущий размер батча, текущие длины драфтов и предсказанные уверенности, а на выходе — оптимальные длины, достигающие максимального throughput. 🧮 Лосс-функция состоит из трех членов: * 📌 Стандартная кросс-энтропия. * 📌 Total Variation между драфтом и таргетом. * 📌 Confidence Loss (бинарная кросс-энтропия). Итоговый лосс является взвешенной суммой всего перечисленного. 📊 Эксперименты Сначала тестируют предложенный подход на Qwen3-{4B, 8B, 14B} и Gemma4-12B против DFlash и EAGLE-3 в качестве бейзлайнов. DFlash и DSpark используют один и тот же параллельный бэкбон. Все модели обучаются на одних и тех же данных. ✅ У DSpark консистентно выше acceptance length (примерно на 16–18%). Далее авторы исследуют acceptance в зависимости от позиции и замечают, что DFlash более уверенно предсказывает первые токены по сравнению с EAGLE-3 благодаря более мощной модели, но acceptance rate токена падает с глубиной. У EAGLE-3 он может даже расти, но из-за меньшей точности на первых токенах драфта итоговая acceptance length оказывается меньше. DSpark же имеет хороший acceptance в начале, который еще и практически не убывает. Уже 2 слоя DSpark якобы не хуже 5 слоев DFlash. В качестве авторегрессионной части пробуют марковскую голову и RNN. RNN дает чуть больший acceptance, но имеет больший оверхед и сложнее в реализации, поэтому останавливаются на марковской голове. 📈 Повышение порога confidence (стоит ли вообще верифицировать данный токен) увеличивает acceptance length. Потом авторы масштабируют историю на DeepSeek-V4, и DSpark выдает заметно лучшее соотношение throughput/latency по сравнению с MTP-бейзлайном. ⚙️ Из технических сложностей стоит отметить невозможность работать с CUDA-графами из-за динамических размеров входов и сложности с Zero-Overhead Scheduling. Чтобы решить вторую проблему, используют verification capacity с двух шагов назад (ZOS требует знания размера батча заранее). 💡 Выводы Результат и наблюдения, безусловно, ценные — как любят и умеют делать ребята из DeepSeek. В основе метода все еще лежит DFlash, так что не стоит утверждать, что это принципиально новая парадигма. И у DFlash не так много ручек, которые нужно крутить, чтобы выжать максимальный перф.
ИИ🔥

DSpark: оптимизация спекулятивного декодирования в LLM

DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation 📄 Статья 💻 Код (DeepSpec) С начала текущего года вышел ряд работ (DFlash и follow-up research), предлагающих различные варианты параллельного драфтинга, когда драфт-модель предсказывает несколько токенов за один раз. Такие подходы позволяют использовать более сильную модель в качестве черновой и могут выдавать acceptance на уровне или даже лучше, чем SOTA AR-методы спекдека. Но будто бы потенциал для дальнейшего улучшения все еще есть. Ребята из DeepSeek проделали кропотливую инженерную работу, внесли определенные архитектурные изменения, а заодно предложили динамически подбирать длину драфта, чтобы оптимизировать производительность под разные типы запросов и текущую нагрузку.
ИИ🔥

DSpark: оптимизация параллельного драфтинга для LLM

🔧 Метод Параллельный драфтинг хорош тем, что он действительно параллелен, но не учитывает последовательную зависимость между токенами. А авторегрессионную модель нужно гонять каждый раз для каждого токена. Отсюда предлагают гибридное решение — такую же параллельную тушку, как в DFlash, поверх которой обучают легковесный авторегрессионный модуль. Рассматривают два варианта: * 🔹 Простая линейная марковская голова (с малоранговым боттлнеком), которая принимает на вход прошлый токен. * 🔹 Небольшая RNN. Далее, основываясь на народной мудрости и опыте, делают два важных замечания: * 📈 Acceptance length сильно разнится между областями. У кода следующие токены более предсказуемы, и она больше; в диалогах — меньше. * 📦 Чем больше размер батча, тем меньше выигрыш от использования спекдека и тем более заметно ощущается стоимость верификации. Отсюда возникает идея обучить дополнительную голову, которая будет предсказывать, будет ли токен отринут или нет. За счет этого можно не утруждать таргет проверкой того, что наверняка не примется. Так как предсказания классификатора выдают уверенность выше, чем надо (overconfidence), полученные вероятности дополнительно калибруют на некоторой выборке. Оптимальные длины драфтов подбирают при помощи некоего жадного алгоритма. На вход подаются текущий размер батча, текущие длины драфтов и предсказанные уверенности, а на выходе — оптимальные длины, достигающие максимального throughput. 🧮 Лосс-функция состоит из трех членов: * 📌 Стандартная кросс-энтропия. * 📌 Total Variation между драфтом и таргетом. * 📌 Confidence Loss (бинарная кросс-энтропия). Итоговый лосс является взвешенной суммой всего перечисленного. 📊 Эксперименты Сначала тестируют предложенный подход на Qwen3-{4B, 8B, 14B} и Gemma4-12B против DFlash и EAGLE-3 в качестве бейзлайнов. DFlash и DSpark используют один и тот же параллельный бэкбон. Все модели обучаются на одних и тех же данных. ✅ У DSpark консистентно выше acceptance length (примерно на 16–18% по сравнению с DFlash). Далее авторы исследуют acceptance в зависимости от позиции и замечают, что DFlash более уверенно предсказывает первые токены по сравнению с EAGLE-3 благодаря более мощной модели, но acceptance rate токена падает с глубиной. У EAGLE-3 он может даже расти, но из-за меньшей точности на первых токенах драфта итоговая acceptance length оказывается меньше. DSpark же имеет хороший acceptance в начале, который еще и практически не убывает. Уже 2 слоя DSpark якобы не хуже 5 слоев DFlash. В качестве авторегрессионной части пробуют марковскую голову и RNN. RNN дает чуть больший acceptance, но имеет больший оверхед и сложнее в реализации, поэтому останавливаются на марковской голове. 📈 Повышение порога confidence (стоит ли вообще верифицировать данный токен) увеличивает acceptance length. Потом авторы масштабируют историю на DeepSeek-V4, и DSpark выдает заметно лучшее соотношение throughput/latency по сравнению с MTP-бейзлайном. ⚙️ Из технических сложностей стоит отметить невозможность работать с CUDA-графами из-за динамических размеров входов и сложности с Zero-Overhead Scheduling. Чтобы решить вторую проблему, используют verification capacity с двух шагов назад (ZOS требует знания размера батча заранее). 💡 Выводы Результат и наблюдения, безусловно, ценные — как любят и умеют делать ребята из DeepSeek. В основе метода все еще лежит DFlash, так что не стоит утверждать, что это принципиально новая парадигма. И у DFlash не так много ручек, которые нужно крутить, чтобы выжать максимальный перф.
ИИ🔥

ComfyUI запускает MCP-сервер для ИИ-агентов

Comfy MCP Комфиорг запустили бетатест MCP-сервера в комфи MCP дает ИИ-агенту возможность удобно управлять ComfyUI • запуск воркфлоу по описанию на естественном языке • поиск моделей, нод, шаблонов внутри экосистемы • подхватывание воркфлоу по URL • повторный прогон сохранённых схем на новых входах • сотни готовых воркфлоу с автообновлением Документация А также запускают бету Comfy CLI и репозиторий Comfy Skill для агентов #agent #comfyui #mcp #skill #cli
ИИ🔥

Дарио Амодеи о запрете доступа Китая к передовым моделям ИИ

У Дарио Амодеи очень жёсткая позиция: Китай не должен получить доступ к типовому ИИ. Его цитата:
«Это вопрос национальной безопасности США... Здесь всё предельно ясно, а контраргументы против этого выглядят подозрительно».
Полное интервью: https://www.youtube.com/watch?v=n1E9IZfvGMA @ai_machinelearning_big_data
ИИ

Интеграция ЮKassa через Claude Code в проект Lovarus

Год назад я говорил: «Никогда не доверю ИИ подключать платежную систему в моем проекте» Тем временем Opus 4.8 в Claude Code подключает Юкассу в один промпт уже во второй проект. Я перепроверял его несколько раз в новых сессиях, гонял разные секьюрити скиллы, чтобы убедится что мне никто не выкрутит баланс, и ничего, отличное рабочее решение. Да, в Lovarus теперь официально можно пополнять баланс российской картой и без VPN. Официальный релиз планируется 6 июля. В честь запуска будет стрим, на котором создам в Lovarus приложение для проведения розыгрышей, и с помощью этого приложения подарю 3 Telegram Premium, тем кто будет на эфире. Следите за анонсами.
ИИ🔥

Впечатления от первого полнометражного ИИ-фильма Hell Grind

Я посмотрел полнометражный ИИ-фильм в кинотеатре. Ниже мои впечатления.
Дисклеймер. 90-минутный фильм называется Hell Grind, сделали его мастера дерзкого маркетинга Higgsfield, между прочим первый казахстанский единорог (оценка >$1,3 млрд). Режиссер и сценарист: Айторе Жолдаскали и Адильхан Ержанов (двукратный участник основной программы Каннского фестиваля так-то). Весь продакшн занял 14 дней, бюджет 500K долларов.
В субботу в московском кинотеатре Октябрь Higgsfield AI собрали студентов и выпускников киношкол, различных ИИ-спецов, чтобы буквально захантить их на работу в новый ИИ-Голливуд. И показали им (нам), как тот будет выглядеть. Теперь к впечатлениям в коротких заметках. Впечатления: 1️⃣. Фильм повествует о лучших друзьях-грабителях, выросших в одном детском доме. Чуть Arcane вайбы. 2️⃣. Сразу бросается в глаза, что женские персонажи более дженериковые и искусственные. Главная босиха мутантов — скучная версия Шарлиз Терон, хотя две родинки над губой, это прекрасная деталь. 3️⃣. Лучшая сцена, как ни удивительно, это комедийный экшн в Тибете, где герои получают люлей от малышей-монахов; взрывают статую Будды, перед этим извинившись перед ней; сражаются с огромным каменным титаном: в эти моменты забываешь, что это нейронка — будто бы смотришь Uncharted или любой другой легкий стриминговый блокбастер. 4️⃣. Боевая сцена на минут 15 в конце — тоже супер, главный герой (спрятавшись в красные доспехи) отбивается от армии зомби. Увлекательно, даже боевая хореография имеется. 5️⃣. Сценарий, конечно, полная шляпа. Но, при этом, после просмотра эссе Патрика Виллемса Why Is Every Streaming Blockbuster So Bad?, у меня нет ощущения, что это шляпа из-за ИИ. Ощущение, что это буквально фильм формата Electric State, Bright, Fountain of Youth, Red Notice — то есть запредельно дорогих максимально продюсерских приключенческих фильмов от Netflix. 6️⃣. Только вот задача у Hell Grind другая — кроме того, что, как и в Netflix-экшнах, тут надо постоянно развлекать зрителя, у нейрокино от Higgsfield задача показать полный спектр — за 90 минут мы видим фэнтези, драму с мелодрамой, киберпанк в Гонконге, хоррор в японском лесу, эпический экшн в заснеженном поле. Короче, это буквально — смотрите, что мы умеем. Сценарий — это промо стартапа. 7️⃣. Интересно, как одновременно это нейрокино похоже на Netflix своей дженериковостью — идеальными персонажами, комфортным ритмом, универсальным приключено-боевиковым жанром, и в то же время на японское и корейское кино — демоны, жестокость, преувеличенные эмоции. 8️⃣. Главный вопрос: работают ли эмоции? На уровне — грустные дети-сироты или воспоминания главного героя — вообще, да. Абсолютно никаких вопросов. На уровне — главный герой убивает своих друзей — вообще никак. Но, что становится ясно, дело — в сценарии. 9️⃣. А какие тут шикарные финальные титры. Вывод. Я увидел средний Netflix-блокбастер. И это, если честно, меня абсолютно убедило в том, что ИИ-кино на подходе. Вообще никаких сомнений. Вопросы у меня были не к картинке, не к эмоциям персонажей, а конкретно и только к сценарию. Нет абсолютно никаких проблем сделать качественное кино с помощью нейросетей и оно точно будет. Это возможно. Да, конечно, я и так это понимал, но сейчас увидел своими глазами. Я выходил из кинозала и ощущал будущее кинематографа. Так что ждем. 2027 — будет годом не одного и не двух нейроблокбастеров (и нескольких инди-проектов или драм тоже). И, скорее всего, стриминги, как только смогут, подхватят эту возможность. Потратить 300 миллионов долларов или 5 миллионов, из которых на продакшн уйдет 500к? Ответ очевиден. P.S. А в воскресенье мы с женой Сашей посмотрели «Танцующие под дождем» 1952 года — мюзикл о появлении звукового кино: страхах индустрии, падении актеров немого кино, большой революции в Голливуде. Не планировали, так совпало. P.P.S. Higgsfield также выложили 20-минутный перемонтированный кусочек фильма, посмотреть можно тут, но мои пиратские экранки передают то самое ощущение из кинозала (жаль, тибетскую сцену со статуей Будды не снял).
ИИ🔥

Исследование Meta: расшифровка мыслей через магнитоэнцефалографию

Исследователи из запрещенной Meta опубликовали подчеркнуто академическую работу в которой экспериментально показали возможность ИИ-расшифровки магнитоэнцефалограмм людей, набирающих текст в уме. Хотя это пока чисто исследовательская работа, даже не упоминающая возможности практического применения или сроки воплощения, она служит очень веским доказательством важного тезиса: перевод мозговой активности в текст со вполне приемлемым уровнем точности возможен без использования каких-либо инвазивных технологий типа Neuralink (или многочисленных аналогов, каждый из которых требует нейрохирургического вмешательства в той или иной степени). Хочется верить, что полученные результаты приближают появление (пусть и далеко не завтра) потенциально массовых интерфейсов мозг-компьютер — потому что в массовое согласие здоровых людей на нейрохирургию ради улучшения связи с цифровым миром я не верю совсем. https://www.nature.com/articles/s41593-026-02303-2
ИИ

Яндекс тестирует платформу для создания ИИ-агентов в Алисе

«Яндекс» начал внутреннее тестирование платформы для создания ИИ-агентов в «Алисе AI», сообщили коллеги с vc.ru. Сторонний бизнес получит доступ к функционалу позднее в 2026 году. https://dtf.ru/software/5156581
ИИ

AI Hardcore Day в офисе Авито

Идём на AI Hardcore Day в офис Авито на Лесной 11 июля! 🤩 Будем слушать доклады о Spec-Driven Development, разработке и тестировании MCP, атаках на GenAI-агентов. А после — нетворкать на террасе. ⚡ Регистрация и подробности — по ссылке. Кстати, доклады будут не под запись — советуем не пропускать!
ИИ

Cursor выпустил мобильное приложение для iOS

Вайбкодеры, радуемся: Cursor завезли на iOS 😨 Теперь агентов можно запускать и управлять ими прямо с телефона. Приложение будет присылать уведомления, когда нейропомощник закончил работу или ждёт вашего ответа, так что можно спокойно гулять и вайбкодить одновременно. Наконец-то 👍
ИИ🔥

Cursor для iOS: облачные агенты и удаленное управление

Cursor for iOS • запуск облачных агентов с выбором frontier-моделей • Remote Control для агентов на ПК • голосовые идеи, slash-команды, скриншоты как контекст • Live Activities и пуш-уведомления о статусе • артефакты: демо, логи, скриншоты для валидации • перенос задач между локалом и облаком • планы на repo-less чаты и интеграцию с MCP Публичный бета-релиз, доступно на платных тарифах iOS #coding #ios #mobile
ИИ🔥

Эффективность локальных LLM для разработки: стоит ли игра свеч?

Qwen 3.6 27B is the sweet spot for local development или нет? https://quesma.com/blog/qwen-36-is-awesome/ https://news.ycombinator.com/item?id=48721903 Увидел я тут очередной пост про то, как же хорошо гонять локальные модели. Автор запустил модель локально с помощью llama.cpp с квантизацией в 8-bit на Macbook Max M5 120 Gb. И вот я ну никак не могу с этим всем согласиться. Первое, и самое главное, это качество. Qwen неплох, но он намного хуже frontier-level моделей, особенно при квантизации. Я недавно рассказывал как пробовал minimax - ему было очень далеко до клода/кодекса. Кроме того, современная разработка с помощью AI - это про агентов, agentic workflows. Из условно-открытых моделей вроде такое только GLM может. И есть ещё вопрос стоимости. Macbook Max M5 120 Gb стоит несколько тысяч долларов. Это годы подписки на клод/кодекс. Да, можно сказать, что такую мощную машинку можно много для чего использовать. Но так ли это надо? Сомневаюсь. И даже при такой переплате качество будет заметно хуже топовых моделей #ai
ИИ

Cursor выпустил мобильное приложение для iOS

Вайбкодеры, радуемся: Cursor завезли на iOS 😨 Теперь агентов можно запускать и управлять ими прямо с телефона. Приложение будет присылать уведомления, когда нейропомощник закончил работу или ждёт вашего ответа, так что можно спокойно гулять и вайбкодить одновременно. Наконец-то 👍
ИИ🔥

Cursor выпустил публичную бета-версию мобильного приложения

Cursor выпустил публичную бета-версию iOS-приложения. Пользователи смогут запускать агентов и управлять ими, получать уведомления об обновлениях, использовать Remote Control для управления агентами, запущенными на компьютере, и выполнять другие действия со смартфона vc.ru/ai/3002974
ИИ🔥

ComfyUI интегрировали с AI-агентами через MCP

✴️ ComfyUI отдала свои пайплайны агентам - собирать графы теперь можно словами Вышла публичная бета Comfy MCP: Claude, Codex, Cursor и Hermes подключаются к ComfyUI и строят пайплайны генерации на естественном языке. Ноды, графы и GPU - по желанию, можно вообще их не видеть. Возможности: ✧ Собирает, правит и запускает workflow, ищет модели и шаблоны ✧ Сохраняет пайплайн и гоняет его на новых данных без ручной правки графа ✧ Делится workflow по ссылке: агент коллеги запустит его, не разбираясь в нодах Главная ставка не на скорость, а на 100% воспроизводимость - это заявка на командное production, а не на разовые картинки. Правда, «без GPU» значит, что считает облако Comfy, а про цену пока молчат. 🔗 Что внутри и где в бете тонко → ссылка #comfyui #mcp
ИИ🔥

Вышло нативное приложение Cursor для iPhone

📱 Cursor переехал в карман - теперь агентов гоняют с айфона Anysphere выпустила нативное приложение Cursor для iPhone (открытая бета). Поставил задачу из спортзала - принял пул-реквест по дороге домой. Что умеет: ✧ Запуск облачных агентов и Remote Control над агентом на твоём компьютере ✧ Передача задачи туда-обратно: локальная машина ↔️ облако ✧ Пуши и Live Activities: апнул, когда агент готов к ревью - можно слить PR прямо из приложения Сценарии у самой Anysphere все про оперативку: дежурство, баги клиентов, правки по жалобам из соцсетей. Под длинные творческие задачи это пока не про то. 🔗 Разобрали, что умеет, кому доступно и где подвох #cursor #ios
ИИ🔥

ComfyUI запускает MCP-сервер для ИИ-агентов

Comfy MCP Комфиорг запустили бетатест MCP-сервера в комфи MCP дает ИИ-агенту возможность удобно управлять ComfyUI • запуск воркфлоу по описанию на естественном языке • поиск моделей, нод, шаблонов внутри экосистемы • подхватывание воркфлоу по URL • повторный прогон сохранённых схем на новых входах • сотни готовых воркфлоу с автообновлением Документация А также запускают бету Comfy CLI и репозиторий Comfy Skill для агентов #agent #comfyui #mcp #skill #cli
ИИ🔥

Смена лидерства: переход на китайские LLM

Недавно вышла аналитика что usage американских моделей упал на 40% Они анализировали потребление токенов в OpenRouter: 2025 год: 70% трафика приходилось на модели из США, у Китая около 20% 2026 год: доля американских моделей упала до 30%, Китайская выросла до 50% Люди стали чаще выбирать китайские дешевые модели Решил посмотреть через MCP OpenRouter какой стек на китайцах можно собрать (если US Government заблокирует все модели (°□° )):
1. Код Opus 4.8GLM 5.2 разница в бенчмарках: ~8% цена: в ~5 раз дешевле 2. Циклы агентов + вызов инструментов GPT-5.5GLM 5.2 разница в бенчмарках: ~3% цена: в ~5 раз дешевле 3. Массовые задачи GPT-5.4 miniMiMo V2.5 разница в бенчмарках: ~0% цена: в ~7 раз дешевле 4. Генерация изображений GPT-Image-2Seedream 4.5 разница в бенчмарках: ~10% цена: в ~2 раз дешевле 5. Генерация видео Veo 3.1Kling 3.0 разница в бенчмарках: 0% цена: в ~2 раза дешевле за секунду
Клод посчитал что экономия ~60-75%, но и качество упадет на 7-10%. Поделитесь, кто какие открытые модели под какие задачи гоняет? Интересно 😏 @tips_ai #news
ИИ🔥

Anthropic выставила клиентам лишние счета на $1,7 млн

Аудит счетов клиентов Anthropic выявил ошибки в инвойсах: около $1,7 млн были ошибочно начислены сверх нужной суммы. Лора Брэттон из The Information объясняет, как такое могло произойти: «Возможно, AI-агент продолжал повторять задачу, которую выполнял неправильно, а клиент не замечал, что агент снова и снова делает новые попытки. И за каждую из этих попыток ему продолжали начислять оплату». @ai_machinelearning_big_data
ИИ🔥

Анонс участия команды Nebius в конференции ICML

На следующей неделе я буду на ICML, в том числе презентовать с командой постеры по нескольким принятым работам: LK Losses и SWE-rebench V2. Приходите к нам на стойку Nebius, на постеры или просто пишите, если хотите выпить кофе и познакомиться В этот раз мы решили провести after-party 9-ого числа https://luma.com/y5x82rk1, с едой, напитками, тихой музыкой и интересными разговорами. Мы приедем большой компанией и можно будет пообщаться с ребятами из ресерча/инжиниринга, обсудить все от агентских пайплайнов, стабильности MoE в RL до кернелов и низкоуровневых оптимизаций LLM инференса. Если вы глубоко погружены в LLM, inference optimization, pre/post-train, agentic evals, environments, agentic harnesses и прочие релевантные темы, то будет здорово вас увидеть. Мест у нас немного, поэтому конечно сможем позвать далеко не всех
ИИ🔥

Илон Маск приобрел стартап Mesh Optical для нужд xAI

Илон Маск купил стартап Mesh Optical для сетевой инфраструктуры своих ИИ-проектов Федеральная торговая комиссия США (FTC) одобрила сделку по покупке Илоном Маском компании Mesh Optical Technologies Corporation по ускоренной процедуре. Финансовые условия соглашения стороны не раскрывают. Стартап Mesh Optical был основан в прошлом году тремя бывшими инженерами SpaceX, которые ранее создавали лазерные каналы связи для спутников Starlink. Покупка должна решить проблему сетевых задержек в дата-центре компании xAI в Мемфисе, где развернута одна из крупнейших ИИ-вычислительных платформ. Сделка позволит Маску отказаться от аутсорсинга компонентов от Broadcom или Coherent и перейти на собственные оптические решения. Флагманский трансивер стартапа под названием Alpha C1 обеспечивает скорость передачи данных 1,6 Тбит/с. Устройство выполнено в стандартном форм-факторе OSFP и работает с одномодовым оптоволокном на расстоянии до 5 км.
ИИ🔥

Влияние ИИ на продуктивность разработки: отчет Faros.ai

От подписчика: Отчет Faros.ai про реальные цифры продуктивности разработки с ИИ. Ну... Не все так однозначно... Это реальные метрики кода от требований до доставки. Выборка – 4000 команд за 2 года, сравнение внутри одних и тех же компаний между кварталом минимального и максимального использования AI. Главные цифры: – Продуктивность отдельного разработчика выросла, но скромно, судя по merge requests. Примерно +16 процентов, а не 10x – При этом скорость доставки релизов упала на 11 процентов. Это системная метрика, она про доставку ценности клиенту – Поток замедлился на каждом шаге. Фича проходит каждый этап на 80–480 процентов дольше – Качество просело резко: дефекты вверх, переоткрытые тикеты вверх, code churn (доля переписанного кода) – аномальные 861 процент Узкое место сместилось в ревью. Стадии Ready for Review и In Review раздулись, а ревью стали пропускать на 31 процент чаще – классическое поведение людей на бутылочном горлышке. Сам Faros пишет прямо: организации генерируют больше кода, чем система способна отревьюить и смержить. Автор гоняет данные через закон Литтла (L = λW). Если лид-тайм и WIP растут быстрее, чем заявленная продуктивность – значит скорость потока на самом деле падает. По его расчётам реальная пропускная способность просела на 8–70 процентов в зависимости от допущений. То есть «продуктивность индивидуального разработчика» и «поток готовых фич» поехали в разные стороны, а платят клиенты именно за второе. Тойота в своё время победила американский автопром фанатичным фокусом на качестве и принципе «не передавай дефект на следующую станцию». Чем позже находишь баг, тем дороже он стоит системе. LLM делают ровно наоборот: впрыскивают больше дефектов на входе и переносят их отлов в ревью, где ловить дороже и хуже. Любопытная деталь: гипотеза «AI усиливает сильных» не подтвердилась. High-performing команды деградируют так же, как все остальные. Тут есть с чем спорить по методологии – это наблюдательное исследование, не причинно-следственное, и автор сам это признаёт. Но направление мне кажется честным и совпадает с тем, что многие из нас чувствуют на практике: индивидуальная скорость растёт, а на уровне организации профита не видно. Главная мысль, productivity не равно value. Локальный разгон одного этапа не двигает систему, если узкое место в другом месте. Если внедряешь AI в команду и не перестраиваешь ревью и QA под возросший объём генерации – ты просто переносишь бутылочное горлышко вниз по потоку и копишь work in progress. И отдельно зацепил тезис про «сначала черновик от LLM, потом доработаю». Автор считает, что это задом наперёд: первый черновик – это и есть твой интеллектуальный вклад, момент, когда ты реально продумываешь структуру. LLM сильна как редактор и спарринг после, а не вместо мышления. С этим скорее согласен - чем больше вложений на первых этапах, тем лучше результат. Короче, уделяйте МАКСИМАЛЬНОЕ внимание требованиям, а не пытайтесь зафигачить 100 фич и отдать все тестировщикам. Источник: https://unessays.substack.com/p/talk-is-cheap
ИИ

Будущее ИИ: противостояние корпоративных и человекоцентричных агентов

S0419 О солнце, выходящем из облаков 25 июня 2026 | Красная Поляна | 4.19 Сейчас. Я смотрю на солнце, которое закатывается за горы. Возвращаю взгляд на экран ноутбука, где открыта анкета найма на новую должность. Четыре часа назад. Я выхожу на улицу, надеваю солнечные очки и смотрю на высокое солнце в горах. Моя миссия на сегодня, да и целом в MWS Cloud, выполнена. Еще двадцатью минутами ранее. Аплодисменты в зале, затем люди задают вопросы про то, как будут монетизироваться AI-приложения и когда ждать рекламы в выдаче ИИ. Я отвечаю, что уже сейчас 15% пользователей ChatGPT получают рекламу в выдаче. Говорю, что те кто выбрал монетизацию через рекламу, они на стороне корпоративного ИИ, они выбрали одну из двух сторон, о которых я говорил ранее. Еще двадцатью минутами ранее. На сцене, рисую картину будущего, где две стороны будут строить свои искусственные интеллекты. На левой стороне ИИ будет получить деньги от корпораций за то, что он будет выжимать из клиентов все больше денег через новые хитроумные механики манипуляций. На правой стороне, ИИ будет человекоцентричным, он будет получать плату напрямую от человека и он будет взаимодействовать с корпоративным ИИ. И нет, агенты с двух сторон не договорятся, они будут пытаться обойти друг друга и использовать такие механизмы достижения консенсуса, которые нам даже не представляются в общих чертах. И это и будет основой "новой экономики". Еще двадцатью минутами ранее. Мне надевают петличный микрофон. Я смотрю на предыдущего спикера, СЕО ИТ-туроператора. Он завершает свой рассказ о новой платформе для турфирм. Вопрос из зала - а вот у нас стартап и мы строим ИИ, дайте прямой доступ к вашей платформе через API, минуя интерфейсы платформы, это возможно? Волна сомнений на лице спикера, он уходит от вопроса, ссылается на то, что надо подумать, что всё зависит от объема запросов. Вот оно, главное событие дня. В этом простом вопросе из зала - глубокий знак того, что ИИ выходит из облаков и становится самостоятельной сущностью. Знак того, что большая игра между сущностями ИИ началась. Сингулярность грядет.
ИИ

Анонс Yandex AI Studio Series Summer Edition

❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️ 16 июля стартует Yandex AI Studio Series Summer Edition — событие для разработчиков, ML/ИИ-инженеров, продуктовых менеджеров и бизнес-аналитиков, которые создают ИИ-агентов и комплексные системы автоматизации. Эксперты Яндекса разберут лучшие практики разработки ИИ-приложений корпоративного уровня и покажут, как довести идею до рабочего решения. В программе — управление контекстом и памятью в агентских API, создание голосовых агентов на Realtime API, разработка ИИ-ресёрчера с поиском в интернете и по базе знаний, а также построение мультиагентских систем для end-to-end автоматизации процессов. Участников ждет две недели, насыщенных контентом: — PRO-вебинары с разбором архитектуры современных ИИ-систем; — практические кейсы по работе с LLM, агентскими API и инструментами, MCP; — интенсивы для самостоятельной практики и закрепления знаний; — обзор новых возможностей Yandex AI Studio и планов развития платформы; — архитектурные доклады и воркшоп от ведущих разработчиков. Лучший способ разобраться в современных ИИ-инструментах — увидеть, как их применяют на реальных проектах. Присоединяйтесь к Yandex AI Studio Series и регистрируйтесь на событие.
ИИ🔥

Создание 4-минутного AI-фильма: опыт и инструменты

#Нейропрожарка «Треугольник Пенроуза / Triangle of Penrose» Авторский AI-film project. Сюжет: Канадский наёмник ЧВК Blackwater/Academi из Торонто отправляется на спецзадание в горы Ирана. Обычная военная операция постепенно превращается в суровое испытание... Автор: Илья Малахов / Malahov.Tech Срок: 80+ часов работы Мой эксперимент в формате кинематографичного Surreal survival action с одним главным героем. Хотел проверить, насколько реально собрать связный AI-ролик продолжительностью более 4х минут с единым персонажем, атмосферой, военным реализмом и сюрреалистической историей. 🎬💀 По инструментам: Изображения — Nano Banana / ChatGPT / Recraft Анимация — Seedance 2.0 (тесты в Kling, Runway, Luma и VEO - не пригодилось, ибо так же цензурировано) Звук — Suno / ElevenLabs Монтаж — Movavi (к чему привык к сожалению) Апскейл — Topaz (небольшие куски, база 720р) Головная боль проекта — консистентность. Герой, лицо, нож, ножны, кобура, магазины, жилет, шлем, элементы амуниции — всё это приходилось постоянно вшивать от кадра к кадру, учиться и переделывать. В одном из первых референсов изначально была ошибка одного из ракурса рефа лица, поэтому на некоторых крупных планах у героя лицо местами восковое (сразу не заметил, потом было поздно). Многие первые тестовые кадры позже ушли в топку именно из-за отсутствия консистентности. Долгая часть проекта — сценарий, переписывался 6 раз. Изначально стояла задача добиться максимальной скорости производства, но всё равно вышло долго. Следующая цель — научиться делать 1 минуту видео примерно за 3 часа: от идеи до финала. Не за счёт упрощения, а за счёт грамотного системного алгоритма действий. Интересно ваше мнение, на что в следующий раз обратить внимание?🖤🌫 @cgevent
ИИ🔥

Дайджест новостей AI: чипы OpenAI, новые модели и инструменты

Ключевое за 3 дня ⚡ ГлавноеOpenAI + Broadcom: чип Jalapeño — ASIC для AI, разработанный за 9 месяцев с помощью нейросетей. • OpenAI запускает серию GPT-5.6 для ограниченной аудитории — Релиз семейства моделей с флагманской версией Sol. 📈 Рост и ОптимизацияУскорение Gemini Nano на Pixel — Применение Frozen Multi-Token Prediction для работы на мобильных устройствах. • Модели вознаграждения слишком чувствительны — Метод кластеризации наград от Meta для защиты от reward hacking. • Экономический индекс Anthropic за июнь 2026 — Аналитика корреляции вычислительных затрат AI и экономической ценности. • Отчёт о ценах на память от Stanford — Данные о динамике стоимости систем хранения и памяти. 🛠 ИнструментыRecall — Инструмент создания базы знаний и поиска по прочитанному через API. • PrompTessor — Рабочее пространство для генерации, оценки и оптимизации промптов. • Serno — AI-анализ бизнес-решений для поиска противоречий и слепых зон. • Cursor — Редактор кода с функциями автоисправления багов и генерации по инструкциям. • Leapd — Платформа для автоматизированного управления бизнес-процессами 24/7. • ByThen — Сервис для создания видео без участия реальных актеров. • Cocodly — Инструмент для разработки веб- и мобильных приложений с помощью AI. • Qwen Image Agent — Модель с улучшенной генерацией изображений через систему планирования. • Google тестирует коллекции для NotebookLM — Новый функционал для группировки рабочих блокнотов по темам.
ИИ🔥

Анализ бенчмарков для моделей с длинным контекстом

🧐#paperwatch Бенчмарки по длинному контексту-2026: что не учтено? В новом выпуске #paperwatch Денис Шевелев разбирает особенности бенчмарков длинного контекста: ✔️отход от буквального соответствия needle-тестов; ✔️то, как реагируют создатели тестов на расширение контекстного окна; ✔️способы борьбы с насыщением и т.д. 👀YouTube #paperwatch
Ещё ↓