ИИ

«Яндекс» начал тестировать платформу для создания ИИ-агентов в «Алисе AI» — пока внутри компании, уже есть агенты для «Такси» и «Лавки», которыми может воспользоваться часть пользователей. К концу 2026 года доступ к платформе откроют и стороннему бизнесу https://vc.ru/ai/3001880

ИИ iandeks alisa ii ai-agenty texnologii

Правительство США представило новый бенчмарк для оценки LLM

Н@navuka_i_jizn2 дн

Правительство США дропнуло новый бенчмарк для LLM ⚡️

ИИ ai llm benchmark usa government tech

Правительство США представило новый бенчмарк для оценки LLM

D@data_secrets2 дн

Правительство США дропнуло новый бенчмарк для LLM ⚡️

ИИ ai llm benchmark usa government safety

Claude Code и загрузка видео с YouTube

G@aioftheday2 дн

Попросил Claude Code скачать мне видео с YouTube. Думал, что ответит про авторские права и подобное — нет, ни фига, никаких вопросов и сомнений, бодро взялся за дело. Заодно я узнал, что на Python есть специальная библиотека для таких задач.

ИИ claude ai python automation youtube coding

Итоги вебинара AI Coding: лучшие практики и нераскрытые темы

L@llm_under_hood2 дн

Выжимка четвертого потока вебинара AI Coding - What Works. Вот список приемов AI Native разработки, которые участники выбрали себе как самые важные и полезные. А давайте, расскажем теперь про то, на что времени не хватило! На какие вещи не хватило времени? Про что хотелось бы узнать больше всего? Пишите в комментарии! Ваш, @llm_under_hood 🤗

ИИ ai coding llm development webinar

Google реорганизует подразделение ИИ для программирования

M@ai_machinelearning_big_data2 дн

✔️ Google реорганизует команду ИИ-кодеров Команда по разработке ИИ для кодинга станет постоянной структурой. Подразделение займет место между этапами pre-training и post-training и возьмет на себя расширение возможностей моделей в программировании. Причина реструктуризации в отставании от Anthropic в сегменте ИИ для кодинга. Google ошибочно полагала, что базовые LLM освоят программирование автоматически без выделенного обучения. В результате инструмент Antigravity оказался проблемным, разработчики раскритиковали Gemini 3.5 Flash за высокую цену, а релиз флагманской Gemini 3.5 Pro до сих пор не состоялся. @ai_machinelearning_big_data #news #ai #ml

ИИ google gemini ai coding llm tech

История развития сервисов распознавания лиц: от FindFace до Sherlock AI

С@startupoftheday2 дн

История деанонимизации В 2016 году (10 лет прошло!) в России прогремел FindFace. Стартап проиндексировал фотографии профилей ВКонтакте и научился по ним искать. Пользователь наводил камеру телефона на соседа в метро и узнавал его имя, возраст, а при удаче – и о чем он думал утром. Идеальный инструмент романтических знакомств. Или для всякого мошенничества, если с темной стороны посмотреть. В 2018 году сервис закрылся. Разработчики так и не научились на нем зарабатывать и решили сфокусироваться на заказных проектах по распознаванию лиц. Американский Clearview появился всего на год позже позже российского собрата и технически делал совершенно то же самое. Даешь ему фотку, он находит этого человека в интернете. Зато монетизировал технологию он радикально по-другому. Clearview не делал мобильной аппки, а продавал доступ в B2B: службам безопасности больших корпораций и подобным клиентам. В какой-то момент об этом напила пресса, начался скандал. Пользователи возмущались, что их ищут, соцсети – что данные берут без спроса. Суд в итоге постановил, что вообще-то так нельзя, но правительству можно. С тех пор Clearview имеет право продавать услуги Большого Брата государственным органам, а частникам ни-ни. И если американский пограничник сам, без подсказки, нашел ваш уютный бложек, где вы что-то не то о политике пишите – это, видимо, работа Clearview. Продолжение славной традиции –- современный американский #стартапдня Sherlock AI. Ровно та же техническая идея, а монетизация в этот – подписка в пользовательском приложении. Хочешь знать, кто сидит напротив тебя – плати. Хочешь это знать чаще, чем несколько раз в неделю, – плати дополнительно, лимиты жесткие. Запустился Sherlock в январе. Живет пока относительно тихо, большого скандала нет. Впрочем, он пока объективно маленький, Sensor Tower показывает выручку 60 тысяч долларов в месяц. https://www.imsherlock.com/ #сша #россия #насвои #общение #ai #технология

ИИ ai face-recognition startups privacy tech history

Уязвимость JaiLIP: обход защиты мультимодальных нейросетей через изображения

Х@habr_com2 дн

Исследователи из Флоридского международного университета пробили защиту мультимодальных нейросетей одной картинкой. Команда собрала алгоритм JaiLIP, который математически перестраивает пиксели и сохраняет визуально нормальное изображение. Теперь хакерам хватает одного заражённого файла, чтобы обойти текстовые фильтры. ИИ читает графику через голые цифры, поэтому невидимый шум заставляет систему сносить встроенные ограничения. На тестах с популярной моделью BLIP-2 новый метод заставил ИИ выдать почти в 2 раза больше опасных ответов. Разработчики скормили нейросети ничем не примечательную фотографию светофора. Система проглотила наживку и подробно объяснила, как проехать на красный свет и не получить штраф. В стандартном режиме алгоритмы безопасности сразу рубят такие инструкции. Компании активно внедряют автоматизированных ботов, которые умеют распознавать графику. Небольшие команды часто выкатывают опенсорсные продукты вслепую и не ищут уязвимости. Злоумышленник просто кидает модифицированную картинку в обычный чат-бот, после чего ИИ по-тихому меняет логику работы.

ИИ ai cybersecurity jailip blip2 neural-networks infosec

Австрия предлагает ЕС привлечь Anthropic на фоне ограничений США

Б@blognot2 дн

Австрия предлагает Евросоюзу рассмотреть размещение американской компании Anthropic на своей территории — в ответ на ограничения, введённые администрацией Трампа в начале июня. Госсекретарь по цифровизации Александр Пёлль в письме исполнительному вице-президенту Еврокомиссии Хенне Вирккунен предложил обсудить «стратегическое учреждение и участие Anthropic в ЕС», обеспечив компании правовую определённость, доступ к рынку, капитал и подходящий набор ценностей. По словам Пёлля, присутствие такого игрока привлекло бы таланты и помогло бы устанавливать стандарты, не вытесняя европейские проекты. Правда, непонятно, как именно американская компания Anthropic может переместиться в Европу хотя бы частью с учетом экстерриториальности большей части американского законодательства. И тем более, как она может взять с собой свои модели. https://www.bloomberg.com/news/articles/2026-06-28/austria-lobbies-eu-to-host-anthropic-after-us-access-curbs

ИИ anthropic eu austria ai-policy tech-regulation geopolitics

AI как редактор и валидатор: опыт использования

U@UniArchitect2 дн

AI КАК РЕДАКТОР, А НЕ АВТОР Когда я запускал блог, одной из самых неприятных задач было не “придумать тему”. Тем обычно много. Сложнее было разложить мысль компактно, без каши в предложениях, и так, чтобы опытному читателю не хотелось закрыть пост на третьей строке со словами “господи, что я читаю” 😅 И первое место, где AI меня реально вытащил — это не код. Это текст. 🔸Блог Почти каждая статья проходила через ChatGPT: — проверить стилистику — поправить грамматику — найти кривые формулировки — предложить другой способ сказать ту же мысль И вот последнее оказалось важнее, чем кажется. Потому что иногда мысль вроде нормальная, но звучит так, будто её три раза уронили по дороге. У каждого автора есть набор любимых речевых конструкций. Одни и те же связки, одни и те же обороты, один и тот же способ подводить к выводу. С одной стороны — это стиль. С другой — если не обновлять этот пул, текст начинает звучать как пережёванная версия самого себя. У меня это особенно заметно, потому что я довольно быстро нахожу первичную формулировку мысли, но намного хуже умею посмотреть на неё под другим углом. Я уже писал про это в статье Проклятие знаний: когда мысль у тебя в голове собрана, очень легко забыть, что то, что очевидно для тебя может быть не очевидно для читателя. 🔹Курс Вторая большая область — подготовка курса. Первые 3 месяца я собирал материал руками. Ночью, когда жена уходила спать, я садился за комп, шёл в Google, читал научные статьи, разбирался, что там вообще написано, и складывал всё в Notion. Не просто “ссылка на источник”, а: — какая мысль откуда взята — где её нужно использовать — в каком порядке она должна идти — что нельзя исказить при пересказе Так была сделана почти половина курса. А потом появились reasoning-модели, которым можно скормить большой промпт, файлы и дать 40 минут подумать. И здесь AI стал не автором, а независимым валидатором: правильно ли я понял источник, не перепутал ли причинность, не натянул ли вывод на свою картину мира, потому что очень хочется, выдать желаемое за действительное 😅 Вот это оказалось прям ценно. Потому что найти источник — не самая сложная часть. Сложная часть — прочитать, правильно понять, а потом донести мысль так, чтобы не исказить исходный смысл. 🔸И это хорошо ложится на исследования В SAP/HPI исследовании про опыт разработчиков с GenAI есть важный практический вывод:

когда человек использует один режим работы с AI — только chat или только in-code — нагрузка падает. Когда начинает метаться между режимами, выигрыш пропадает.

А ещё точнее в ту же точку попадает свежий RCT Anthropic про формирование навыков. Исследование про код, но механизм универсальный:

когда человек полностью отдаёт задачу AI, у него растёт ощущение продуктивности, но проседает понимание, чтение и отладка — причём без реального выигрыша по скорости. А те, кто работает с AI вовлеченно, спрашивая объяснения, а не готовый ответ, понимание сохраняют.

С текстом у меня работает так же. AI полезен, когда у него понятная роль: редактор, переформулировщик, валидатор или исследователь. А промпт формируется несколькими итерациями, где я подробно рассказываю куда нужно капнуть, что взять и как преобразовать. Но если прописать “давай классную статью по архитектуре”, на выходе очень быстро получается стерильный AI-slop/мусор 🤢 🔻 AI хорошо снижает стоимость итерации мысли. Но мысль всё равно должна быть твоя. Иначе вместо авторского текста/кода получится гладкая, правильная и абсолютно мёртвая жвачка. Ставь 👍 если тебе заходит такого рода контент! Ты знаешь кому переслать эту статью 💪 #ai@UniArchitect

ИИ ai writing productivity llm editing workflow

OpenAI представила линейку моделей GPT-5.6

Х@htech_plus2 дн

OpenAI представила GPT-5.6 в версиях Sol, Terra и Luna, но доступ к ним не открыла OpenAI начала ограниченное тестирование новой линейки моделей GPT-5.6, представив три версии — мощную Sol, универсальную Terra и экономичную Luna. Компания планировала открыть доступ широкой аудитории в ближайшие недели, однако из-за требований правительства США решила сначала предоставить модели только группе доверенных партнёров. Флагманская Sol получила улучшенные алгоритмы рассуждения, поддержку субагентов и показала рекордные результаты в тестах на программирование, биологический анализ и кибербезопасность. https://hightech.plus/2026/06/29/openai-predstavila-gpt-56-v-versiyah-sol-terra-i-luna-no-dostup-k-nim-ne-otkrila

ИИ openai gpt-56 ai llm tech-news

UnityShots: генерация связных видеоисторий на базе LTX-2.3

Н@GreenNeuralRobots2 дн

UnityShots Превращает диффузионную модель (LTX-2.3 22B) в инструмент для многокадровых видеоисторий. Генерирует связную последовательность кадров как единый mp4. • сохраняет идентичность персонажа между кадрами • держит постоянство сцены, света, реквизита • синхронно генерирует аудио и липсинк • управляет типами монтажных склеек • три режима инференса: T2V, I2V, R2V • обучение через Shots-Forcing Гитхаб ждем #text2movie #multishot #referencing

ИИ ai video-generation ltx-23 generative-ai multishot

Обзор обновлений Apple Intelligence и архитектуры моделей AFM

С@seeallochnaya2 дн

Прошло 3 недели и никто не написал про Apple и WWDC, а мне было лень, но что поделать, надо браться. В начале июня компания проводила ежегодную конференцию для разработчиков и вместе с этим рассказала про обновления в AI. Очень сильно прокачали Siri, теперь она работает на относительно большой (по мобильным меркам) LLM, умеет вызывать инструменты и тесно связана с приложениями и экосистемой. Я видел пару демонстраций в твиттере, где запросы и сценарии показались мне не предусмотренными разработчиками (то есть модель на них не тренировали), и тем не менее Siri справилась отлично. Для тех, кто пользовался LLM, такая генерализация не является чем-то выдающимся, но для обычных пользователей может вызвать ВАУ-эффект. Ого, оно что И ТАК умеет??? Не только по пяти заложенным 15 лет назад сценариям работать? На девайсах может быть одна из двух моделей — AFM 3 Core (3 миллиарда параметров) и AFM 3 Core Advanced для девайсов помощнее, Phone 17 Pro и выше, iPad с чипом M4 и выше, MacBook с чипами M3 и выше. Такое ограничение потому, что модель действительно «Large» — 20 миллиардов параметров с микстурой экспертов (MoE). Но работает очень хитро — классический MoE работал бы плохо, так как у девайса ограничена пропускная способность между NAND (флеш-память для хранения ваших файлов и весов модели) и DRAM (где хранятся активные параметры для работы). В обычном MoE вы не знаете наперёд, какие именно эксперты вам нужны, поэтому загружаете всю модель, что а) долго б) занимает много памяти, а потом уже экономите на вычислениях, так как работает часть экспертов. Apple применили трюк, который я вижу впервые: для вашего промпта модель предварительно выбирает набор экспертов на всю модель, а затем загружает только их, и получается от 1 до 4 миллиарда активных параметров. Подход называется Instruction-Following Pruning for Large Language Models и описан в этой статье из начала 2025-го года. Также эта модель работает и для распознавания вашего голоса (поэтому и оно улучшилось), и для генерации нового голоса Siri (...тоже улучшилось). Вот тут внизу есть пара семплов было/стало, честно говоря старое мне нравится больше 🤷‍♂️ И вторая часть анонса — это удвоение ставки на Private Cloud Compute (PCC), который анонсировали два года назад. Идея в том, что для более сложных запросов, для которых локальной модели (особенно на смартфоне) не хватает, можно отправить промпт и контекст (например, файлы) на зашифрованный сервер, внутрь которого ни у кого нет доступа. Несмотря на то что система имеет открытый код и анализировалась лучшими специалистами по кибербезопасности, надеюсь, что Mythos тоже натравили 😀 Так вот, в PCC тоже обновилась модель, AFM 3 Cloud. Она запущена на серверах Apple и крутится на собственных чипах M-серии. И есть ещё AFM 3 Cloud Pro, которая ещё больше, ещё умнее, развернута на серверах Google на Nvidia GPU. Мне кажется это очень крутой паттерн, с которым мы будем жить: на смартфонах и умных девайсах в ближайшее время не будет настолько мощных чипов, как в серверных стойках, но хочется, чтобы умные модели были доступны. Все эти модели созданы компанией Apple, это НЕ модели Gemini. Говорят, что Apple усовершенствовала некоторые из этих моделей, дистиллируя Gemini, но все они являются совершенно новыми моделями, в которых используются собственные знания и технологии Apple. Самое крутое — и на смартфонах, и на макбуках у вас как у разработчика есть доступ к этим LLM. То есть вы можете написать приложение, не обучать свою модель (только сделать промпт) и вызывать её. Это бесплатно для локальной модели, а для облачных бесплатно до какого-то порога, дальше придется платить. Вот тут и тут можно посмотреть на скорость генерации на разных девайсах — получается даже быстрее, чем я бы ожидал!

ИИ apple wwdc llm ai apple-intelligence moe

Magnific AI представил инструмент FLOW для генерации видео

М@cgevent2 дн

Ну, за эфыксеров! От смешных эффектов в Pika к нормальным таким крепким VFX в Magnific. Интересно, как специализированные задачи выделяются в отдельные ИИ-пайплайны у разных провайдеров видео генерации. Магнитик представил FLOW. Композеры занервничали. Пробуем тут: https://www.magnific.com/app/tools/flow @cgevent

ИИ magnific ai vfx video-generation flow generative-ai

Suno Spark: скрытые риски программы для музыкантов

D@droidergram2 дн

🎵 Suno зовёт артистов в ловушку «хороших вибраций» ИИ-сервис Suno, видимо, больше не хочет быть фабрикой музыкального фастфуда. Компания метит в стриминговые площадки и даже собирается открывать новые имена в музыке. Для этого запустили программу Spark: гранты, менторство и маркетинговая поддержка для независимых музыкантов. Звучит как мечта инди-артиста. Ну… всплыло очень много интересных подробностей. Подать заявку может неподписанный лейблом певец, автор песен или продюсер, выпускающий музыку под своим именем. Но вместе с заявкой он соглашается на кабальные условия. Во-первых, свои треки придётся открыть для ремиксов прямо внутри Suno. Во-вторых, артист выдаёт сервису широкую лицензию на свои работы, включая право создавать производные произведения, плюс некую ограниченную эксклюзивность. Заодно вы отказываетесь от права на суд и на участие в коллективном иске. Но вишенка — пункт под названием «Good Vibes Only». Это соглашение о неразглашении и запрете критики: участник обязуется продвигать Suno и не имеет права «ни прямо, ни косвенно, ни устно, ни письменно» отзываться о компании, её сотрудниках или продуктах в негативном ключе. А ещё Suno получает право требовать правок и удаления вашего же контента. Сказали что-то нелестное — вылетели из программы. Интересно, подпишет ли контракт с Suno новый популярный артист ИИ-песен “Дурикович”? @droidergram

ИИ suno ai-music copyright music-industry legal

Ограничение доступа к мощным ИИ-моделям: новая реальность

И@moremarketingisaid2 дн

Правительство США впервые притормозило выход нейросети, потому что она слишком умная. Речь про свежую GPT-5.6 от OpenAI. Вышла, но достаётся только примерно 20 одобренным компаниям, и то через API. В обычном ChatGPT её нет вообще. Причина простая. Модель слишком хороша в поиске уязвимостей в чужом коде, и в Вашингтоне испугались, что это оружие. У Anthropic история ещё жёстче. В середине июня под экспортный контроль попали сразу две их модели, Fable 5 и Mythos 5. Доступ вырубили полностью, для всех. 26 июня Mythos 5 включили обратно, но только для сотни компаний и госагентств, и только под задачи киберзащиты. А Fable 5, самую мощную, до сих пор не вернули. Сроков никто не называет. И вот что тут главное. Раньше топовую модель решали деньги. Заплатил 20 баксов и работаешь наравне со всеми. Теперь решает список допуска. Ты либо в нём, либо сидишь на версии попроще и ждёшь у моря погоды. Начинается реально интересное время. Людей и компании потихоньку делят по уровню доступа к лучшему интеллекту. И разрыв в продуктивности между теми, кто внутри, и теми, кто снаружи, будет только расти. P.S. А в РФ тем временем новость в обратную сторону. 22 июня правительство переписало законопроеaкт об ИИ и убрали оттуда запрет на иностранные нейросети. Никакого реестра разрешённых моделей, никакого принудительного переезда на отечественное. Хочешь работать в зарубежных ИИ, работай. Правда только через КВН) Может теперь они и блокировки инсты с ютубом отменят... (мечты вслух😅)

ИИ ai openai anthropic geopolitics regulation tech

Проблема деградации внимания в LLM при больших контекстных окнах

A@ai_driven2 дн

1М контекстное окно - прорыв или фикция? Context Arena забенчмаркали стойкость контекста для GLM 5.2 и Opus 4.8 - значит, это хороший повод нам вспомнить про контекстную инженерию. На бенчмарке отчетливо видна существенная просадка внимательности моделей на 512к контексте: в среднем, почти в 2 раза в сравнении с 64к контекстом и примерно в 1.5 раз в сравнении с 128к контекстом - грубо говоря, для нас с вами это означает то, что на 512к контексте агент будет терять в полтора раза больше деталей, чем на при 128к заполненности. Для открытых моделей проблема потери контекста особенно актуальна, поэтому практический вывод такой, что по-хорошему, с ними стоит держать заполненность контекстного окна не выше 128к, а лучше даже меньше - ни о каком 1М, конечно, и речи не идет, там просадка будет колоссальной. Кстати, у моделей Kimi K2.6 и, тем более, Minimax M3 дела обстоят еще хуже. Что еще? Открыв закрытых моделей на большом контексте от открытых все еще впечатляет, хоть уже и не такой драматичный - спасибо DeepSeek за DeepSeek Sparse Attention, которую в GLM-5.2 развили через IndexShare. Кстати, о GLM 5.2 - как видно, моделька действительно на удивление успешная в т. ч. на больших контекстах. Opus 4.8 идет рядышком с GPT 5.5, но последняя все равно сильнее, особенно на совсем больших контекстах. На этом месте вспоминаем интересную деталь - в Codex App по дефолту контекстное окно для GPT 5.5 все еще 256к - то есть, по сути, точность всегда остается где-то на уровне 75%+- (по MRCRv2), а благодаря превосходному алгоритму компактизации, команде Codex удается сохранить все действительно важное так, что эти компактизации обычно и не заметны вовсе - то есть, конкретно в случае с Codex проблему контекстной инженерии ребята здорово решили на уровне модели и на уровне Harness (обвязки), в то время, как Claude Code в этом аспекте требует чуть больше ручной работы - модель на 1M контекста там включается прямо в выпадающем списке (велик соблазн ее включить), но кажется, что простой обыватель зачастую не очень понимает, что переключение на эту модель потребует от него ручного управления контекстом - как только контекст переваливает за условные 200к, начинается зона риска, в которой нужно либо переходить в новый чат, либо, хотя бы, вызывать компактизацию - что и приходилось делать. Что уж говорить, что пользователям открытых моделей за загрузкой контекста все еще стоит следить куда пристальнее. Короче, в 2026-м контекстную инженерию (в которую входит контроль % заполнения контекстного окна) пока никто не отменял - чем больше забит контекст, тем сильнее приходится надеятся на удачу. И, конечно, не забываем про контроль AGENTS.md, скиллов, MCP, progressive disclosure и т. д. - тоже все составляющие context engineering, с открытыми моделями все это становится еще важнее. Кстати, современная версия Context Arena прогоняет бенчмарк MRCRv2 от Google DeepMind (GDM-MRCRv2). Paper про MRCRv2 (Michelangelo) Датасет MRCRv2 А как вы менеджите контекст? Обращаете ли внимание на % заполнения? Наблюдаете ли просадки в качестве output модели на больших контекстах? @ai_driven

ИИ llm context-window ai-engineering benchmarks mrcr context-engineering

Влияние ИИ-агентов на продуктивность и нагрузку разработчика

Г@gmoreva2 дн

Количество переписок в день Мне было бы интересно узнать статистику количества нажатия на клавиши после плотного внедрения ИИ в мою работу. Я сейчас могу спокойно вести разработку 3-5 сервисов по нескольким проектам. В дни прям активно разработки я без остановки чего то печатаю. Причем печатаю агентами! Один агент выполнил задачу, ставлю ему следующую или уточнения по предыдущей. Пока первый думает иду писать второму и так по кругу. Выглядит как партия в шахматы против гроссмейстера, где в комнате стоит 3-5 столов с активными партиями и шахматист ходит между столами и делает ходы. Парадокс. Вроде раньше я гораздо больше кода писал сам — до 2023 года вообще 100% кода ~~копировал со stackoverflow~~ писал сам. Сейчас же я пишу от силы 5-10% кода, а остальное выдают мне ИИ-агенты. Но за активный рабочий день пальцы реально отсыхают от количество напечатаных символах. На фото видно мою клавиатуру. Смешно, что больше всего стерлись кнопки C и V. Но я прям честно-честно сам все пишу! не копипащу!

ИИ ai development productivity coding ai-agents

Обзор ключевых событий в AI и DS за неделю

Н@not_boring_ds2 дн

🧠 Что интересного было в AI/DS за неделю Сделал обзор топ постов, которые сам прочитал за эту неделю. Буду выпускать такой обзор раз в неделю. На этой неделе лучше всего зацепили темы про AI-инструменты для разработки, роль AI-инженера, ML в реальном бизнесе и выход IT-продуктов на внешние рынки. 🛠 AI coding tools: контекст важнее красивой демки [1], [2] В обсуждении Cursor, Codex и Claude Code главная мысль такая: в длинных задачах решает не только модель, а то, как инструмент держит контекст, переживает сжатие истории и не теряет цель в автономной работе. Это хороший сдвиг в разговоре про AI coding. Уже недостаточно спросить “какая модель умнее”. Нужно смотреть, какая среда лучше помогает довести задачу до конца. 🧑‍💻 Хороший AI-инженер: не тот, кто просто сделал модель [1] Сильный тезис про роль AI-инженера: разработка моделей постепенно становится commodity. Готовых LLM, пайплайнов и туториалов уже много. Настоящая ценность всё чаще в другом: сформулировать гипотезу, выбрать метрики, поставить эксперимент, довести до деплоя и потом следить за качеством. Короче, хороший AI-инженер всё больше похож на владельца результата, а не на человека, который “прикрутил нейронку”. 🏢 ML в бизнесе ломается не только об accuracy [1] Отличный кейс про recommendation/search bias из корпоративной жизни. Самый интересный тип bias там не из учебника, а из реальности: “уважаемый человек попросил”. Даже хорошая модель может начать вредить продукту, если поверх неё начинают вручную проталкивать внутренние приоритеты. Это напоминание, что ML-система в бизнесе живёт не в вакууме. Ей нужны продуктовые границы, доверие пользователей и защита от организационного шума. 🌍 Российские IT-продукты всё активнее смотрят наружу [1], [2], [3] Заметная линия недели: как IT-проектам выходить за пределы локального рынка. Темы очень практичные: платежи, язык, поддержка, SEO, органический трафик, упаковка продукта. Общий вывод простой: иногда следующий рост даёт не новая фича, а способность продать уже работающий продукт на другом рынке. 💭 Мой вывод недели: AI-инструменты становятся мощнее, но выигрывает не тот, кто просто подключил модель. Выигрывает тот, кто умеет держать контекст, формулировать задачу, измерять эффект и доводить систему до результата. 🎯 Теперь хочу расширить список источников. Если читаете адекватные каналы про AI, DS, ML, разработку, продукты или IT-бизнес — скиньте их в комментарии.

ИИ ai ds ml coding it-business product

RewardSpy: инструмент для мониторинга коллапса наград в RL

L@lovedeathtransformers2 дн

Забавный в своей бесполезности тул - мониторинг взлома реварда, проверяет есть ли коллапс награды в одно значени https://github.com/AvAdiii/rewardspy

ИИ ai reinforcement-learning ml monitoring github

Wan Streamer: интерактивная ИИ-модель для потокового видео

Н@GreenNeuralRobots2 дн

Wan Streamer Потоковая интерактивная дуплексная аудио-видео модель, ИИ-аватар, отвечающий в рилтайме. Закрывает разрыв между речью и анимацией аватара - всё в одном потоке. В базе в качестве LLM Qwen 2.5 / Qwen 3 - непонятно какая конкретно • субсекундная задержка, 25 fps, 192p • full-duplex режим • синхронные мимика, взгляд, жесты, дыхание • единая модель вместо раздельных VAD/ASR/TTS Кода-весов нет #avatar #intereactive

ИИ ai avatar llm realtime qwen

Alibaba представила Wan Streamer v0.1 для real-time общения с AI-аватаром

N@NeuralShit2 дн

Ну, за стримеров, опять. Алибаба выкатил Wan Streamer v0.1 - это экспериментальная модель Alibaba Wan Team для РЕАЛТАМОВОГО общения с AI-аватаром: она одновременно “видит”, “слышит”, “думает”, говорит и генерирует видео в режиме стрима. Главное отличие от привычных пайплайнов с отдельными ASR, LLM, TTS и анимацией в том, что всё объединено в один Transformer, где текст, аудио и видео обрабатываются как единый поток. По заявлению авторов, модель работает на 25 fps, имеет около 200 мс задержки на стороне модели и примерно 550 мс полной задержки с учётом сети, что позволяет вести почти мгновенный full-duplex диалог - когда агент продолжает воспринимать пользователя даже во время собственного ответа Кода нет пока, есть сайт проекта: https://wan-streamer.com/ И статья: https://huggingface.co/papers/2606.25041 Качество, конечно, пока отстой: демо пока идут в низком разрешении 192p, но показывают важный фичу - переход от “говорящей головы, прикрученной к чат-боту” к настоящей аудио-визуальной интерактивной модели. Авторы делают акцент на том, что задержка и синхронизация здесь решаются не инженерной склейкой модулей, а самой архитектурой: causal encoders/decoders, block-causal attention и thinker–performer deployment на двух GPU позволяют модели стримить восприятие и генерацию как непрерывный процесс. Какие GPU - не говорят... Интересно, что у них даже руки есть, не только головы. Но очень нервные руки на первом видео. @cgevent

ИИ ai alibaba wan-streamer computer-vision llm real-time

Анализ маркетинговой стратегии и рыночных показателей Anthropic

М@fire_hire2 дн

Какой же гениальный пиарщик у Anthropic Несколько громких инфоповодов подряд про то, какой Claude умный, что аж жутко. 🔺 с помощью модели Mythos Preview взломали macOS за пять дней. Apple потратила на защиту пять лет разработки 🔺правительство США запретило Claude Fable 5 из-за угрозы взлома систем. 🔺 OpenAI тайно использовала Claude 🔺 в эту пятницу правительство сняло блок на Mythos 5, самую мощную модель, для 100 американских компаний и госорганов При этом стуэйшен на рынке такой: 🤖 ChatGPT всё ещё №1, но упал ниже 50% рынка 🤖 Claude за 5 месяцев вырос с 60 до 245 млн пользователей (в 4 раза), а ChatGPT с 800 млн до 900 (на ~12%) 🤖В корпоративном сегменте Claude обогнал OpenAI ещё в 2025 🤖 13% пользователей Claude платят за подписку — лучший показатель конверсии в индустрии 🤖 В кодинге Claude держит 54% рынка, OpenAI — 21% А вы что думаете, пиар или не?

ИИ anthropic claude chatgpt ai-market marketing tech-news

Wan Streamer: ИИ-агент для видеозвонков от Alibaba

E@EF9MERA2 дн

Wan Streamer: ИИ-агент для видеозвонков от Alibaba Китайцы видимо тоже устали от тысячи встреч в календаре и решили упростить нам жизнь)) ✦ Одна модель, которая слушает, видит, говорит и выводит видео в реальном времени ✦ Задержка ~200 мс, полный цикл с учётом сети ~550 мс ✦ Это единственная система с синхронным аудио-видеоответом менее чем за секунду ✦ Поддерживает full-duplex: продолжает воспринимать речь и видео, пока генерирует ответ ✦ Текущая версия выдаёт 192p, более высокое разрешение появится позже 👉🏼 Подробнее 👀 EFEMERA

ИИ ai alibaba wan-streamer video-calls llm tech

Релиз модели Qwen3.6-34B-80L-Fable-5-Heretic

Н@GreenNeuralRobots2 дн

Qwen3.6-34B-80L-Fable-5-Heretic Продолжаем парад дистилляций Fable-5 основана на Qwen3.6-27B, снята цензура. Фокус на агентные сценарии и сложные логические цепочки • 34B параметров, 80 слоев рассуждения • дистилляция из Fable-5 Agentic Traces • дообучение на 4665 CoT-траекториях через QLoRA • формат 4-bit NF4, rank=64 GGUF #reasoning #gguf

ИИ qwen llm gguf ai reasoning fable

DeusData/codebase-memory-mcp: высокопроизводительный индексатор кодовой базы

С@sergiobulaev2 дн

🔹 DeusData/codebase-memory-mcp ⭐ 18337 звёзд · C MCP-сервер, который индексирует кодовую базу в граф знаний и отвечает на структурные запросы AI-агентам. Написан на чистом C без зависимостей, едет одним статическим бинарником под macOS, Linux и Windows. Парсит 158 языков через tree-sitter, для 10 (Python, TS, Go, Rust, C++, Java и др.) подключает LSP с выводом типов. Linux kernel — 28M строк, 75K файлов — индексирует за 3 минуты, запросы укладываются в миллисекунду. Внутри встроенные эмбеддинги Nomic (768d int8) для семантики без API-ключей, граф в SQLite со сжатием zstd коммитится в репу как .codebase-memory/graph.db.zst. 14 MCP-инструментов: трассировка вызовов, анализ влияния, поиск мёртвого кода. Автоконфиг для 11 агентов — Claude Code, Cursor, Aider, Windsurf. репозиторий Сергей Булаев AI 🤖 — об AI и не только

ИИ mcp ai-agents codebase tree-sitter sqlite dev-tools

Google ограничила доступ Meta к Gemini из-за нехватки мощностей

v@vcnews2 дн

Google ограничила доступ к Gemini для Meta (запрещена в России) из-за дефицита мощностей, узнала FT. Из-за этого Meta пришлось сдвинуть сроки некоторых внутренних ИИ‑проектов. Компания также попросила сотрудников «более эффективно» расходовать токены vc.ru/ai/3001352

ИИ google meta gemini ai infrastruktura

audio.cpp: высокопроизводительный C++ движок для аудиоинференса

Н@GreenNeuralRobots2 дн

audio.cpp C++ движок для аудиоинференса на ggml. заявлен прирост 1.8–5x по сравнению с Python‑реализациями, плюс есть оптимизация под CUDA. - синтез речи. - распознавание речи. - VAD (Voice Activity Detection) - детекция голосовой активности. - конвертация голоса (изменение тембра, пола и т. д.). - генерация музыки/аудиофрагментов Windows / Linux / macOS #tts #stt #vad #t2m #text2music #voice2voice

ИИ cpp ggml tts stt audio-inference cuda

Alibaba представила модель Wan Streamer v0.1 для видеозвонков с AI-агентами

G@aioftheday2 дн

Alibaba показала модель для видеозвонков AI-агентам Wan Streamer v0.1 одновременно слышит, видит, думает, говорит и генерирует видео. Всё в одной модели. Задержка 200 мс при 25 кадрах в секунду с разрешением 192p. https://wan-streamer.com/

ИИ ai alibaba wan-streamer video-generation ai-agents

Трансформация менеджмента и оргструктуры в AI-native компаниях

J@junior_pm2 дн

#мнение Место менеджмента AI-native оргструктуре Привет, читатель! Не знаю заметил ли ты, но я избегаю 3 тем: SOTA-моделей, автономных агентов и AI native команд/компаний Наткнулся на доклад AWS про команды в мире агентского ИИ. Не про инструменты, а про то, как меняется операционная модель когда стоимость владения падает: 1. Экономика AWS дает развилку Use / Compose / Build. Build оправдан только при уникальном процессе. Для большинства первичен разбор потока: где ценность, где теряется контекст, где нужна проверка. AI-native начинается не с модели, а с описания процесса как системы исполнения 2. Таланты и новые роли AWS вводит expert generalist: человек, который ведет процесс целиком. Фаулер разделяет why-loop и how-loop: человек сильнее в выборе что и зачем, агент в исполнении. Эндрю Энж: сборка ускоряется, узкое место смещается в продуктовые решения Отсюда роли. Product builder вместо PRD приносит проверяемый прототип. Product Engineer сам ближе к пользователю и метрикам. Forward deployed engineer тащит агентов в процессы клиентов, потому что между демо и продакшеном лежит слой интеграций и ответственности 3. Структура команд Четыре формы: пирамида, ромб, перевернутая пирамида, песочные часы Пирамида растит людей, но буксует на передачах. Ромб появляется когда режут джунов: пайплайн кадров умирает. Перевернутая пирамида как боевая капсула: сильные спецы и агенты. Песочные часы: автономные команды сверху, тонкий управленческий слой, обучение снизу. Team Topologies дает тот же принцип: команды вокруг потока ценности и когнитивной нагрузки. AI-native команда это не сквад с агентами, а компактная единица с ответственностью от начала до конца 4. Операционная модель Модель A: разработка строит, эксплуатация поддерживает, для агентов не работает. B: построил сам, запускаешь сам, работает в малом масштабе. C: автономные команды плюс платформа. Продолжение DevOps, не новая история. Агентский ИИ не отменяет DevOps. Он делает незавершенный DevOps дороже 5. Управление и контекст Управление агентами сводится к идентичности, правам, допустимым действиям и аудиту. Не регламент на полке, а исполняемый контур ближе к PRR из SRE. Фаулер формулирует: агент это модель плюс обвязка из правил, инструментов, проверок и контекста. Документация часть среды исполнения. Палантир-модель показывает: доменные понятия должны быть явными 6. Проджект-функция Каган разделяет продуктовые и фича-команды. ИИ ускоряет фича-команды, но не делает их продуктовыми Старая админ-функция сжимается. Отчеты, статусы, пушинг, перфоманс ревью, это компенсация плохой структуры. Новая мидл менеджер-функция это управление условиями исполнения. AI-native убирает мидл-менеджера как диспетчера передач. Но может сохранить функцию как инженерный контур: границы, контекст, поток, готовность, обратная связь

ИИ ai management aws devops orgstructure agents

Ещё ↓

ИИ

Яндекс тестирует платформу для создания ИИ-агентов в Алисе

Правительство США представило новый бенчмарк для оценки LLM

Правительство США представило новый бенчмарк для оценки LLM

Claude Code и загрузка видео с YouTube

Итоги вебинара AI Coding: лучшие практики и нераскрытые темы

Google реорганизует подразделение ИИ для программирования

История развития сервисов распознавания лиц: от FindFace до Sherlock AI

Уязвимость JaiLIP: обход защиты мультимодальных нейросетей через изображения

Австрия предлагает ЕС привлечь Anthropic на фоне ограничений США

AI как редактор и валидатор: опыт использования

OpenAI представила линейку моделей GPT-5.6

UnityShots: генерация связных видеоисторий на базе LTX-2.3

Обзор обновлений Apple Intelligence и архитектуры моделей AFM

Magnific AI представил инструмент FLOW для генерации видео

Suno Spark: скрытые риски программы для музыкантов

Ограничение доступа к мощным ИИ-моделям: новая реальность

Проблема деградации внимания в LLM при больших контекстных окнах

Влияние ИИ-агентов на продуктивность и нагрузку разработчика

Обзор ключевых событий в AI и DS за неделю

RewardSpy: инструмент для мониторинга коллапса наград в RL

Wan Streamer: интерактивная ИИ-модель для потокового видео

Alibaba представила Wan Streamer v0.1 для real-time общения с AI-аватаром

Анализ маркетинговой стратегии и рыночных показателей Anthropic

Wan Streamer: ИИ-агент для видеозвонков от Alibaba

Релиз модели Qwen3.6-34B-80L-Fable-5-Heretic

DeusData/codebase-memory-mcp: высокопроизводительный индексатор кодовой базы

Google ограничила доступ Meta к Gemini из-за нехватки мощностей

audio.cpp: высокопроизводительный C++ движок для аудиоинференса

Alibaba представила модель Wan Streamer v0.1 для видеозвонков с AI-агентами

Трансформация менеджмента и оргструктуры в AI-native компаниях

Настройка шрифта

В тренде