ИИ — Hirify Feed

ИИ🔥

NVIDIA представила Fast-FoundationStereo для оценки глубины

Fast-FoundationStereo Стереомодель от NVIDIA. Считает диспаритет по паре фото — строит карту глубины. • гибридная архитектура: трансформеры + CNN • 14.6 млн параметров • zero-shot, без донастройки • работает в реальном времени Дистиллирована из FoundationStereo, бэкбон — EdgeNeXt. Лицензия — nvidia-open-model-agreement. Оптимизирована под GPU NVIDIA. Гитхаб HF #video2depth #stereo2depth

#nvidia #computer-vision #depth-estimation #ai #deep-learning

ИИ🔥

Влияние AI-инструментов на продуктивность разработки

@blognot в Telegram ↗1 дн

Вот вам еще одно исследование, тоже вполне себе флеймовое. Авторы использовали серьезный набор данных — более 100 000 разработчиков GitHub плюс внутренняя телеметрия Microsoft по использованию AI-инструментов. Метод — сопоставленный событийный анализ (каждого, кто внедрил инструмент, сравнивают с близнецом-разработчиком на год раньше, чтобы отделить эффект инструмента от общей волны внедрения AI). Задача исследования — выяснить, как растет отдача по мере внедрения AI-инструментов и доходит ли эффект до конечного продукта. На уровне написания кода прирост огромный и растёт с каждым поколением. По числу коммитов накопленный эффект: ▪️ автодополнение — +40% ▪️ + синхронные (интерактивные) агенты — +140% ▪️ + асинхронные (автономные) агенты — +180% Но дальше по цепочке выигрыш стремительно затухает. Те же 180% по коммитам превращаются в +50% по числу проектов и всего +30% по фактическим выпускам. У синхронных агентов разрыв ещё нагляднее: +741% строк кода, +65% пул-реквестов — и лишь +20% релизов. Основная гипотеза, что происходит — в цепочке остаётся слабое звено, то есть человек. Громадный выигрыш в разработке и генерации кода дальше упирается в живого ревьюера — code review это же очень важная стадия, как можно доверять тупой машине? — и там и пропадает. Кстати, аналогичную картину авторы видят в приложениях в App Store, Chrome и Google Play — количество новых приложений выросло значительно, но общее использование приложений по площадкам осталось прежним. Подавляющее большинство новых приложений не смогли набрать даже минимальную аудиторию. Собственно, это полностью согласовывается с общей идеей — узкое место просто переехало в маркетинг приложения. https://www.nber.org/papers/w35275

#ai #productivity #software-development #nber #coding #automation

ИИ🔥

Использование MCP от OpenRouter для выбора LLM

@tips_ai в Telegram ↗1 дн

Вчера под один проект брейнштормил с клодом какую LLM лучше выбрать Было очень долго и не удобно, так еще он ленился ходить в веб и брал инфу из своих знаний, считая DeepSeek V3 лучшим выбором. Так вот нашел у OpenRouter их MCP для агентов с актуальной инфой о моделях Что входит: - 400+ моделей, бенчмарки и цены - Фильтры, сортировки - Поиск по документации Так узнал о моделях которые вообще раньше не видел, например Owl Alpha с общим usage 7,47T токенов в Hermes 😣 Подключить:

mcp add openrouter --url mcp.openrouter.ai/mcp mcp login openrouter

Доки @tips_ai #tools

#ai #llm #mcp #openrouter #tools #development

ИИ🔥

Яндекс тестирует платформу для создания ИИ-агентов в Алисе

@vcnews в Telegram ↗1 дн

«Яндекс» начал тестировать платформу для создания ИИ-агентов в «Алисе AI» — пока внутри компании, уже есть агенты для «Такси» и «Лавки», которыми может воспользоваться часть пользователей. К концу 2026 года доступ к платформе откроют и стороннему бизнесу https://vc.ru/ai/3001880

#iandeks #alisa #ii #ai-agenty #texnologii

ИИ🔥

Правительство США представило новый бенчмарк для оценки LLM

@navuka_i_jizn в Telegram ↗1 дн

Правительство США дропнуло новый бенчмарк для LLM ⚡️

#ai #llm #benchmark #usa #government #tech

ИИ🔥

Правительство США представило новый бенчмарк для оценки LLM

@data_secrets в Telegram ↗1 дн

Правительство США дропнуло новый бенчмарк для LLM ⚡️

#ai #llm #benchmark #usa #government #safety

ИИ

Claude Code и загрузка видео с YouTube

@aioftheday в Telegram ↗1 дн

Попросил Claude Code скачать мне видео с YouTube. Думал, что ответит про авторские права и подобное — нет, ни фига, никаких вопросов и сомнений, бодро взялся за дело. Заодно я узнал, что на Python есть специальная библиотека для таких задач.

#claude #ai #python #automation #youtube #coding

ИИ

Итоги вебинара AI Coding: лучшие практики и нераскрытые темы

@llm_under_hood в Telegram ↗1 дн

Выжимка четвертого потока вебинара AI Coding - What Works. Вот список приемов AI Native разработки, которые участники выбрали себе как самые важные и полезные. А давайте, расскажем теперь про то, на что времени не хватило! На какие вещи не хватило времени? Про что хотелось бы узнать больше всего? Пишите в комментарии! Ваш, @llm_under_hood 🤗

#ai #coding #llm #development #webinar

ИИ🔥

Google реорганизует подразделение ИИ для программирования

@ai_machinelearning_big_data в Telegram ↗1 дн

✔️ Google реорганизует команду ИИ-кодеров Команда по разработке ИИ для кодинга станет постоянной структурой. Подразделение займет место между этапами pre-training и post-training и возьмет на себя расширение возможностей моделей в программировании. Причина реструктуризации в отставании от Anthropic в сегменте ИИ для кодинга. Google ошибочно полагала, что базовые LLM освоят программирование автоматически без выделенного обучения. В результате инструмент Antigravity оказался проблемным, разработчики раскритиковали Gemini 3.5 Flash за высокую цену, а релиз флагманской Gemini 3.5 Pro до сих пор не состоялся. @ai_machinelearning_big_data #news #ai #ml

#google #gemini #ai #coding #llm #tech

ИИ🔥

История развития сервисов распознавания лиц: от FindFace до Sherlock AI

@startupoftheday в Telegram ↗1 дн

История деанонимизации В 2016 году (10 лет прошло!) в России прогремел FindFace. Стартап проиндексировал фотографии профилей ВКонтакте и научился по ним искать. Пользователь наводил камеру телефона на соседа в метро и узнавал его имя, возраст, а при удаче – и о чем он думал утром. Идеальный инструмент романтических знакомств. Или для всякого мошенничества, если с темной стороны посмотреть. В 2018 году сервис закрылся. Разработчики так и не научились на нем зарабатывать и решили сфокусироваться на заказных проектах по распознаванию лиц. Американский Clearview появился всего на год позже позже российского собрата и технически делал совершенно то же самое. Даешь ему фотку, он находит этого человека в интернете. Зато монетизировал технологию он радикально по-другому. Clearview не делал мобильной аппки, а продавал доступ в B2B: службам безопасности больших корпораций и подобным клиентам. В какой-то момент об этом напила пресса, начался скандал. Пользователи возмущались, что их ищут, соцсети – что данные берут без спроса. Суд в итоге постановил, что вообще-то так нельзя, но правительству можно. С тех пор Clearview имеет право продавать услуги Большого Брата государственным органам, а частникам ни-ни. И если американский пограничник сам, без подсказки, нашел ваш уютный бложек, где вы что-то не то о политике пишите – это, видимо, работа Clearview. Продолжение славной традиции –- современный американский #стартапдня Sherlock AI. Ровно та же техническая идея, а монетизация в этот – подписка в пользовательском приложении. Хочешь знать, кто сидит напротив тебя – плати. Хочешь это знать чаще, чем несколько раз в неделю, – плати дополнительно, лимиты жесткие. Запустился Sherlock в январе. Живет пока относительно тихо, большого скандала нет. Впрочем, он пока объективно маленький, Sensor Tower показывает выручку 60 тысяч долларов в месяц. https://www.imsherlock.com/ #сша #россия #насвои #общение #ai #технология

#ai #face-recognition #startups #privacy #tech #history

ИИ🔥

Уязвимость JaiLIP: обход защиты мультимодальных нейросетей через изображения

@habr_com в Telegram ↗1 дн

Исследователи из Флоридского международного университета пробили защиту мультимодальных нейросетей одной картинкой. Команда собрала алгоритм JaiLIP, который математически перестраивает пиксели и сохраняет визуально нормальное изображение. Теперь хакерам хватает одного заражённого файла, чтобы обойти текстовые фильтры. ИИ читает графику через голые цифры, поэтому невидимый шум заставляет систему сносить встроенные ограничения. На тестах с популярной моделью BLIP-2 новый метод заставил ИИ выдать почти в 2 раза больше опасных ответов. Разработчики скормили нейросети ничем не примечательную фотографию светофора. Система проглотила наживку и подробно объяснила, как проехать на красный свет и не получить штраф. В стандартном режиме алгоритмы безопасности сразу рубят такие инструкции. Компании активно внедряют автоматизированных ботов, которые умеют распознавать графику. Небольшие команды часто выкатывают опенсорсные продукты вслепую и не ищут уязвимости. Злоумышленник просто кидает модифицированную картинку в обычный чат-бот, после чего ИИ по-тихому меняет логику работы.

#ai #cybersecurity #jailip #blip2 #neural-networks #infosec

ИИ🔥

Австрия предлагает ЕС привлечь Anthropic на фоне ограничений США

@blognot в Telegram ↗1 дн

Австрия предлагает Евросоюзу рассмотреть размещение американской компании Anthropic на своей территории — в ответ на ограничения, введённые администрацией Трампа в начале июня. Госсекретарь по цифровизации Александр Пёлль в письме исполнительному вице-президенту Еврокомиссии Хенне Вирккунен предложил обсудить «стратегическое учреждение и участие Anthropic в ЕС», обеспечив компании правовую определённость, доступ к рынку, капитал и подходящий набор ценностей. По словам Пёлля, присутствие такого игрока привлекло бы таланты и помогло бы устанавливать стандарты, не вытесняя европейские проекты. Правда, непонятно, как именно американская компания Anthropic может переместиться в Европу хотя бы частью с учетом экстерриториальности большей части американского законодательства. И тем более, как она может взять с собой свои модели. https://www.bloomberg.com/news/articles/2026-06-28/austria-lobbies-eu-to-host-anthropic-after-us-access-curbs

#anthropic #eu #austria #ai-policy #tech-regulation #geopolitics

ИИ🔥

AI как редактор и валидатор: опыт использования

@UniArchitect в Telegram ↗1 дн

AI КАК РЕДАКТОР, А НЕ АВТОР Когда я запускал блог, одной из самых неприятных задач было не “придумать тему”. Тем обычно много. Сложнее было разложить мысль компактно, без каши в предложениях, и так, чтобы опытному читателю не хотелось закрыть пост на третьей строке со словами “господи, что я читаю” 😅 И первое место, где AI меня реально вытащил — это не код. Это текст. 🔸Блог Почти каждая статья проходила через ChatGPT: — проверить стилистику — поправить грамматику — найти кривые формулировки — предложить другой способ сказать ту же мысль И вот последнее оказалось важнее, чем кажется. Потому что иногда мысль вроде нормальная, но звучит так, будто её три раза уронили по дороге. У каждого автора есть набор любимых речевых конструкций. Одни и те же связки, одни и те же обороты, один и тот же способ подводить к выводу. С одной стороны — это стиль. С другой — если не обновлять этот пул, текст начинает звучать как пережёванная версия самого себя. У меня это особенно заметно, потому что я довольно быстро нахожу первичную формулировку мысли, но намного хуже умею посмотреть на неё под другим углом. Я уже писал про это в статье Проклятие знаний: когда мысль у тебя в голове собрана, очень легко забыть, что то, что очевидно для тебя может быть не очевидно для читателя. 🔹Курс Вторая большая область — подготовка курса. Первые 3 месяца я собирал материал руками. Ночью, когда жена уходила спать, я садился за комп, шёл в Google, читал научные статьи, разбирался, что там вообще написано, и складывал всё в Notion. Не просто “ссылка на источник”, а: — какая мысль откуда взята — где её нужно использовать — в каком порядке она должна идти — что нельзя исказить при пересказе Так была сделана почти половина курса. А потом появились reasoning-модели, которым можно скормить большой промпт, файлы и дать 40 минут подумать. И здесь AI стал не автором, а независимым валидатором: правильно ли я понял источник, не перепутал ли причинность, не натянул ли вывод на свою картину мира, потому что очень хочется, выдать желаемое за действительное 😅 Вот это оказалось прям ценно. Потому что найти источник — не самая сложная часть. Сложная часть — прочитать, правильно понять, а потом донести мысль так, чтобы не исказить исходный смысл. 🔸И это хорошо ложится на исследования В SAP/HPI исследовании про опыт разработчиков с GenAI есть важный практический вывод:

когда человек использует один режим работы с AI — только chat или только in-code — нагрузка падает. Когда начинает метаться между режимами, выигрыш пропадает.

А ещё точнее в ту же точку попадает свежий RCT Anthropic про формирование навыков. Исследование про код, но механизм универсальный:

когда человек полностью отдаёт задачу AI, у него растёт ощущение продуктивности, но проседает понимание, чтение и отладка — причём без реального выигрыша по скорости. А те, кто работает с AI вовлеченно, спрашивая объяснения, а не готовый ответ, понимание сохраняют.

С текстом у меня работает так же. AI полезен, когда у него понятная роль: редактор, переформулировщик, валидатор или исследователь. А промпт формируется несколькими итерациями, где я подробно рассказываю куда нужно капнуть, что взять и как преобразовать. Но если прописать “давай классную статью по архитектуре”, на выходе очень быстро получается стерильный AI-slop/мусор 🤢 🔻 AI хорошо снижает стоимость итерации мысли. Но мысль всё равно должна быть твоя. Иначе вместо авторского текста/кода получится гладкая, правильная и абсолютно мёртвая жвачка. Ставь 👍 если тебе заходит такого рода контент! Ты знаешь кому переслать эту статью 💪 #ai@UniArchitect

#ai #writing #productivity #llm #editing #workflow

ИИ🔥

OpenAI представила линейку моделей GPT-5.6

@htech_plus в Telegram ↗1 дн

OpenAI представила GPT-5.6 в версиях Sol, Terra и Luna, но доступ к ним не открыла OpenAI начала ограниченное тестирование новой линейки моделей GPT-5.6, представив три версии — мощную Sol, универсальную Terra и экономичную Luna. Компания планировала открыть доступ широкой аудитории в ближайшие недели, однако из-за требований правительства США решила сначала предоставить модели только группе доверенных партнёров. Флагманская Sol получила улучшенные алгоритмы рассуждения, поддержку субагентов и показала рекордные результаты в тестах на программирование, биологический анализ и кибербезопасность. https://hightech.plus/2026/06/29/openai-predstavila-gpt-56-v-versiyah-sol-terra-i-luna-no-dostup-k-nim-ne-otkrila

#openai #gpt-56 #ai #llm #tech-news

ИИ🔥

UnityShots: генерация связных видеоисторий на базе LTX-2.3

@GreenNeuralRobots в Telegram ↗1 дн

UnityShots Превращает диффузионную модель (LTX-2.3 22B) в инструмент для многокадровых видеоисторий. Генерирует связную последовательность кадров как единый mp4. • сохраняет идентичность персонажа между кадрами • держит постоянство сцены, света, реквизита • синхронно генерирует аудио и липсинк • управляет типами монтажных склеек • три режима инференса: T2V, I2V, R2V • обучение через Shots-Forcing Гитхаб ждем #text2movie #multishot #referencing

#ai #video-generation #ltx-23 #generative-ai #multishot

ИИ🔥

Обзор обновлений Apple Intelligence и архитектуры моделей AFM

@seeallochnaya в Telegram ↗1 дн

Прошло 3 недели и никто не написал про Apple и WWDC, а мне было лень, но что поделать, надо браться. В начале июня компания проводила ежегодную конференцию для разработчиков и вместе с этим рассказала про обновления в AI. Очень сильно прокачали Siri, теперь она работает на относительно большой (по мобильным меркам) LLM, умеет вызывать инструменты и тесно связана с приложениями и экосистемой. Я видел пару демонстраций в твиттере, где запросы и сценарии показались мне не предусмотренными разработчиками (то есть модель на них не тренировали), и тем не менее Siri справилась отлично. Для тех, кто пользовался LLM, такая генерализация не является чем-то выдающимся, но для обычных пользователей может вызвать ВАУ-эффект. Ого, оно что И ТАК умеет??? Не только по пяти заложенным 15 лет назад сценариям работать? На девайсах может быть одна из двух моделей — AFM 3 Core (3 миллиарда параметров) и AFM 3 Core Advanced для девайсов помощнее, Phone 17 Pro и выше, iPad с чипом M4 и выше, MacBook с чипами M3 и выше. Такое ограничение потому, что модель действительно «Large» — 20 миллиардов параметров с микстурой экспертов (MoE). Но работает очень хитро — классический MoE работал бы плохо, так как у девайса ограничена пропускная способность между NAND (флеш-память для хранения ваших файлов и весов модели) и DRAM (где хранятся активные параметры для работы). В обычном MoE вы не знаете наперёд, какие именно эксперты вам нужны, поэтому загружаете всю модель, что а) долго б) занимает много памяти, а потом уже экономите на вычислениях, так как работает часть экспертов. Apple применили трюк, который я вижу впервые: для вашего промпта модель предварительно выбирает набор экспертов на всю модель, а затем загружает только их, и получается от 1 до 4 миллиарда активных параметров. Подход называется Instruction-Following Pruning for Large Language Models и описан в этой статье из начала 2025-го года. Также эта модель работает и для распознавания вашего голоса (поэтому и оно улучшилось), и для генерации нового голоса Siri (...тоже улучшилось). Вот тут внизу есть пара семплов было/стало, честно говоря старое мне нравится больше 🤷‍♂️ И вторая часть анонса — это удвоение ставки на Private Cloud Compute (PCC), который анонсировали два года назад. Идея в том, что для более сложных запросов, для которых локальной модели (особенно на смартфоне) не хватает, можно отправить промпт и контекст (например, файлы) на зашифрованный сервер, внутрь которого ни у кого нет доступа. Несмотря на то что система имеет открытый код и анализировалась лучшими специалистами по кибербезопасности, надеюсь, что Mythos тоже натравили 😀 Так вот, в PCC тоже обновилась модель, AFM 3 Cloud. Она запущена на серверах Apple и крутится на собственных чипах M-серии. И есть ещё AFM 3 Cloud Pro, которая ещё больше, ещё умнее, развернута на серверах Google на Nvidia GPU. Мне кажется это очень крутой паттерн, с которым мы будем жить: на смартфонах и умных девайсах в ближайшее время не будет настолько мощных чипов, как в серверных стойках, но хочется, чтобы умные модели были доступны. Все эти модели созданы компанией Apple, это НЕ модели Gemini. Говорят, что Apple усовершенствовала некоторые из этих моделей, дистиллируя Gemini, но все они являются совершенно новыми моделями, в которых используются собственные знания и технологии Apple. Самое крутое — и на смартфонах, и на макбуках у вас как у разработчика есть доступ к этим LLM. То есть вы можете написать приложение, не обучать свою модель (только сделать промпт) и вызывать её. Это бесплатно для локальной модели, а для облачных бесплатно до какого-то порога, дальше придется платить. Вот тут и тут можно посмотреть на скорость генерации на разных девайсах — получается даже быстрее, чем я бы ожидал!

#apple #wwdc #llm #ai #apple-intelligence #moe

ИИ🔥

Magnific AI представил инструмент FLOW для генерации видео

@cgevent в Telegram ↗1 дн

Ну, за эфыксеров! От смешных эффектов в Pika к нормальным таким крепким VFX в Magnific. Интересно, как специализированные задачи выделяются в отдельные ИИ-пайплайны у разных провайдеров видео генерации. Магнитик представил FLOW. Композеры занервничали. Пробуем тут: https://www.magnific.com/app/tools/flow @cgevent

#magnific #ai #vfx #video-generation #flow #generative-ai

ИИ🔥

Suno Spark: скрытые риски программы для музыкантов

@droidergram в Telegram ↗1 дн

🎵 Suno зовёт артистов в ловушку «хороших вибраций» ИИ-сервис Suno, видимо, больше не хочет быть фабрикой музыкального фастфуда. Компания метит в стриминговые площадки и даже собирается открывать новые имена в музыке. Для этого запустили программу Spark: гранты, менторство и маркетинговая поддержка для независимых музыкантов. Звучит как мечта инди-артиста. Ну… всплыло очень много интересных подробностей. Подать заявку может неподписанный лейблом певец, автор песен или продюсер, выпускающий музыку под своим именем. Но вместе с заявкой он соглашается на кабальные условия. Во-первых, свои треки придётся открыть для ремиксов прямо внутри Suno. Во-вторых, артист выдаёт сервису широкую лицензию на свои работы, включая право создавать производные произведения, плюс некую ограниченную эксклюзивность. Заодно вы отказываетесь от права на суд и на участие в коллективном иске. Но вишенка — пункт под названием «Good Vibes Only». Это соглашение о неразглашении и запрете критики: участник обязуется продвигать Suno и не имеет права «ни прямо, ни косвенно, ни устно, ни письменно» отзываться о компании, её сотрудниках или продуктах в негативном ключе. А ещё Suno получает право требовать правок и удаления вашего же контента. Сказали что-то нелестное — вылетели из программы. Интересно, подпишет ли контракт с Suno новый популярный артист ИИ-песен “Дурикович”? @droidergram

#suno #ai-music #copyright #music-industry #legal

ИИ🔥

Ограничение доступа к мощным ИИ-моделям: новая реальность

@moremarketingisaid в Telegram ↗1 дн

Правительство США впервые притормозило выход нейросети, потому что она слишком умная. Речь про свежую GPT-5.6 от OpenAI. Вышла, но достаётся только примерно 20 одобренным компаниям, и то через API. В обычном ChatGPT её нет вообще. Причина простая. Модель слишком хороша в поиске уязвимостей в чужом коде, и в Вашингтоне испугались, что это оружие. У Anthropic история ещё жёстче. В середине июня под экспортный контроль попали сразу две их модели, Fable 5 и Mythos 5. Доступ вырубили полностью, для всех. 26 июня Mythos 5 включили обратно, но только для сотни компаний и госагентств, и только под задачи киберзащиты. А Fable 5, самую мощную, до сих пор не вернули. Сроков никто не называет. И вот что тут главное. Раньше топовую модель решали деньги. Заплатил 20 баксов и работаешь наравне со всеми. Теперь решает список допуска. Ты либо в нём, либо сидишь на версии попроще и ждёшь у моря погоды. Начинается реально интересное время. Людей и компании потихоньку делят по уровню доступа к лучшему интеллекту. И разрыв в продуктивности между теми, кто внутри, и теми, кто снаружи, будет только расти. P.S. А в РФ тем временем новость в обратную сторону. 22 июня правительство переписало законопроеaкт об ИИ и убрали оттуда запрет на иностранные нейросети. Никакого реестра разрешённых моделей, никакого принудительного переезда на отечественное. Хочешь работать в зарубежных ИИ, работай. Правда только через КВН) Может теперь они и блокировки инсты с ютубом отменят... (мечты вслух😅)

#ai #openai #anthropic #geopolitics #regulation #tech

ИИ🔥

Проблема деградации внимания в LLM при больших контекстных окнах

@ai_driven в Telegram ↗1 дн

1М контекстное окно - прорыв или фикция? Context Arena забенчмаркали стойкость контекста для GLM 5.2 и Opus 4.8 - значит, это хороший повод нам вспомнить про контекстную инженерию. На бенчмарке отчетливо видна существенная просадка внимательности моделей на 512к контексте: в среднем, почти в 2 раза в сравнении с 64к контекстом и примерно в 1.5 раз в сравнении с 128к контекстом - грубо говоря, для нас с вами это означает то, что на 512к контексте агент будет терять в полтора раза больше деталей, чем на при 128к заполненности. Для открытых моделей проблема потери контекста особенно актуальна, поэтому практический вывод такой, что по-хорошему, с ними стоит держать заполненность контекстного окна не выше 128к, а лучше даже меньше - ни о каком 1М, конечно, и речи не идет, там просадка будет колоссальной. Кстати, у моделей Kimi K2.6 и, тем более, Minimax M3 дела обстоят еще хуже. Что еще? Открыв закрытых моделей на большом контексте от открытых все еще впечатляет, хоть уже и не такой драматичный - спасибо DeepSeek за DeepSeek Sparse Attention, которую в GLM-5.2 развили через IndexShare. Кстати, о GLM 5.2 - как видно, моделька действительно на удивление успешная в т. ч. на больших контекстах. Opus 4.8 идет рядышком с GPT 5.5, но последняя все равно сильнее, особенно на совсем больших контекстах. На этом месте вспоминаем интересную деталь - в Codex App по дефолту контекстное окно для GPT 5.5 все еще 256к - то есть, по сути, точность всегда остается где-то на уровне 75%+- (по MRCRv2), а благодаря превосходному алгоритму компактизации, команде Codex удается сохранить все действительно важное так, что эти компактизации обычно и не заметны вовсе - то есть, конкретно в случае с Codex проблему контекстной инженерии ребята здорово решили на уровне модели и на уровне Harness (обвязки), в то время, как Claude Code в этом аспекте требует чуть больше ручной работы - модель на 1M контекста там включается прямо в выпадающем списке (велик соблазн ее включить), но кажется, что простой обыватель зачастую не очень понимает, что переключение на эту модель потребует от него ручного управления контекстом - как только контекст переваливает за условные 200к, начинается зона риска, в которой нужно либо переходить в новый чат, либо, хотя бы, вызывать компактизацию - что и приходилось делать. Что уж говорить, что пользователям открытых моделей за загрузкой контекста все еще стоит следить куда пристальнее. Короче, в 2026-м контекстную инженерию (в которую входит контроль % заполнения контекстного окна) пока никто не отменял - чем больше забит контекст, тем сильнее приходится надеятся на удачу. И, конечно, не забываем про контроль AGENTS.md, скиллов, MCP, progressive disclosure и т. д. - тоже все составляющие context engineering, с открытыми моделями все это становится еще важнее. Кстати, современная версия Context Arena прогоняет бенчмарк MRCRv2 от Google DeepMind (GDM-MRCRv2). Paper про MRCRv2 (Michelangelo) Датасет MRCRv2 А как вы менеджите контекст? Обращаете ли внимание на % заполнения? Наблюдаете ли просадки в качестве output модели на больших контекстах? @ai_driven

#llm #context-window #ai-engineering #benchmarks #mrcr #context-engineering

ИИ

Влияние ИИ-агентов на продуктивность и нагрузку разработчика

@gmoreva в Telegram ↗1 дн

Количество переписок в день Мне было бы интересно узнать статистику количества нажатия на клавиши после плотного внедрения ИИ в мою работу. Я сейчас могу спокойно вести разработку 3-5 сервисов по нескольким проектам. В дни прям активно разработки я без остановки чего то печатаю. Причем печатаю агентами! Один агент выполнил задачу, ставлю ему следующую или уточнения по предыдущей. Пока первый думает иду писать второму и так по кругу. Выглядит как партия в шахматы против гроссмейстера, где в комнате стоит 3-5 столов с активными партиями и шахматист ходит между столами и делает ходы. Парадокс. Вроде раньше я гораздо больше кода писал сам — до 2023 года вообще 100% кода ~~копировал со stackoverflow~~ писал сам. Сейчас же я пишу от силы 5-10% кода, а остальное выдают мне ИИ-агенты. Но за активный рабочий день пальцы реально отсыхают от количество напечатаных символах. На фото видно мою клавиатуру. Смешно, что больше всего стерлись кнопки C и V. Но я прям честно-честно сам все пишу! не копипащу!

#ai #development #productivity #coding #ai-agents

ИИ🔥

Обзор ключевых событий в AI и DS за неделю

@not_boring_ds в Telegram ↗1 дн

🧠 Что интересного было в AI/DS за неделю Сделал обзор топ постов, которые сам прочитал за эту неделю. Буду выпускать такой обзор раз в неделю. На этой неделе лучше всего зацепили темы про AI-инструменты для разработки, роль AI-инженера, ML в реальном бизнесе и выход IT-продуктов на внешние рынки. 🛠 AI coding tools: контекст важнее красивой демки [1], [2] В обсуждении Cursor, Codex и Claude Code главная мысль такая: в длинных задачах решает не только модель, а то, как инструмент держит контекст, переживает сжатие истории и не теряет цель в автономной работе. Это хороший сдвиг в разговоре про AI coding. Уже недостаточно спросить “какая модель умнее”. Нужно смотреть, какая среда лучше помогает довести задачу до конца. 🧑‍💻 Хороший AI-инженер: не тот, кто просто сделал модель [1] Сильный тезис про роль AI-инженера: разработка моделей постепенно становится commodity. Готовых LLM, пайплайнов и туториалов уже много. Настоящая ценность всё чаще в другом: сформулировать гипотезу, выбрать метрики, поставить эксперимент, довести до деплоя и потом следить за качеством. Короче, хороший AI-инженер всё больше похож на владельца результата, а не на человека, который “прикрутил нейронку”. 🏢 ML в бизнесе ломается не только об accuracy [1] Отличный кейс про recommendation/search bias из корпоративной жизни. Самый интересный тип bias там не из учебника, а из реальности: “уважаемый человек попросил”. Даже хорошая модель может начать вредить продукту, если поверх неё начинают вручную проталкивать внутренние приоритеты. Это напоминание, что ML-система в бизнесе живёт не в вакууме. Ей нужны продуктовые границы, доверие пользователей и защита от организационного шума. 🌍 Российские IT-продукты всё активнее смотрят наружу [1], [2], [3] Заметная линия недели: как IT-проектам выходить за пределы локального рынка. Темы очень практичные: платежи, язык, поддержка, SEO, органический трафик, упаковка продукта. Общий вывод простой: иногда следующий рост даёт не новая фича, а способность продать уже работающий продукт на другом рынке. 💭 Мой вывод недели: AI-инструменты становятся мощнее, но выигрывает не тот, кто просто подключил модель. Выигрывает тот, кто умеет держать контекст, формулировать задачу, измерять эффект и доводить систему до результата. 🎯 Теперь хочу расширить список источников. Если читаете адекватные каналы про AI, DS, ML, разработку, продукты или IT-бизнес — скиньте их в комментарии.

#ai #ds #ml #coding #it-business #product

ИИ

RewardSpy: инструмент для мониторинга коллапса наград в RL

@lovedeathtransformers в Telegram ↗1 дн

Забавный в своей бесполезности тул - мониторинг взлома реварда, проверяет есть ли коллапс награды в одно значени https://github.com/AvAdiii/rewardspy

#ai #reinforcement-learning #ml #monitoring #github

ИИ🔥

Wan Streamer: интерактивная ИИ-модель для потокового видео

@GreenNeuralRobots в Telegram ↗1 дн

Wan Streamer Потоковая интерактивная дуплексная аудио-видео модель, ИИ-аватар, отвечающий в рилтайме. Закрывает разрыв между речью и анимацией аватара - всё в одном потоке. В базе в качестве LLM Qwen 2.5 / Qwen 3 - непонятно какая конкретно • субсекундная задержка, 25 fps, 192p • full-duplex режим • синхронные мимика, взгляд, жесты, дыхание • единая модель вместо раздельных VAD/ASR/TTS Кода-весов нет #avatar #intereactive

#ai #avatar #llm #realtime #qwen

ИИ🔥

Alibaba представила Wan Streamer v0.1 для real-time общения с AI-аватаром

@NeuralShit в Telegram ↗1 дн

Ну, за стримеров, опять. Алибаба выкатил Wan Streamer v0.1 - это экспериментальная модель Alibaba Wan Team для РЕАЛТАМОВОГО общения с AI-аватаром: она одновременно “видит”, “слышит”, “думает”, говорит и генерирует видео в режиме стрима. Главное отличие от привычных пайплайнов с отдельными ASR, LLM, TTS и анимацией в том, что всё объединено в один Transformer, где текст, аудио и видео обрабатываются как единый поток. По заявлению авторов, модель работает на 25 fps, имеет около 200 мс задержки на стороне модели и примерно 550 мс полной задержки с учётом сети, что позволяет вести почти мгновенный full-duplex диалог - когда агент продолжает воспринимать пользователя даже во время собственного ответа Кода нет пока, есть сайт проекта: https://wan-streamer.com/ И статья: https://huggingface.co/papers/2606.25041 Качество, конечно, пока отстой: демо пока идут в низком разрешении 192p, но показывают важный фичу - переход от “говорящей головы, прикрученной к чат-боту” к настоящей аудио-визуальной интерактивной модели. Авторы делают акцент на том, что задержка и синхронизация здесь решаются не инженерной склейкой модулей, а самой архитектурой: causal encoders/decoders, block-causal attention и thinker–performer deployment на двух GPU позволяют модели стримить восприятие и генерацию как непрерывный процесс. Какие GPU - не говорят... Интересно, что у них даже руки есть, не только головы. Но очень нервные руки на первом видео. @cgevent

#ai #alibaba #wan-streamer #computer-vision #llm #real-time

ИИ🔥

Анализ маркетинговой стратегии и рыночных показателей Anthropic

@fire_hire в Telegram ↗1 дн

Какой же гениальный пиарщик у Anthropic Несколько громких инфоповодов подряд про то, какой Claude умный, что аж жутко. 🔺 с помощью модели Mythos Preview взломали macOS за пять дней. Apple потратила на защиту пять лет разработки 🔺правительство США запретило Claude Fable 5 из-за угрозы взлома систем. 🔺 OpenAI тайно использовала Claude 🔺 в эту пятницу правительство сняло блок на Mythos 5, самую мощную модель, для 100 американских компаний и госорганов При этом стуэйшен на рынке такой: 🤖 ChatGPT всё ещё №1, но упал ниже 50% рынка 🤖 Claude за 5 месяцев вырос с 60 до 245 млн пользователей (в 4 раза), а ChatGPT с 800 млн до 900 (на ~12%) 🤖В корпоративном сегменте Claude обогнал OpenAI ещё в 2025 🤖 13% пользователей Claude платят за подписку — лучший показатель конверсии в индустрии 🤖 В кодинге Claude держит 54% рынка, OpenAI — 21% А вы что думаете, пиар или не?

#anthropic #claude #chatgpt #ai-market #marketing #tech-news

ИИ🔥

Wan Streamer: ИИ-агент для видеозвонков от Alibaba

@EF9MERA в Telegram ↗1 дн

Wan Streamer: ИИ-агент для видеозвонков от Alibaba Китайцы видимо тоже устали от тысячи встреч в календаре и решили упростить нам жизнь)) ✦ Одна модель, которая слушает, видит, говорит и выводит видео в реальном времени ✦ Задержка ~200 мс, полный цикл с учётом сети ~550 мс ✦ Это единственная система с синхронным аудио-видеоответом менее чем за секунду ✦ Поддерживает full-duplex: продолжает воспринимать речь и видео, пока генерирует ответ ✦ Текущая версия выдаёт 192p, более высокое разрешение появится позже 👉🏼 Подробнее 👀 EFEMERA

#ai #alibaba #wan-streamer #video-calls #llm #tech

ИИ🔥

Релиз модели Qwen3.6-34B-80L-Fable-5-Heretic

@GreenNeuralRobots в Telegram ↗1 дн

Qwen3.6-34B-80L-Fable-5-Heretic Продолжаем парад дистилляций Fable-5 основана на Qwen3.6-27B, снята цензура. Фокус на агентные сценарии и сложные логические цепочки • 34B параметров, 80 слоев рассуждения • дистилляция из Fable-5 Agentic Traces • дообучение на 4665 CoT-траекториях через QLoRA • формат 4-bit NF4, rank=64 GGUF #reasoning #gguf

#qwen #llm #gguf #ai #reasoning #fable

ИИ🔥

DeusData/codebase-memory-mcp: высокопроизводительный индексатор кодовой базы

@sergiobulaev в Telegram ↗1 дн

🔹 DeusData/codebase-memory-mcp ⭐ 18337 звёзд · C MCP-сервер, который индексирует кодовую базу в граф знаний и отвечает на структурные запросы AI-агентам. Написан на чистом C без зависимостей, едет одним статическим бинарником под macOS, Linux и Windows. Парсит 158 языков через tree-sitter, для 10 (Python, TS, Go, Rust, C++, Java и др.) подключает LSP с выводом типов. Linux kernel — 28M строк, 75K файлов — индексирует за 3 минуты, запросы укладываются в миллисекунду. Внутри встроенные эмбеддинги Nomic (768d int8) для семантики без API-ключей, граф в SQLite со сжатием zstd коммитится в репу как .codebase-memory/graph.db.zst. 14 MCP-инструментов: трассировка вызовов, анализ влияния, поиск мёртвого кода. Автоконфиг для 11 агентов — Claude Code, Cursor, Aider, Windsurf. репозиторий Сергей Булаев AI 🤖 — об AI и не только

#mcp #ai-agents #codebase #tree-sitter #sqlite #dev-tools

ИИ🔥

Google ограничила доступ Meta к Gemini из-за нехватки мощностей

@vcnews в Telegram ↗2 дн

Google ограничила доступ к Gemini для Meta (запрещена в России) из-за дефицита мощностей, узнала FT. Из-за этого Meta пришлось сдвинуть сроки некоторых внутренних ИИ‑проектов. Компания также попросила сотрудников «более эффективно» расходовать токены vc.ru/ai/3001352

#google #meta #gemini #ai #infrastruktura

Ещё ↓