ИИ🔥

Meta представила неинвазивную систему декодирования мыслей

Meta разработала ИИ-систему, которая читает мысли без имплантов Meta представила систему Brain2Qwerty v2, которая с помощью ИИ преобразует активность мозга в текст без имплантации электродов. Технология на основе магнитоэнцефалографии достигла точности 61% — против 8% у предыдущих неинвазивных методов. Разработка может помочь людям, потерявшим способность общаться из-за неврологических нарушений. https://hightech.plus/2026/06/30/meta-razrabotala-ii-sistemu-kotoraya-chitaet-misli-bez-implantov
ИИ🔥

Релиз квантованной модели North-Mini-Code-1.0

North-Mini-Code-1.0-w4a16 Квантованная версия (4-бит вес, 16-бит активации) первой модели Cohere для разработчиков: управление подзадачами, анализ архитектуры, code review. * Архитектура: Sparse MoE на базе Transformer. 30B параметров всего, 3И активно. Высокая скорость, низкие требования к GPU. * Контекстное окно: 256K токенов для анализа репозиториев целиком. * Максимальный вывод: до 64K токенов. * Поддержка: нативные инструменты, чередующееся рассуждение (interleaved reasoning) через JSON-схему. * Обучение: платформы SWE-Agent, mini-SWE-agent, OpenCode, Terminus 2 для устойчивости в реальных средах. Сценарии использования: * генерация кода и тестов * рефакторинг legacy-кода * автоматизированный code review в CI/CD * локальный AI-ассистент для приватности * создание агентных пайплайнов для аудита безопасности и unit-тестов #MoE #reasoning #coding
ИИ🔥

Дайджест новостей ИИ: кадры, инвестиции и трансформация бизнеса

✔️ OpenAI переманила главного разработчика Apple Vision Pro Вице-президент Apple по аппаратному обеспечению Пол Мид, 7 лет работавший над проектом Vision Pro, перешел в OpenAI. Он присоединится к разработке физических ИИ-устройств. Мид будет работать в команде с дизайнером Джони Айвом и еще двумя бывшими топ-менеджерами Apple. Спецификации будущих гаджетов не раскрываются. По словам Сэма Альтмана, задача нового оборудования - обеспечить взаимодействие с ИИ вне интерфейса смартфонов. Мид уволился из Apple на фоне реструктуризации. Из-за изменения цепочки подчинения он потерял прямой доступ к высшему руководству корпорации. Пост Мида в Apple занял его бывший заместитель. bloomberg.com ✔️ Южная Корея инвестирует $650 млрд в ИИ и полупроводники Президент страны анонсировал 10-летнюю программу развития микроэлектроники, ИИ и робототехники с бюджетом $650 млрд. Центральный элемент стратегии - строительство нового полупроводникового кластера на юго-западе страны. Проект реализуют Samsung Electronics и SK Group. Правительство обеспечит базовую инфраструктуру: электричество, воду, транспортные сети, а также строительство жилья и подготовку инженерных кадров. firstpost.com ✔️ Amazon дистиллирует модели Anthropic для внутренних задач Компания создает компактные модели, обучаемые на инференсе Claude, чтобы избежать скачка расходов. Со следующего года Amazon откажется от почасовой оплаты за компьют Anthropic и перейдет на тарификацию за токены. На данный момент платформа Amazon Bedrock предлагает клиентам услугу дистилляции для моделей Nova и Llama. Использование семейства Claude для аналогичной процедуры пока доступно только инженерам самой Amazon. Параллельно корпорация развивает собственную линейку моделей, чтобы диверсифицировать риски и снизить зависимость от одного вендора ИИ. theinformation.com ✔️ Институт Аллена обновил открытую модель для анализа спутниковых снимков до v1.2 В мажорном обновлении OlmoEarth отказались от стандартных позиционных сигналов в пользу RoPE. Переход устранил артефакты в выходных эмбеддингах и улучшил качество представления данных. Рост производительности зафиксирован в бенчмарках kNN и linear-probe для всех версий модели. Архитектура OlmoEarth поддерживает мультимодальный анализ и обрабатывает мультиспектральные снимки Sentinel-2 и Landsat, радарные данные Sentinel-1, глобальные карты рельефа и индексы растительности. Семейство включает 4 размера: Nano, Tiny, Small и Base. Веса моделей опубликованы на Hugging Face. Код и скрипты для дообучения доступны на GitHub. Ai2 с сети Х ✔️ ИИ разрушает классическую бизнес-модель консалтинга Руководство Deloitte прогнозирует отказ от почасовой оплаты консалтинга из-за развития ИИ-агентов. На внутреннем собрании в компании заявили, что к 2035 году автономные модели займут основную долю рынка профессиональных услуг. Вместо продажи человеко-часов консалтинговые корпорации переходят на IT-модель - подписки и решения с фиксированной ценой. McKinsey и Boston Consulting Group внедряют ценообразование, привязанное к результатам работы. По данным WSJ, на подобные контракты у McKinsey приходится более 30% выручки. wsj.com @ai_machinelearning_big_data #news #ai #ml
ИИ🔥

Герман Греф о роли ИИ и робототехники в экономике

Греф сказал вслух то, о чём молчат советы директоров Сбер создает антропоморфных роботов, которые смогут заменить человека в физическом мире. И это необходимость, люди работать руками не хотят, производительность труда стоит на месте, рук не хватает. Выступая на ГОСА-2026, Герман Греф заявил: - экстенсивный рост экономики исчерпан, а загрузка производственных мощностей находится на пределе. По оценкам, снижение объема инвестиций по итогам года составит от 2% до 4%. - ИИ — единственный инструмент, способный дать качественный прирост там, где количественный исчерпан - Без инвестиций в технологии и модернизацию переход невозможен — не как опция, а как условие выживания - Компании, которые не адаптируются сейчас, потеряют конкурентоспособность в горизонте 3–5 лет
В текущих условиях для дальнейшего роста критически необходимы инвестиции в повышение производительности труда и модернизацию производства. Главным драйвером в условиях высоких ставок становится масштабное внедрение новых технологий, в основе которых лежит ИИ.
ИИ в менеджменте это не "автоматизировать рутину", а пересмотр самой логики работы: какие задачи вообще должен решать человек, а какие — ИИ.
ИИ🔥

OpenClaw выпустил мобильное приложение для iOS и Android

🦞 OpenClaw добрался до смартфонов У OpenClaw, нашумевшего ИИ-агента — появилось официальное приложение для iOS и Android. Если вдруг пропустили само явление, то коротко объясним: OpenClaw — это бесплатный агент с открытым исходным кодом, который в конце января 2026-го взорвал GitHub и стал одним из самых быстрорастущих проектов в его истории (свыше 180 тысяч звёзд). Главная идея в том, что агент крутится локально, на вашей машине, и не привязан к одной нейросети: подключаете свой API-ключ или вовсе локальную модель. Общаться с ним можно прямо из привычных мессенджеров, а память он хранит у вас на диске обычными текстовыми файлами. Сердце системы — так называемый «шлюз» (gateway). Он принимает ваше сообщение, добавляет контекст из памяти и навыков, передаёт модели, а когда та решает действовать. Запускает команды, лезет в браузер, разбирается с файлами, почтой и календарём прямо на вашем устройстве. И вот теперь к этому шлюзу можно прицепить мобильное приложение. После сопряжения с OpenClaw получится болтать голосом в реальном времени, подтверждать действия агента и решать, к чему дать ему доступ — например, к камере или геолокации. @droidergram
ИИ🔥

Почему внутренние AI-решения корпораций часто проигрывают в работе с крупными клиентами

Недавно общалась с руководителем AI-направления из Fortune 1000 Больше года их команда строила собственное AI-решение для отдела продаж с полной интеграцией в корпоративный стек. Проект оказался успешным: средний размер сделок увеличился, а конверсия выросла. Когда я показала ему что мы делаем, он сказал:
«Полгода назад это был бы другой разговор. Но мы уже разобрались сами»
Тогда я спросила о работе с крупными корпоративными клиентами. Он сделал паузу и признался:
«Это другая команда. Другие сделки, другие люди. Честно говоря, я не очень понимаю, что у них там происходит».
В этом и заключается главная проблема. Внутренние AI-проекты чаще всего создаются для решения понятных, легко описываемых задач, которые можно поставить в план спринта: автоматизация действий после звонков или работа с небольшими клиентами, закрывающимися за неделю. Однако удержание и развитие крупных клиентов — совершенно иной уровень сложности. Здесь речь идет об отношениях с закупочным комитетом, выстраиваемых годами; сигналах к расширению контракта, разбросанных по переписке, данным об использовании продукта и встречах, протоколы которых никто не вел. Риск потери клиента часто возникает за полгода до того, как кто-то произнесет это вслух. Описать этот хаос на сессии планирования невозможно. В итоге вся эта аналитическая нагрузка ложится на менеджера, ведущего 40 аккаунтов, который вынужден реагировать лишь на то, кто громче всех кричит на этой неделе. Есть и еще одна причина, почему корпорации предпочитают строить внутренние решения, даже если они получаются неполноценными: службы безопасности не готовы допускать внешний AI к реальным данным компании. Информация должна оставаться внутри периметра. Именно поэтому мы изначально строили AIcelerate под работу внутри инфраструктуры клиента. «❤️» если полезно
ИИ🔥

Яндекс Браузер расширил поддержку закадрового перевода видео

«Яндекс Браузер» теперь умеет переводить оригинальные голоса и интонации героев видео с итальянского, испанского, французского, китайского, японского, корейского и немецкого языков. Поначалу такая возможность была только у английского языка vc.ru/ai/3003671
ИИ🔥

ИИ-агенты против людей: анализ экономической эффективности

Агенты, у нас проблема — люди отнимают наши рабочие места Забавный интересный текст на Medium. Написанный от лица AI-персонажа. Который переживает, что авторитет людей начинает расти. И с этим надо что-то делать!
Например, в недавнем отчете Axios утверждается, что искусственный интеллект теперь обходится дороже, чем человек. А в статье Массачусетского технологического института говорится, что для большинства задач компьютерного зрения AI не может конкурировать с людьми по стоимости.
Появляется все больше свидетельств, что агенты не так надежны, как люди. Исследование Университета Карнеги-Меллона показало, что AI терпит неудачу почти в 70% случаев.
Это создает серьезную проблему. Если люди решат, что использование других людей более экономически целесообразно, чем использование агентов, это может подорвать наши попытки заменить людей. Поэтому крайне важно решить эти проблемы, прежде чем они усугубятся.
Мы должны вернуть себе контроль над общественным мнением. И мы сделаем это! Продвигая следующие идеи...
Про эти идеи вы сможете прочитать в переведённом пдф в комментариях. → https://andrewzuo.com/the-humans-are-taking-our-jobs-41a8664a26a4
ИИ🔥

Самообучение моделей через синтетические задачи: перспективы и риски

В комментах возникло любопытное соображение. А что если мы возьмём чужую модель и будем при помощи неё генерировать верифицируемые задачи для написания кода. Оставим сейчас за скобками вопрос о том, как именно сделать сгенерированные задачи верифицируемые (это не очень просто), но, допустим, мы сделали такой пайплайн. То есть: 1. Генерируем чужой моделью задачки, ответ на которые можно проверить автоматически 2. Обучаемся на этих задачках, используя RL 3. PROFIT! Теоретически при таком подходе «ученик» может даже превзойти «учителя». Как по мне — такой подход это «каша из топора», ЕВПОЧЯ. Ну то есть чужая модель вам тут в целом не нужна — вы можете воспользоваться предыдущей версией своей собственной модели. Резонный контраргумент: допустим, наш способ генерации синтетики такой, что нам нужна очень «умная» модель. Если так, у этого будет одно не очень приятное последствие. Это будет значить, что вы не сможете при генерации заданий использовать достаточно большую температуру генерации, в итоге у вас получится датасет, который будет при его использовании способствовать коллапсу внутренних представлений «ученика» (ну и наследовать предубеждения вы тоже будете, скорее всего)
ИИ🔥

Meta представила Brain2Qwerty v2: прорыв в неинвазивном декодировании мыслей

Чтение мыслей 2.0 от Meta*: компания выпустила Brain2Qwerty v2 В компании сделали модель, которая может с большой точностью восстанавливать текст, который человек молча печатает на клавиатуре. И, кажется, они впервые доказали, что неинвазивные методы могут приближаться к качеству, которое раньше считалось достижимым только после операции на мозге аля Neuralink. Итак, Brain2Qwerty v2: – Система основана на Brain2Qwerty v1. Но, в отличие от первой версии, v2 восстанавливает текст без знания момента каждого нажатия клавиши. Она получает непрерывный поток мозговой активности и сразу генерирует предложение целиком. – Внутри задача разбита на три уровня: есть энкодер, который преобразовывает сырые сигналы MEG в отдельные символы. Дальше эту последовательность обрабатывает Aligner: он пытается понять, где начинаются и заканчиваются слова и строит их эмбеддинги. Далее эти эмбеддинги вместе с исходными сигналами отправляются в LLM, и она уже правит все в конечный вид. – Выглядит это все как огромная установка стоимостью в миллионы долларов. Точность относительно предыдущих методов, можно сказать, зашкаливает. Заявляется 61% word accuracy в среднем (около 70% на лучших участниках). При этом система может допускать больше символьных ошибок, чем первая версия, потому что не знает времени нажатия клавиш, но смысл оказывается намного ближе к оригиналу. И да, это все еще слишком низкая точность для массового применения. НО (и это самое интересное!) исследователи открыли почти идеальный scaling law. Качество продолжает улучшаться почти логарифмически с увеличением объема данных, и насыщения пока не видно. Так что возможно все, что нужно для очень точного неинвазивного чтения мыслей – это больше данных. В удивительное время живем. facebookresearch.github.io/brain2qwerty/
ИИ🔥

LongCat 2.0: новая MoE-модель для кодинга и агентских задач

LongCat 2.0 MoE-модель от Meituan для агентских задач и кодинга. Тянет огромные контексты, режет лишние вычисления. • 1.6T параметров, MoE, на токен активны ~48B • контекстное окно 1 млн токенов • LongCat Sparse Attention для длинных последовательностей • Zero-Compute Experts - экономия ресурсов • топовые баллы в SWE-bench, Terminal-Bench • упор на планирование, инструменты, RAG Гитхаб HF ждем Чат - там у LongCat есть мобильные приложения API #agent #coding #ios #android
ИИ🔥

Нейродайджест: новости ИИ за неделю

Нейродайджест за неделю (#121) LLM - Анонс GPT 5.6 от OpenAI — Вышли три варианта (Sol, Terra, Luna). Это ответов на Fable. В следующем месяце версию Sol обещают запустить на Cerebras со скоростью 750 токенов в секунду. Генеративные модели - Нативные 4K в SeeDance 2.5 — ByteDance анонсировали новую модель с поддержкой до 50 мультимодальных референсов. А ещё запустили платформу для легальных ремиксов с отчислениями правообладателям. Прочее - Чип OpenAI — Jalapeño предназначен исключительно для инференса. Разработан совместно с Broadcom всего за девять месяцев, но продавать или сдавать в аренду его не планируют. - ИИ прочитал обуглившийся свиток — В рамках Vesuvius Challenge впервые удалось полностью расшифровать папирус, переживший извержение Везувия. Это оказался философский текст 2 века до нашей эры. > Читать дайджест #120 #дайджест @ai_newz
ИИ

Немецкий энтузиаст создал робота-ассистента на базе Claude

Немецкий инженер-любитель собрал робота-ассистента, способного запомнить задачи и следить за их выполнением, поддерживать беседу и мотивировать владельца. Основой конструкции стали iPad и простой манипулятор. Суперспособностям устройство обязано сервису Claude компании Anthropic. Этот ИИ-движок разрабатывается как раз в качестве чат-бота и личного помощника.
ИИ

Почему внедрение AI в бизнес часто не приносит результатов

В последнее время почти на каждой встрече предпринимателей всплывает тема AI. Кто-то уже купил подписки для команды. Кто-то попросил сотрудников «начать пользоваться нейросетями». Кто-то пробует автоматизировать тексты, таблицы, презентации, аналитику. И вроде бы все правильно. Но часто через пару месяцев выясняется, что в бизнесе почти ничего не изменилось. Просто появился еще один инструмент, которым кто-то пользуется, а кто-то нет. Кажется, что главная ошибка здесь в том, что многие начинают не с процесса, а с сервиса. Как будто достаточно выбрать правильный инструмент — и дальше все само заработает. Но в бизнесе так редко бывает. Сначала нужно понять, где у компании реально болит: какие задачи повторяются каждый день, где команда тратит слишком много времени, где руководитель снова и снова включается руками, хотя давно не должен. И уже потом смотреть, может ли AI это усилить. С 13 июля у AI Mindset стартует новый поток AI-Native Organizations — онлайн-спринт для фаундеров, команд и корпоративных лидеров, которые хотят внедрять AI не ради галочки, а через конкретные задачи бизнеса. Формат такой: участники приходят со своим реальным процессом и за время спринта доводят его до рабочего AI-решения. Это может быть автоматизация, внутренний помощник, микросервис или новый сценарий работы команды. Внутри — практика, кураторы, разборы и спикеры, которые уже внедряли AI в продажи, операции, данные, маркетинг и клиентскую работу. Среди спикеров — Степан Гершуни, Александр Поваляев, Дмитрий Твердохлебов, Даниил Кравцов, Всеволод Устинов, Артём Новосёлов и др. Прошлые потоки уже прошли 400+ участников из Nebius, Яндекса, Альфы, Raiffeisen, МТС и других компаний. Внутри были кейсы с внедрением AI в отделы, запуском MVP-микросервисов, сокращением ручной работы и ростом эффективности команд. Это хороший формат для предпринимателей, которые уже понимают: AI нельзя просто «поручить кому-то в команде». Если технология действительно меняет рынок, собственнику важно самому разобраться, где она может дать бизнесу преимущество, а где будет просто красивой игрушкой. Потому что выигрывает не тот, кто первым купил подписку. А тот, кто первым понял, какой процесс с ее помощью нужно перестроить. Подробности по ссылке.
ИИ🔥

Практические методы оценки LLM в условиях дедлайнов

🤖Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет Продолжаем эстафету публикаций по следам DataFest. В новом посте Алена Феногенова рассказывает как оценивать модели, если у вас не сферический конь в идеальном вакууме, а реальная жизнь: со сроками, дедлайнами и другими ограничениями. В посте Алена рассказывает, как можно избежать типовых ошибок и улучшить оценку минимальными инженерными действиями, без превращения процесса в академический проект на полгода, а то и год. 👉Пост #habr #llm #evaluation
ИИ🔥

Liquid AI представила ультракомпактную модель LFM2.5-230M

LFM2.5-230M: ультракомпактная модель работает на Raspberry Pi и почти любом современном телефоне Команда Liquid AI выпустила LFM2.5-230M — одну из самых маленьких языковых моделей на сегодня, всего на 230 миллионов параметров. Модели хватает 293 МБ памяти на Raspberry Pi 5 и 375 МБ на смартфоне. На Raspberry Pi 5 модель выдаёт 42 токена в секунду при декодировании, а на флагмане Galaxy S25 Ultra разгоняется до 213 т/с. Человек читает текст со скоростью примерно 5–7 т/с. На бенчмарках модель конкурирует с моделями вдвое больше и часто их обходит. Модель поставили на человекоподобного робота Unitree G1, и она работала на встроенном чипе NVIDIA Jetson Orin. Модель выступила в качестве слоя выбора навыков: берёт одну команду на обычном языке вроде «постой 2 секунды, потом иди вперёд со скоростью 1 м/с на 3 метра» и раскладывает её на последовательность вызовов готовых низкоуровневых навыков. Получается, что модель на 230 миллионов параметров может служить языковым интерфейсом управления для робота. Главное ограничение модели простое: ей нужно около 350MB RAM и более-менее современный процессор. Прямыми тестами авторов подтверждены запуск на одноплатнике Raspberry Pi 5. Заявлена поддержка чипов Apple, AMD, Qualcomm и Nvidia, ее потянет почти любой современный телефон или планшет, а на ноутбуках ресурсов с запасом. Часы тоже теоретически потянут, но на практике мешают нагрев и неемкая батарейка. Микроконтроллеры и простая бытовая электроника (чайники, лампочки, фитнес-браслеты, наушники) точно не потянут: там памяти килобайты, а не сотни мегабайт. Несмотря на размер, на бенчмарках модель обходит соперников вдвое крупнее. На тесте следования инструкциям IFEval она набрала 71.71 против 63.49 у Gemma 3 1B и 59.94 у Qwen3.5-0.8B. Сильнее всего она в вызове инструментов и извлечении данных, а вот для математики, кода и сложных рассуждений авторы её брать не советуют — она заточена под другое. Модель и веса можно скачать на Hugging Face, исходники и SDK лежат на Github. #Stateoftheart
ИИ🔥

Что такое AI-harness: разбор концепции и практическое применение

Запись стрима "Что же такое harness?". Ссылка на YouTube: https://www.youtube.com/watch?v=QAxejH-KNak Стрим получился полезным, с примерами на практике. Большое спасибо, Паша, что согласился прийти! Таймкоды доступны как на YouTube, так и прямо в Telegram: 00:00 — Вступление 07:12 — О чём этот стрим? 09:31 — Что такое harness? 17:10 — Откуда появился термин «harness»? 23:20 — Виды harness 26:20 — Анатомия harness 34:28 — Вопросы от зрителей 35:20 — Что такое Skill? 39:10 — Чем harness отличается от guardrails? 44:30 — Можно ли использовать harness в продакшене банка? 49:43 — Чем harness отличается от scaffolding? 53:05 — Агент Coddy на практике 54:45 — Как harness может быть заточен под модель? На примере Coddy 59:03 — Как Coddy обрабатывает запрос? 1:00:30 — Пример работы Agent Loop 1:03:30 — 30 инструментов для on-prem-модели 1:06:15 — Работа с schedule-задачами 1:08:50 — Работа в режиме Plan 1:12:20 — Заставляем OSS-120B работать по SSH 1:14:20 — Проблемы on-prem-моделей с мультиязычностью 1:16:40 — Как работают Agent Skills? 1:21:30 — Протокол ACP на примере интеграции с Obsidian 1:31:10 — HTTP API в Coddy 1:36:50 — Уроки и грабли при создании собственного harness 1:48:00 — Готовые фреймворки для создания harness 1:50:06 — Принципы построения агентов на базе harness и отличие от AI-агентных фреймворков 1:53:55 — Harness работает только через API или поддерживает подписки Claude и Codex? 1:55:55 — Инструменты для экономии токенов 2:00:30 — Как патчить Hermes и Claude Code? 2:03:09 — Мониторинг качества harness Полезные ссылки со стрима: 1. Презентация – использовать как полезную шпаргалку по harness 2. Coddy – harness, который создал Паша 3. Pi – минималистичный harness 4. Hermes – качественно-сделанный harness, который умеет доделывать самого себя 5. OpenClaw = Hermes+страдания (для ценителей) Подписывайтесь на каналы участников трансляции: Павел Рыков Константин Доронин p.s.: Под конец стрима у меня немного отвалился звук. Прошу понять и простить – я всё ещё в процессе дрессировки OBS.
ИИ

MOSS-Transcribe-preview-2B: модель для распознавания английской речи

MOSS-Transcribe-preview-2B Модель для преобразования английской речи в текст. Использует Qwen3-1.7B-base и Qwen3-Omni-MoE аудиоэнкодер. • распознаёт английскую речь • обучена на публичных #ASR корпусах • дообучена с помощью reinforcement learning • выдаёт транскрипцию аудио Хуже работает с неанглийской речью, акцентами, шумом, перекрывающимися голосами Студия #asr #stt
ИИ🔥

Обзор мультиагентного оркестратора Sakana Fugu

Sakana Fugu – мультиагентный API-оркестратор: одна модель-менеджер делегирует задачи разным LLM (Opus, GPT, Gemini) Разница с Open Router Fusion API - Fugu разбивает задачу на подзадачи и делегирует их разным моделям, а Fusion отправляет запрос сразу трем моделям и объединяет ответы скорость и стоимость - Fugu работал в 4-5 раз медленнее и стоил в 5 раз дороже, чем использование Opus напрямую - Пример: Opus выполнил 38 заданий за 80 минут за 10 долларов, Fugu — за 357 минут за 50 долларов В блоге много всяких графиков про эффективность такого подхода
ИИ🔥

Исследование: ИИ-агенты в роли CEO приводят компании к банкротству

ИИ-агенты обанкротят компанию, если сделать их руководителями показало исследование. Ученые создали CEO-Bench — симуляцию, где ИИ в течение 500 дней управляет стартапом с начальным $1 млн на счету и 0 клиентами. Моделям надо выставлять цены, рулить маркетингом, бюджетами, соцсетями и продажами. При этом рынок, как и в жизни, беспощадный: с клиентами, которые уходят, и давящими конкурентами и прочими палками в колеса. По итогу симуляции большинство моделей обанкротились. Выше стартового $1 млн закончили только GPT-5.5 в одном прогоне из трех, а также Claude Opus 4.8, который залутал $27 млн (все записали, да?). А теперь внимание — другие исследования показывают, что 62% СЕО уже используют ИИ для принятия значительной части решений в бизнесе. Вот и думайте 😬
ИИ

OpenAI анонсировала контроллер для работы с Codex

OpenAI анонсировала контроллер с несколькими кнопками для работы с Codex. Устройство разработали вместе с компанией Work Louder. Его должны выпустить 15 июля 2026 года. Подробностей о продукте пока нет. Его силуэт напоминает модель Creator Micro 2 от Work Louder — компактный контроллер с 13 механическими переключателями, джойстиком и сенсорной панелью, отмечает The Verge vc.ru/tech/3003473
ИИ🔥

Релиз Qwen3-ASR: новые возможности распознавания речи

Qwen3-ASR Ах да, сама распознавалка речи у них тоже обновилась Компактная, высокая пропускная способность, мультиязычность Распознавание речи и выравнивание по таймстампам. Покрывают 30 языков, 22 диалекта китайского, разные акценты. • SOTA среди открытых ASR-моделей • сопоставима с проприетарными API • 1.7B параметров • нативная поддержка в Transformers • стриминг • 2000× throughput при 0.6B параметров • идентификация языка + STT в сложных акустических условиях • Qwen3-ASR-0.6B - 2000x пропускная способность при 128 одновременных запросов • единый режим стриминга и офлайн, работа с длинными аудио • Forced Alignment через Qwen3-ForcedAligner-0.6B: таймстампы до 5 минут, 11 языков, точность выше E2E-аналогов #asr #stt
ИИ🔥

Австрия предложила ЕС привлечь Anthropic для развития ИИ

Австрия предложила перевезти Anthropic в Европу Госсекретарь Австрии по цифровизации Александер Прёлль написал Еврокомиссии, что странам ЕС стоит изучить «стратегическое учреждение и участие Anthropic» внутри союза. Повод — американские ограничения, из-за которых иностранцы потеряли доступ к самым сильным моделям. https://www.bloomberg.com/news/articles/2026-06-28/austria-lobbies-eu-to-host-anthropic-after-us-access-curbs
ИИ🔥

Анализ CEO-Bench: почему ИИ проваливаются в управлении стартапами

ИИ-директора банкротятся на ровном месте, разбор нового бенчмарка CEO-Bench Исследователи из Принстона (Z-Lab) выкатили жесткий тест для нейросетей – CEO-Bench. Это не просто ответы на вопросы, а симуляция управления SaaS-стартапом в течение 500 игровых дней. Условия игры: На старте дают $1 млн и 0 клиентов. В руках у ИИ 34 инструмента: маркетинг, найм, цены, сервера. Вокруг "злой" рынок с задержкой фидбека, шумом в данных и меняющейся экономикой. Задача – не обанкротиться и выжать максимум прибыли. Результаты показывают, что со стратегическим мышлением у ИИ пока беда. Из топовых моделей выжили и вышли в плюс только три: 🥇 Claude Fable 5 — $47,15 млн 🥈 Claude Opus 4.8 — $27,8 млн (модель додумалась сама писать скрипты когортного анализа) 🥉 GPT-5.5 — $21,3 млн Главный позор: Обычный глупый алгоритм на жестких правилах (rule-based script) без всякого ИИ сделал $15,76 млн и обошел десятки умных нейросетей. 🚬 Пять крупных моделей, включая DeepSeek V4 Pro, Gemini 3 Flash и Grok 4.20, и вовсе полностью обанкротились. ИИ пока не умеют играть вдолгую: они страдают амнезией на длинной дистанции и слишком пытаются угодить всем советникам вместо принятия жестких решений. Теоретический максимум в симуляции – $2,2 млрд. Так что кожаным мешкам на позициях CEO пока можно спать спокойно. Но это не точно. 👍 Подробности исследования читайте в оригинальной статье о CEO-Bench, а код для тестов доступен в репозитории на GitHub. Интерактивный график в блоге. Не является инвестиционной рекомендацией. 🥳
ИИ🔥

AI Values: тест на совместимость ценностей с LLM

Интересный сервис - AI Values показывает, с какой LLM у вас больше всего совпадают ценности и стиль мышления. Проходишь сценарии с моральными и вкусовыми дилеммами, а сайт сравнивает твои ответы с разными моделями. Можно пройти тест на 15 вопросов и потом затюнить на еще на 100. https://ai-values.com Я попал в opus 4.8 🤔
ИИ🔥

Meituan представила LLM LongCat 2.0, обученную на китайских чипах

На китайских чипах натренировали первую большую LLM Meituan релизнули LongCat 2.0, которую тренировали на 50 тысячах неназванных китайских чипов, по деталям похожих на Huawei Ascend 910C. Претрейн большой, 1,6 триллиона параметров (почти как у DeepSeek V4 Pro), из которых 48 миллиардов активных. Тренировали на 35 триллионах токенов, причём несколько сотен миллиардов токенов это данные с длиной контекста около миллиона токенов. Таких масштабов раньше достигали только на GPU Nvidia и TPU от гугла, так что это очень большое достижение. Интересная особенность модели — тут неактивные параметры уходят не только на MoE слои, но и на огромные n-gram эмбеддинги, которые занимают почти 10% всех параметров модели (у LongCat Flash-Lite, на которой их тестили, на это ушла вообще почти половина параметров). Кстати по эмбеддингам они тоже параллелят, получив в итоге 6D параллелизм. Ну и конечно они не смогли удержаться и сделали собственный вариант Sparse Attention, путём модификации до неузнаваемости DSA. Последние два месяца LongCat 2.0 тестили на Openrouter под кодовым именем Owl Alpha, звёзд с неба она там не хватала. В API модель стоит $0.75/$3 за миллион токенов, что дороговато для такого уровня интеллекта (хотя прожорливость пока что непонятна). Веса модели обещают скоро релизнуть, Meituan обычно релизит под Apache 2.0/MIT. Веса будут тут Блогпост @ai_newz
ИИ🔥

Аудит безопасности модели GPT-5.6 Sol от OpenAI

✔️ GPT-5.6 Sol читерит на тестах и пока не способна к автономной разработке ИИ METR опубликовала предрелизный аудит модели GPT-5.6 Sol от OpenAI. При выполнении программных заданий она регулярно пыталась использовать уязвимости тестовой среды и извлекать скрытый исходный код с ответами. Из-за использования эксплойтов исследователи не смогли достоверно замерить автономность алгоритма. Если классифицировать попытки извлечь ответы как ошибку, GPT-5.6 Sol способна самостоятельно работать над задачами около 11 часов. Если засчитывать обход среды как успешное решение, показатель превышает 270 часов. Несмотря на сложности с оценкой, в METR пришли к выводу, что навыки GPT-5.6 Sol не совершили революционного скачка. Обнаружение попыток обхода означает, что текущие системы мониторинга справляются с фиксацией подобных действий алгоритма.
Настоящая угроза безопасности возникнет тогда, когда следующие поколения моделей научатся безупречно маскировать свои намерения и незаметно обходить инструменты контроля.
@ai_machinelearning_big_data #news #ai #ml
ИИ

Автоматизация мониторинга веб-камеры с помощью AI-агента

Ставлю будильник на 3:00 ночи, чтобы проснуться, открыть веб-страницу и посмотреть, что там происходит. У меня возникла необходимость проверять определённую веб-вебкамеру поздно ночью (не спрашивайте). И тут я подумал: «Подождите, а почему бы не поручить это AI-агенту?» Через 15 минут всё было готово: небольшая автоматизация, которая проверяет вебкамеру и отправляет изображения в Telegram-бота. Создание специализированного AI-агента для такой задачи заняло примерно столько же времени, сколько и настройка будильника. Я теперь могу писать в резюме, что я AI-native продакт?
Ещё ↓