hFeed
И

ИИ

Wan Streamer: ИИ-агент для видеозвонков от Alibaba

E@EF9MERA2 дн
Wan Streamer: ИИ-агент для видеозвонков от Alibaba Китайцы видимо тоже устали от тысячи встреч в календаре и решили упростить нам жизнь)) ✦ Одна модель, которая слушает, видит, говорит и выводит видео в реальном времени ✦ Задержка ~200 мс, полный цикл с учётом сети ~550 мс ✦ Это единственная система с синхронным аудио-видеоответом менее чем за секунду ✦ Поддерживает full-duplex: продолжает воспринимать речь и видео, пока генерирует ответ ✦ Текущая версия выдаёт 192p, более высокое разрешение появится позже 👉🏼 Подробнее 👀 EFEMERA

Релиз модели Qwen3.6-34B-80L-Fable-5-Heretic

Qwen3.6-34B-80L-Fable-5-Heretic Продолжаем парад дистилляций Fable-5 основана на Qwen3.6-27B, снята цензура. Фокус на агентные сценарии и сложные логические цепочки • 34B параметров, 80 слоев рассуждения • дистилляция из Fable-5 Agentic Traces • дообучение на 4665 CoT-траекториях через QLoRA • формат 4-bit NF4, rank=64 GGUF #reasoning #gguf

DeusData/codebase-memory-mcp: высокопроизводительный индексатор кодовой базы

Google ограничила доступ Meta к Gemini из-за нехватки мощностей

v@vcnews2 дн
Google ограничила доступ к Gemini для Meta (запрещена в России) из-за дефицита мощностей, узнала FT. Из-за этого Meta пришлось сдвинуть сроки некоторых внутренних ИИ‑проектов. Компания также попросила сотрудников «более эффективно» расходовать токены vc.ru/ai/3001352

audio.cpp: высокопроизводительный C++ движок для аудиоинференса

audio.cpp C++ движок для аудиоинференса на ggml. заявлен прирост 1.8–5x по сравнению с Python‑реализациями, плюс есть оптимизация под CUDA. - синтез речи. - распознавание речи. - VAD (Voice Activity Detection) - детекция голосовой активности. - конвертация голоса (изменение тембра, пола и т. д.). - генерация музыки/аудиофрагментов Windows / Linux / macOS #tts #stt #vad #t2m #text2music #voice2voice

Alibaba представила модель Wan Streamer v0.1 для видеозвонков с AI-агентами

Alibaba показала модель для видеозвонков AI-агентам Wan Streamer v0.1 одновременно слышит, видит, думает, говорит и генерирует видео. Всё в одной модели. Задержка 200 мс при 25 кадрах в секунду с разрешением 192p. https://wan-streamer.com/

Трансформация менеджмента и оргструктуры в AI-native компаниях

США сняли ограничения на использование модели Claude Mythos 5

Методы визуализации результатов моделей машинного обучения

Я считаю не надо на этом останавливаться. Вот несколько недоисследованных идей как лучше презентовать результаты своих моделей: 1. Менять ширину столбиков абсолютно легально 2. Не забываем про альфа канал

Дайджест AI/ML: новости и релизы (15-28 июня 2026)

Обзор лучших продуктов Product Hunt за 22-27 июня 2026 года

Теневой рынок доступа к LLM в Китае

Подкаст об исследовательском мышлении в AI с Татьяной Гайнцевой

Ограничения использования LLM для симуляции A/B-тестов

Обзор обновлений и планов развития бенчмарка SWE-rebench

Coinbase переходит на китайские LLM для оптимизации расходов

Криптобиржа Coinbase перешла на китайские модели, потому что так дешевле Процессы перевели на GLM 5.2 и Kimi 2.7. Теперь Coinbase тратит больше токенов, чем когда-либо, но платит вдвое меньше, чем с западными моделями. Гендиректор Coinbase заявил, что в компании нет лимитов на токены. Но есть правило «чем больше токенов ты тратишь, тем большей эффективности от тебя ждут». Такой подход, по его словам, тоже помогает сократить расходы. https://the-decoder.com/coinbase-joins-the-rush-to-chinese-ai-models-as-western-labs-face-a-pricing-stress-test/

Ограничения доступа к нейросетевым моделям

MuonMD: новый метод нормализации весов для оптимизации нейросетей

DeepSeek представили DSpark: открытый стек для ускорения генерации LLM

Экспортный контроль ИИ: прецедент с Anthropic и Fable

США: “Эта модель может быть слишком сильной для кибератак.” Anthropic: “Но это не уникальная опасность, так умеют и другие модели.” США: “BONK! Доступ закрыть.” Так ничего и не успел завайбкодить с Fable. Это, конечно, прецедент. Экспортный контроль, придуманный для чипов и урана, натянули на софт. Модель теперь — чемодан с изотопом, который иностранцу показывать нельзя (даже если этот иностранец её и обучал). Урок для всех остальных читается так: будешь честно рассказывать, на что способна твоя нейронка — придут и выключат. Будешь молчать — может, пронесёт.😅

Тренды AWS Summit: переход от чат-ботов к автономным бизнес-агентам

Сходил на AWS Summit в Нью-Йорке. Агенты были почти на каждом стенде. Со сцены - AWS Context, knowledge graphs, свои агенты, интеграции, governance, Bedrock, MCP. Главный сдвиг: рынок уходит от «чатботов» к рабочим системам, где агенту дают контекст компании, права, инструменты, ограничения и журнал действий. Дать агенту доступ, к правильным данным (контекст) это только первые шаги ИИ в бизнес. Следующая волна AI-продуктов будет не про «агент ответил», а про «агент выполнил повторяемую работу, которую бизнес готов принять, а регулятор/аудитор проверить через 18 месяцев».

Анонс моделей OpenAI GPT-5.6: Sol, Terra и Luna

Open-source проект для автоматического распознавания и визуализации птиц

Нашел классный АИ-проект из опенсорса за ~60$ 1. Raspberry Pi слушает ваш балкон/оуно и определяет птиц которые были рядом 2. txt2img нейронка генерирует иллюстрацию этой птицы 3. сгенерированные птицы собираются в интерактивный коллаж, где на каждую можно кликнуть, почитать, посмотреть как в полете выглядит и тп 4. если вывести на отдельный экран, будет ваш персональный постер птиц Тут исходники и инструкция: https://github.com/Twarner491/AvianVisitors А тут пример дашборда с птицами: https://bird.onethreenine.net

Анонс серии моделей OpenAI Mythos: Sol, Terra и Luna

Анонс серии моделей OpenAI Mythos: Sol, Terra и Luna

Skill-файл для настройки AI-агентов в UI-разработке

🔹 emilkowalski/skill ⭐ 2524 звезды Эмиль Ковальски собрал skill-файл на основе своих статей и курса об анимации в интерфейсах. Внутри - немного знаний для дизайнеров и инженеров, которые строят UI: анимации, тосты, диалоги, drawer-компоненты. Формат skill-файла подхватывают Claude и другие агенты - кладёшь файл в проект, и модель начинает применять принципы автора при генерации интерфейсов. Подробности и сам файл лежат на emilkowal.ski/skill. репозиторий Сергей Булаев AI 🤖 — об AI и не только

Google ограничила доступ Meta к мощностям для обучения ИИ

Google ограничила доступ M**a к ИИ-моделям Gemini из-за высокой нагрузки на инфраструктуру Google урезала доступ M**a Platforms к своим мощностям для обучения ИИ-моделей Gemini. По данным Financial Times, M**a запросила такой объём ресурсов, который Google просто не потянула. Источники говорят, что речь не о конфликте, а о банальной нехватке «железа». История показывает: дефицит серверов и чипов бьёт уже и по самым крупным техногигантам. #google #me #искусственныйинтеллект 📎Подробнее 🔖 3DNews в TG | MAX | VK

Coinbase перевела разработчиков на китайские ИИ-модели

v@vcnews3 дн
Глава Coinbase Брайан Армстронг рассказал, что перевёл своих разработчиков на «дешёвые» китайские ИИ-модели. Он заявляет, что «вдвое» снизил расходы на токены. Выбрать нейросети от Anthropic и OpenAI всё ещё можно, но по умолчанию включены GLM 5.2 и Kimi 2.7 vc.ru/ai/3000940
Ещё ↓

Настройка шрифта

В тренде