hFeed
И

ИИ

Яндекс тестирует платформу для создания ИИ-агентов в Алисе

v@vcnews2 дн
«Яндекс» начал тестировать платформу для создания ИИ-агентов в «Алисе AI» — пока внутри компании, уже есть агенты для «Такси» и «Лавки», которыми может воспользоваться часть пользователей. К концу 2026 года доступ к платформе откроют и стороннему бизнесу https://vc.ru/ai/3001880

Claude Code и загрузка видео с YouTube

Попросил Claude Code скачать мне видео с YouTube. Думал, что ответит про авторские права и подобное — нет, ни фига, никаких вопросов и сомнений, бодро взялся за дело. Заодно я узнал, что на Python есть специальная библиотека для таких задач.

Итоги вебинара AI Coding: лучшие практики и нераскрытые темы

Выжимка четвертого потока вебинара AI Coding - What Works. Вот список приемов AI Native разработки, которые участники выбрали себе как самые важные и полезные. А давайте, расскажем теперь про то, на что времени не хватило! На какие вещи не хватило времени? Про что хотелось бы узнать больше всего? Пишите в комментарии! Ваш, @llm_under_hood 🤗

Google реорганизует подразделение ИИ для программирования

История развития сервисов распознавания лиц: от FindFace до Sherlock AI

Уязвимость JaiLIP: обход защиты мультимодальных нейросетей через изображения

Австрия предлагает ЕС привлечь Anthropic на фоне ограничений США

AI как редактор и валидатор: опыт использования

OpenAI представила линейку моделей GPT-5.6

UnityShots: генерация связных видеоисторий на базе LTX-2.3

UnityShots Превращает диффузионную модель (LTX-2.3 22B) в инструмент для многокадровых видеоисторий. Генерирует связную последовательность кадров как единый mp4. • сохраняет идентичность персонажа между кадрами • держит постоянство сцены, света, реквизита • синхронно генерирует аудио и липсинк • управляет типами монтажных склеек • три режима инференса: T2V, I2V, R2V • обучение через Shots-Forcing Гитхаб ждем #text2movie #multishot #referencing

Обзор обновлений Apple Intelligence и архитектуры моделей AFM

Magnific AI представил инструмент FLOW для генерации видео

Ну, за эфыксеров! От смешных эффектов в Pika к нормальным таким крепким VFX в Magnific. Интересно, как специализированные задачи выделяются в отдельные ИИ-пайплайны у разных провайдеров видео генерации. Магнитик представил FLOW. Композеры занервничали. Пробуем тут: https://www.magnific.com/app/tools/flow @cgevent

Suno Spark: скрытые риски программы для музыкантов

Ограничение доступа к мощным ИИ-моделям: новая реальность

Проблема деградации внимания в LLM при больших контекстных окнах

Влияние ИИ-агентов на продуктивность и нагрузку разработчика

Обзор ключевых событий в AI и DS за неделю

Wan Streamer: интерактивная ИИ-модель для потокового видео

Wan Streamer Потоковая интерактивная дуплексная аудио-видео модель, ИИ-аватар, отвечающий в рилтайме. Закрывает разрыв между речью и анимацией аватара - всё в одном потоке. В базе в качестве LLM Qwen 2.5 / Qwen 3 - непонятно какая конкретно • субсекундная задержка, 25 fps, 192p • full-duplex режим • синхронные мимика, взгляд, жесты, дыхание • единая модель вместо раздельных VAD/ASR/TTS Кода-весов нет #avatar #intereactive

Alibaba представила Wan Streamer v0.1 для real-time общения с AI-аватаром

Анализ маркетинговой стратегии и рыночных показателей Anthropic

Wan Streamer: ИИ-агент для видеозвонков от Alibaba

E@EF9MERA2 дн
Wan Streamer: ИИ-агент для видеозвонков от Alibaba Китайцы видимо тоже устали от тысячи встреч в календаре и решили упростить нам жизнь)) ✦ Одна модель, которая слушает, видит, говорит и выводит видео в реальном времени ✦ Задержка ~200 мс, полный цикл с учётом сети ~550 мс ✦ Это единственная система с синхронным аудио-видеоответом менее чем за секунду ✦ Поддерживает full-duplex: продолжает воспринимать речь и видео, пока генерирует ответ ✦ Текущая версия выдаёт 192p, более высокое разрешение появится позже 👉🏼 Подробнее 👀 EFEMERA

Релиз модели Qwen3.6-34B-80L-Fable-5-Heretic

Qwen3.6-34B-80L-Fable-5-Heretic Продолжаем парад дистилляций Fable-5 основана на Qwen3.6-27B, снята цензура. Фокус на агентные сценарии и сложные логические цепочки • 34B параметров, 80 слоев рассуждения • дистилляция из Fable-5 Agentic Traces • дообучение на 4665 CoT-траекториях через QLoRA • формат 4-bit NF4, rank=64 GGUF #reasoning #gguf

DeusData/codebase-memory-mcp: высокопроизводительный индексатор кодовой базы

Google ограничила доступ Meta к Gemini из-за нехватки мощностей

v@vcnews2 дн
Google ограничила доступ к Gemini для Meta (запрещена в России) из-за дефицита мощностей, узнала FT. Из-за этого Meta пришлось сдвинуть сроки некоторых внутренних ИИ‑проектов. Компания также попросила сотрудников «более эффективно» расходовать токены vc.ru/ai/3001352

audio.cpp: высокопроизводительный C++ движок для аудиоинференса

audio.cpp C++ движок для аудиоинференса на ggml. заявлен прирост 1.8–5x по сравнению с Python‑реализациями, плюс есть оптимизация под CUDA. - синтез речи. - распознавание речи. - VAD (Voice Activity Detection) - детекция голосовой активности. - конвертация голоса (изменение тембра, пола и т. д.). - генерация музыки/аудиофрагментов Windows / Linux / macOS #tts #stt #vad #t2m #text2music #voice2voice

Alibaba представила модель Wan Streamer v0.1 для видеозвонков с AI-агентами

Alibaba показала модель для видеозвонков AI-агентам Wan Streamer v0.1 одновременно слышит, видит, думает, говорит и генерирует видео. Всё в одной модели. Задержка 200 мс при 25 кадрах в секунду с разрешением 192p. https://wan-streamer.com/

Трансформация менеджмента и оргструктуры в AI-native компаниях

Ещё ↓

Настройка шрифта

В тренде