Hirify Feed — профессиональная лента

💵 GFusion: как мы обучали диффузионную LLM в GigaChat

«А что, если LLM будет генерировать не строго по одному токену слева направо, а сразу блок текста?»

Именно эту идею мы проверяли в проекте GFusion — диффузионной языковой модели на базе GigaChat3-10B-A1.8B-base. Отдельно хочется отметить, что этот проект начал и довёл до релиза стажер команды GigaChat Pretrain. Он прошёл весь путь от идеи и первых экспериментов до обучения модели, оптимизаций, поддержки в inference runtime и публикации в open source. Почему это интересно? Классические LLM генерируют текст авторегрессионно: каждый следующий токен зависит от всех предыдущих. Это устоявшийся подход, но шаги генерации модели выполняются строго последовательно. В то же время диффузионная LLM берёт частично замаскированный блок и постепенно восстанавливает токены внутри него. За один forward pass модель может финализировать не один, а сразу несколько токенов. Так и появляется ускорение. Чем больше токенов модель уверенно восстанавливает за один проход, тем меньше шагов ей нужно для генерации ответа. Вместо дорогостоящего обучения с нуля мы взяли сильную авторегрессионную LLM и перевели её в диффузионный режим генерации. Цикл обучения включал: 🔘адаптацию AR-модели к диффузионной генерации; 🔘постепенное увеличение размера блока; 🔘сравнение полностью диффузионного обучения и гибридного подхода AR+dLLM; 🔘SFT с complementary masking и стадией confidence tuning для дополнительного ускорения генерации. Результаты: 🔘GFusion в режиме одного пользователя генерирует в среднем на 70% быстрее GigaChat3-10B-A1.8B. 🔘Даже по сравнению с GigaChat3-10B-A1.8B + MTP-головой ускорение составило около 39%. 🔘Просадка качества относительно авторегрессионной модели осталась в пределах 2–4 п.п., а сам трейд-офф между скоростью и качеством можно контролировать параметрами диффузионной генерации. 🔘Добавлена поддержка GFusion в SGLang и реализован entropy-bounded sampling — алгоритм семплирования, который ускоряет генерацию не только GFusion, но и других диффузионных LLM. 🔘Для обучения написана и выложена в open-source своя реализация attention на TileLang под структуру диффузионной маски и получено до +77% end-to-end ускорения относительно Flex-Attention на длинном контексте.

💡 Главный вывод GFusion состоит в том, что ускорение LLM может требовать переосмысления самого подхода к генерации. Однако, чтобы это заработало на практике, важно довести до рабочего состояния весь стек от обучения и SFT до декодинга, attention-ядер и поддержки в inference runtime.

➡️Подробности — в статье на Habr. ➡️HF: GFusion-10B-A1.8B-base GFusion-10B-A1.8B ➡️GitVerse

ИИ ai llm gigachat diffusion inference optimization

Экономика агентных цепочек: Claude Fable 5 vs Claude Sonnet 4.6

T@kryak_startup6 ч

# Зачем сравнивать Claude Fable 5 с Claude Sonnet 4.6 (который выше обзвали Sonnet 3.5) в агентных цепочках? 🤔 В комментариях к предыдущему посту спросили, зачем проводить сравнение Fable 5 с "устаревающей" Sonnet 3.5, если в продакшене все равно должна крутиться самая умная модель. Ответ лежит в плоскости экономического арбитража и математики ROI: 1. Claude Sonnet 4.6 (выпущенный в феврале 2026 года) — наш главный локомотив. Это сбалансированная флагманская модель от Anthropic, которая радикально превосходит старую серию Sonnet 3.5. Она приближается к уровню интеллекта Opus, имеет контекстное окно в 1 млн токенов и значительно улучшает исполнение кода, качество UI и агентное использование компьютера (Computer Use) на реальных десктопных и браузерных задачах. На основе логов нашей телеметрии за последнюю неделю 93% всех задач кодинга (26 вызовов из 28) были успешно решены именно на Claude Sonnet 4.6. Она быстрая и стоит всего $3 / $15 за миллион токенов (ввод/вывод). 2. Claude Fable 5 — тяжелая артиллерия. Да, она выдает невероятные 95.0% на SWE-bench Verified. Но её вызов стоит в 3.3 раза дороже (**$10 / $50** за миллион токенов). 3. Спекулятивный роутинг (Speculative Routing). Мы используем Gemini 3.5 Flash как легковесный классификатор на входе. Если задача простая — ее решает Claude Sonnet 4.6. Если классификатор видит пограничную сложность, запрос отправляется к Claude Fable 5. Итог за неделю: Вместо $10.65 USD (если бы мы все слали напрямую в Fable 5), наш фактический счет составил всего $2.13 USD. Это 80.0% чистой экономии бюджета при сохранении точности пайплайна на уровне 92%+. Слайды с архитектурой нашего Model Council и раскладкой по тирам прикрепляем к посту! 👇 (Попозже пришлю, протестирую nano banana 🍌 2)

ИИ ai llm anthropic llmops routing cost-optimization

Сюхэй Ёсида о Steam Machine

D@dtfbest6 ч

Бывший глава PlayStation Studios Сюхэй Ёсида поделился впечатлениями от Steam Machine, на что обратил внимание пользователь DTF. Менеджер похвалил геймпад и UI устройства, однако не смог порекомендовать его из-за цены и долгих загрузок в играх. https://dtf.ru/hard/5161288

Геймдев playstation steam-machine valve geiming zelezo

Лилиан Вэн опубликовала обзор истории и развития scaling laws

e@epsiloncorrect7 ч

Пока я откисаю в Корее от очередного сезона исхода дорогих коллег [1, 2, 3, и др.] перед ICML, наша с читателями любимая Лилиан Вэн – авторка топ-1 блога по диплёрнингу – написала первый за почти два года пост про историю и развитие науки об оценке правил масштабирования (scaling laws) языковых моделей. Почему "правил", а не "законов" – чтобы не создавать ощущения универсальности самих законов: всех необходимых факторов для по-настоящему точных предсказательных правил для конкретных архитектур, моделей, данных, оптимизаторов и других факторов, на них влияющих. Особого почтения заслуживает упоминание статьи Lovelace et al., где в первый раз в академическом мире разбираются, как влияют повторения данных на scaling laws. Так что у кого знания остановились на шиншилле – бежим освежать знания, чтобы фронтир толкался предсказуемо и безопасно.

ИИ ai scaling-laws lilian-weng llm deep-learning

Сервис для автоматизации управления креативами в Meta

Б@ezhov_targeting7 ч

Идея для стартапа: Сервис, что загружает креативы в Мету и отрубает все навязанные улучшалки, related media и переводы. Плюс заходит туда раз в день и проверяет, что она их не включила. Загружать по 30 одиночных креативов стало слишком долго

Стартапы meta ads marketing automation startup-idea

PlayStation планирует отказаться от физических носителей к 2028 году

Д@disruptors_official7 ч

PlayStation с 2028 полностью прекратит выпускать игры на дисках Почему? Ну конечно, ради 💰💸. Вместо диска теперь будет ОДНОРАЗОВЫЙ код, жёстко привязанный к акку. Раньше можно было поиграть и ~~продать~~ отдать диск другу, а теперь всё. Жадный Sony, ловите мой протест: Женёк, если ты это читаешь, разрешаю не возвращать диск GTA San Andreas, который ты взял у меня в 2005 году, и так и не вернул. Надеюсь, ты всё-таки смог установить чёртов Daemon Tools, который у тебя полгода "не устанавливался" 😈

Геймдев playstation sony gaming digital gta

Intel повысила рекомендованные цены на процессоры Arrow Lake Refresh

P@prohitec7 ч

Intel подняла РРЦ на процессоры Arrow Lake Refresh Компания Intel обновила прайс-листы на своем сайте, увеличив рекомендованную стоимость Core Ultra 5 250K Plus и Core Ultra 7 270K Plus. Младший Core Ultra 5 250K Plus вместо стартовых $199 теперь официально стоит до $229, а старший Core Ultra 7 270K Plus подорожал с $299 до $349.

Технологии intel arrow-lake processory ceny hardware

Кризис классического геймдева и поиск новых перспектив

Т@timurtaepov7 ч

В дополнение к посту по ситуации в gamedev еще вот такой комментарий из LinkedIn от сооснователя Vizor, Strikerz, Glera Games. (см. скриншот) Плюс я почитал комментарии под моим постом. Некоторые разработчики и команды ориентируются на то, что нужно делать упор на компетенции в купе с ИИ. И будет устойчивость. Это хороший подход, но мне кажется даже наличие хороших агентских пайпланов и компетенций уже не позволят достигать чего-либо среднего и ощутимого. Ну сложно что-то делать на высушенном болоте или на выженной земле. И не появится уже следующих Playrix. Да, можно много усилий вложить и круто сделать, но даст ли это реально ожидаемый и адекватный результат на текущем рынке? ХзХз... Если нет больших ожиданий по финансам и темпам роста, то gamedev в классическом виде – отличное хобби. Куда бежать? В продукты и сервисы? Нет. Код – коммодити. Продукт/сервис/игра – коммодити. Нет вариантов. Но парочка вариантов все же есть. @timurtaepov

Геймдев gamedev rynok ii karera biznes

Обход фильтров в Krea 2

Н@GreenNeuralRobots7 ч

Krea2 Filter Bypass [Fedor] Обход фильтров в Krea 2. Помогает тестировать границы генерации (где граница за которой отказ), смотреть, что модель реально умеет. Есть тонкая настройка VAE-параметров реддит #krea2 #uncensored #lora

ИИ krea2 ai uncensored lora vae

NASA не уверено в сертификации Boeing Starliner для пилотируемых полетов

Х@htech_plus7 ч

В NASA не уверены, что Boeing Starliner получит разрешение на пилотируемые полёты Новый отчет Управления генерального инспектора (OIG) NASA показал, что агентство не может назвать сроки, когда корабль Boeing Starliner сможет снова доставлять астронавтов на Международную космическую станцию. Как отмечается в документе, основные технические проблемы — утечки гелия, отказы двигательной установки и аномалии парашютной системы — не решены до сих пор. По данным на март 2026 года, NASA не может даже предположить, когда завершатся испытания и когда Starliner получит необходимый сертификат. Все выплаты компании Boeing от агентства по этому проекту заморожены. https://hightech.plus/2026/07/02/v-nasa-ne-uvereni-chto-boeing-starliner-poluchit-razreshenie-na-pilotiruemie-poleti

Технологии nasa boeing starliner kosmos aviaciia

Как Cursor построили ChatGTM для автоматизации продаж

В@marketlead_me7 ч

Как Cursor построили свой ChatGTM для отдела продаж George Hou, глава корп. продаж в Cursor был так любезен, что рассказал как устроен весь их AI-GTM workflow. Они держат его в собственной тулзе ChatGTM, которую использует 400 менеджеров по продажам. Это по сути набор агентов, в которых интегрированы: • знания о Cursor и как компания продает; • Salesforce, Gong, Slack, LinkedIn и другие системы; • статусы сделок; • какие новые детали появились сегодня утром по конкретным ICP. ChatGTM получает все сигналы в реальном времени через API. Как выглядит рабочий день SDR Утром продавец закуривает, выпивает редбулл, открывает Slack и получает дайджест по встречам, новости, список сигналов, новые регистрации с крупными корп. доменами. Последний пункт кстати важен: однажды на прошлой работе мы нашли в битриксе Goldman and Sachs (?!), а мои знакомые увидели что в их продукт втихую зарегался Perplexity. Таких клиентов легко потерять без автоматизации скоринга в крупных SaaS. Но вернемся к Cursor. Их агент готовит: • 25 персонализированных outbound-писем; • индивидуальные лендинги под каждого клиента с учетом его техстека и роли. Перед встречей ChatGTM сам изучает компанию и может, например, предупредить: «CEO недавно писал в Х, что ненавидит агрессивные продажи» Во время звонка можно задать вопрос AI, если клиент спросил про миграцию с легаси-инфраструктуры или сложную техническую тему. Отдельно пишутся письма для спящих клиентов. Еще ChatGTM самостоятельно анализирует сделки и готовит еженедельный отчет менеджеру. Тулза работает поверх Salesforce, Gong и остальных GTM-инструментов, а не вместо них, так что никто никого по сути не заменял. Все по API. ChatGTM строили всего три инженера, но сегодня продукт развивается уже силами самих продавцов. Они создали более 500 собственных Skills и 1000+ автоматизаций, просто описывая новые сценарии работы на обычном человеческом языке.

Продукт cursor ai sales gtm automation saas

Стартап Z.ai выпустил среду разработки ZCode 3.0

D@data_secrets7 ч

Z.ai снова радуют: стартап выпускает собственную среду разработки ZCode 3.0 https://zcode.z.ai/en Конкурент Claude Code от создателей GLM-5.2 уже доступен на MacOS, Windows и Linux. Внутри собственный агент ZCode Agent, с фокусом на длинные многоступенчатые задачи и крупные сложные проекты. Мониторинг, умная документация, мультимодальность и мультиагентность – в комплекте. Понятно, что в первую очередь платформа заточена именно под GLM-5.2, но использовать в ZCode можно и открытые модели, и даже свои подписки от OpenAI и Anthropic. И еще: в ZCode по сравнению с обычной подпиской GLM Coding Plan квоты подписчиков на модель будут в 1.5 раза выше. Плюс, новые пользователи получают 5 дней бесплатного доступа с большим дневным лимитом.

ИИ zai zcode glm-52 ide ai-agent coding

10 недооцененных возможностей PostgreSQL для бэкенд-разработчиков

Х@habr_com7 ч

PostgreSQL для бэкендера: 10 фич, которыми мало пользуются, а зря В PostgreSQL уже хранятся пользователи, заказы и платежи, а потом стек начинает расти сам собой, когда рядом появляются Redis для очереди задач, отдельный Python-скрипт для дедупликации событий, Go-цикл, который считает интервалы между статусами заказа, свой поисковик вместо простого поиска по тексту и самодельная таблица locks для координации воркеров. Большая часть этой инфраструктуры дублирует то, что PostgreSQL умеет делать сам, причём атомарно, транзакционно и с индексами, без лишней сетевой болтовни между приложением и базой. Механизм, который снимает необходимость в отдельном брокере задач, живёт в PostgreSQL ещё с версии 9.5, просто про него редко вспоминают. Та же история с оконными функциями, полнотекстовым поиском и блокировками на уровне базы, где задачи, ради которых обычно поднимают отдельный сервис, часто закрываются прямо в таблице. Обсудим, сколько из этой цепочки сервисов держится просто на привычке.

IT postgresql backend database architecture optimization

Nothing представила лимитированную версию Phone (4b) RCB Edition

B@biggeek7 ч

Nothing показала Phone (4b) RCB Edition Лимитку можно будет приобрести только офлайн в магазине Nothing в Бангалоре — в день официальной презентации 7 июля.

Технологии nothing smartfony rcb reliz texnologii

Claude Fable 5 создал рабочее ядро ОС на Rust

C@campcode7 ч

Робот ~~сочинит симфонию~~ напишет ядро ОС? Да 😢 Claude Fable 5 за 38 минут с нуля собрал NT-подобное ядро на Rust: планировщик, менеджер памяти, потоки, прерывания и I/O — всего ~5100 строк в 27 файлах. Всё это загрузилось в QEMU и прошло self-tests. Самое неприятное для скептиков: модель не просто строчила код, а сама ловила баги, объясняла риск дедлока и чинила архитектурные косяки по ходу работы. А через 8 дней ядро уже научили грузить настоящие Windows-драйверы и запускать реальные Windows-проги. Вкатываемся в музыку 🎧

ИИ ai rust os claude programming

Влияние AI-агентов на спрос к хард-скиллам

n@nonamevc7 ч

Заметки с полей. Мы используем кодинг агентов для всяких задач. Но именно end2end для экспериментов, поглядеть что к чему (там переписать тестовый апп с электрона на rust и тому подобное). Так вот у меня сложилось впечатление, что fable от Anthropic это первая модель, которую надо уже думать куда натравлять. Иначе это оооочень дорого. То есть просто для себя повайбить эта штука не подходит. И мы приходим к простой мысли. Чтобы понимать куда ее направлять нужен человек, который знает и умеет. И у меня четко в голове складывается картинка и почему в лабы нанимают тоннами. Как никогда в индустрии спрос на хард скиллы вырос жестко. Спрос на понимание, навыки, интуицию очень высокий. Ибо остальное закроет модель если надо. Но если нет навыков и понимания сгорит тонна денег. Мы увидим множество внедрений, которые провалятся не потому что модель не эффективна, а потому что human in the loop не смог. И если раньше на такой вывод требовались годы, испытательные сроки, то теперь можно понять за месяц и все.

ИИ ai agents hardskills anthropic fable development

OpenAI представила бенчмарк GeneBench-Pro для оценки биологических исследований

M@ai_machinelearning_big_data7 ч

📌 OpenAI собрала бенчмарк на научное суждение в биологии GeneBench-Pro - набор тестов, проверяющий, способны ли модели самостоятельно принимать исследовательские решения при работе с биологическими данными. Он оценивает умение проводить сложный анализ данных в генетике и смежных областях биологии и медицины. Моделям дают неструктурированные, как в реальной лаборатории, данные, краткое описание задачи и целевую величину, которую нужно оценить (но не говорят, как считать). Чтобы прийти к верному ответу, система должна сама пройти цепочку зависимых решений: очистить данные, выявить артефакты, выбрать подходящий статистический метод и пересмотреть план, если промежуточные результаты противоречат исходной гипотезе. Для всех 129 задач условия смоделированы так, чтобы проверять ответ однозначно, по принципу "всё или ничего". Набор охватывает 10 областей и 21 подобласть, а 82 задачи прошли проверку у экспертов-биологов. Сильнейшая из протестированных моделей, GPT-5.6 Sol, верно решает 28,7% задач на максимальном уровне рассуждений и 31,5% в режиме Pro. Лучший результат среди моделей других вендоров у Claude Opus 4.8 (16,0%).

OpenAI называет такой результат заметным для настолько трудного теста.

🟡Практическая ценность По опросу рецензентов, одна задача GeneBench-Pro заняла бы у специалиста порядка 20–40 часов, что при ставке около $200 в час выливается в несколько тысяч долларов. Расчёт той же задачи моделью стоит значительно меньше, но конкретных цифр OpenAI не дает. Для стандартных моделей в техотчёте приведён средний расход токенов как приблизительная оценка вычислительных затрат (около 33 200 токенов для Sol в максимальном режиме). 🟡Дисклеймер

Обозначение Pro в контексте бенчмарка - это режим работы модели, а не отдельная линейка продуктов или новые тарифы ChatGPT.

@ai_machinelearning_big_data #news #ai #ml

ИИ openai genebench-pro biology genetics benchmarking ai

Опыт использования Claude для автоматизации разработки и миграции инфраструктуры

A@qachanell7 ч

Как говорит один мой хороший товарищ, за последние дни много чего "наклодил" и все-таки тариф Max не зря выбрал для своих задач. 1. Меня подвел хостинг VPS и почти два дня не давал студентам нормально учиться на курсе, так как все песочницы, помощники и прочие ништяки были заблокированы. Поэтому было принято решение переехать на Railway, так как уже надоело поддерживать самостоятельно работу VPS. хотя меня это сильно прокачало. На арену вступил Claude и за полдня перенес все, а это скажу вам "хлопотное дельце". И какой же кайф после Gemini, где надо делать 10-20-30 итераций, потом руками все переносить, беситься от ошибок, теперь работать с ИИ-агентами, которые все делают за тебя в рамках нескольких больших сессии. По итогу все перенесено и студенты довольны. 2. Вчера собрал себе тулу для генерации каруселей в LinkedIn и Instagram. С разными темами, типами слайдов, возможностью ИИ-генерации, редактированием, версионированием и другими полезными фишками. Магия какая-то. 3. Сегодня продолжаю работу над созданием инструмента для отложенного постинга с одной страницы, так как я хочу, когда хочу и где хочу. Ибо текущие решения бесят в своей разрозненности и ценовой политике. В общем, игрушка, которая затягивает... А что вы с помощью Claude или других агентов автоматизировали из своей рутины?

ИИ claude ai-agents devops automation railway productivity

Влияние AI-агентов на спрос к инженерным навыкам

C@chillhousetech7 ч

ИИ ai agents hardskills anthropic fable

Сбер представил GFusion: диффузионный подход к генерации текста

M@machinelearning_interview7 ч

GFusion показывает, что LLM можно ускорять не только за счёт железа. Сбер открыл исходный код экспериментальной диффузионной языковой модели на базе GigaChat. В классической autoregressive-схеме модель генерирует текст токен за токеном. GFusion работает иначе: сначала создаёт приблизительный «набросок» ответа, а затем пошагово дорабатывает его — так же, как нейросети генерируют изображения и видео. За счёт этого модель получилась до 70% быстрее GigaChat3-10B-A1.8B и на 39% быстрее версии с MTP. Просадка качества при этом осталась в пределах 2–4 п.п. В open source выложили не только саму модель, но и обучение, оптимизированные attention-ядра и поддержку в SGLang. Интересная деталь: весь проект реализовал стажёр команды GigaChat Pretrain — и теперь он работает в штате. Пока большая часть индустрии упирается в стоимость GPU, latency и дата-центры, часть ускорения может лежать в архитектуре генерации. Не в том, где запускать модель, а в том, как именно она генерирует ответ. Habr: https://habr.com/ru/companies/sberbank/articles/1054690/ Модель: GFusion-10B-A1.8B-base GFusion-10B-A1.8B GitVerse

ИИ ai llm gfusion sber gigachat opensource

Суд ЕС отклонил апелляцию Google по штрафу в €4,1 млрд

v@vcnews7 ч

Суд Евросоюза, высший судебный орган, отклонил апелляцию Google по делу о штрафе на €4,1 млрд за неконкурентные практики на Android-смартфонах. Это один из крупнейших штрафов для компании в ЕС. Google оштрафовали ещё в 2018 году за то, что она незаконно ограничивала производителей смартфонов на Android, чтобы закрепить своё доминирующее положение vc.ru/services/3007719

IT google android es antimonopolnoe-delo straf

Сбер выпустил диффузионную языковую модель GFusion

M@mashkka_ds7 ч

🧩 Сбер выложил в открытый доступ GFusion — диффузионную языковую модель на базе GigaChat. Отличие от привычных LLM в том, что диффузионные модели генерируют ответ не токен за токеном, а строят ответ целиком, затем постепенно его уточняя. Такой подход даёт несколько практических преимуществ: ✔️ Параллельную генерацию и более высокую скорость работы. ✔️ Более качественное структурирование и редактирование ответа. ✔️ Более эффективное обучение на данных. ✔️ Возможность стабильно запускаться на потребительском железе — ноутбуках и даже смартфонах. Коллеги из GigaChat открыли не только саму модель, но и инструменты, которые использовали при её создании. Что уже доступно: ◀️ GigaChat 10B — облегчённая версия модели для локального запуска. ◀️ CUDA-kernels — низкоуровневые ядра, ускоряющие обучение диффузионных LLM и снижающие требования к GPU. ◀️ PR в vLLM — поддержка алгоритмов инференса для диффузионных моделей в одном из самых популярных Open Source-фреймворков для запуска LLM. Подробности коллеги опубликовали в статье на Habr, а модель, код и методы обучения уже доступны в Open Source ◀️ HF: GFusion-10B-A1.8B-base, GFusion-10B-A1.8B ◀️ GitVerse Будет интересно посмотреть, какие проекты и эксперименты появятся на их основе. #release #gigachat #ai #ainews

ИИ ai gigachat gfusion llm opensource sber

Япония как направление для жизни и удаленной работы

k@kyrillic7 ч

Добавлю про Японию важное: она значительно дешевле, чем многие думают! Все цены кроме жилья низкие, потому что йена сейчас на исторических низах. Например кафе, рестораны дешевле, чем в Тбилиси, Анталии, Бангкоке, Уфе и др. А качество еды в Японии ну просто мировой топ. Многие регионы Японии вымирают, много доступной недвижимости, в т.ч. в аренду. На airbnb на месяц в Осаке нормальное жилье можно найти за 700+ евро. Пару лет назад Мила была в арт-резиденции в Японии, жила в классическом японском доме рядом с океаном два месяца - 3 спальни, кондиционеры, красивый японский сад, полтора часа до центра Токио на поезде (в Японии везде удобный транспорт). Я из любопытства посмотрел, сколько такой стоит в аренду на долгосрок - 350 евро в мес! Главная проблема Японии в том, что там сложно жить долго легально - либо учеба, либо через бизнес (посложнее). Но на месяц приехать - ну просто топ, что вообще сейчас в мире лучше? По numbeo Осака с арендой на месяц дешевле Белграда, Пхукета, Бали, Вильнюса, Бангкока и многих других городов. Если айтишник работает удаленно, периодически номадит в Азии, то не пожить пару раз по месяцу в городах Японии - ну просто преступление! 🙂 @kyrillic

Лайфстайл iaponiia relokaciia udalenka putesestviia biudzet

Apple планирует выпустить 10 миллионов складных iPhone

I@itcnewsru7 ч

Ставка на гибкий экран: Apple планирует продать 10 миллионов складных iPhone Аналитики издания Nikkei Asia сообщили, что компания увеличила план производства своего первого складного смартфона iPhone Fold (или Ultra) до 10 миллионов устройств. Об этом свидетельствуют данные от поставщиков компонентов. Для сравнения, стартовый тираж классических моделей iPhone 18 и iPhone 18 Pro должен составить 70 миллионов единиц, а суммарный годовой план продаж всех смартфонов бренда равен 220 миллионам. При этом гибкий гаджет станет самым дорогим устройством в истории линейки. Базовая версия iPhone Fold обойдется покупателям в 2500 долларов, а цена за топовую модификацию превысит 3000 долларов.

Технологии apple iphone foldable smartfony texnologii

Архитектура памяти для AI-агентов: анализ подходов

Ц@transform_the_energy7 ч

Сегодня разбирал paper про память для AI агентов решил собрать инфу в пост Из чего состоит любая такая память (4 части) Первое — как хранить: просто текстом, деревом (от общего к деталям) или графом (факты связаны стрелками — кто с кем и когда связан). Второе — что записывать: вытаскивать из разговора отдельные факты или сохранять всё подряд. Третье — как искать нужное: по смыслу, по ключевым словам, по связям в графе или дать самому ИИ решить, что искать. Четвёртое — как поддерживать порядок: обновлять факты, удалять устаревшее, сжимать лишнее. Главные выводы: 1. Идеальной системы нет — каждая хороша под свою задачу. Для обычных диалогов лучше «гибридные» (MemOS , MemoryOS ), для поиска конкретных фактов — графовые (Zep , Cognee ). Но графовые плохо отвечают на вопросы вида «что было раньше, а что позже». 2. Чем старее нужный факт, тем хуже его находят. Если что-то было сказано много сообщений назад, система часто это упускает. 3. Обновления фактов лучше всего держат графовые системы. Простые системы, которые только «дописывают» новое, плохо умеют заменять старый факт на новый — и потом выдают устаревшую информацию (авторы называют это «галлюцинациями прошлого»). 4. На длинных историях простые системы часто ломаются. Причём для вопросов, где важен порядок во времени, иногда выгоднее вообще не мудрить с памятью, а скормить модели весь текст целиком — потому что «умное сжатие» стирает подсказки о том, что за чем шло. 5. Дороже — не значит лучше. Навороченные системы тратят в разы (иногда в сотни раз) больше времени, но точность не всегда выше. Часто выгоднее что-то лёгкое (LightMem , MemTree). Ещё пара наблюдений: лучше сохранять исходный текст разговора, чем агрессивно его сжимать; и не стоит слишком сильно фильтровать факты при записи — потом их может не хватить для рассуждений. Итог: готовой «идеальной» памяти для агентов пока нет, и систему нужно подбирать под конкретную задачу. Плюс можно еще посмотреть в сторону провайдеров памяти для Hermes, сам хочу покопать в сторону OpenViking(понравился core-concept ) и Hindsight - is the most accurate agent memory system (но аккуратный не всегда значит, что полезный для работы)

ИИ ai llm agents memory architecture

Китайский Poizon требует от российского «Пойзона» отдать домен poizon.ru

К@d_code7 ч

😀 Битва продолжается Китайский маркетплейс Poizon требует от российского «Пойзона» безвозмездно отдать домен poizon․ru после решения суда. Или придётся платить по 15 000 рублей просрочки каждый день. Китайцы также требуют прекратить использовать товарный знак на российских площадках и в Telegram. Что вообще происходит — по ссылке: ↖️ https://kod.ru/poizon-domain-lawsuit-russia

Технологии poizon domain-dispute intellectual-property russia china

Разработка компактных микролазеров глубокого ультрафиолета

P@prohitec7 ч

Международная команда физиков при участии НИУ ВШЭ в Санкт-Петербурге разработала микролазеры диаметром всего 2 микрометра, работающие в диапазоне глубокого ультрафиолета с длиной волны 255 нанометров. Такие устройства способны заменить громоздкие и токсичные ртутные лампы или газовые лазеры. Новинка функционирует при комнатной температуре и потребляет в разы меньше энергии, что упрощает ее интеграцию в компактные биосенсоры, газоанализаторы и фотонные чипы. Основой для лазера послужила подложка из доступного в производстве сапфира. На ней вырастили тонкие полупроводниковые слои, из которых вытравили микродиски. Свет внутри такой конструкции удерживается без зеркал за счет эффекта шепчущей галереи, многократно отражаясь от краев диска и усиливаясь в квантовых ямах. Пороговая плотность мощности для самого маленького образца составила 280 кВт/см², что соответствует лучшим мировым результатам. Пока прибор запускается оптическим методом от внешнего источника, но следующим этапом инженеры называют переход на стандартную электрическую накачку.

Наука fizika lazery ultrafiolet fotonika texnologii

Watch Dogs 2 показала рекордный онлайн в Steam после скидки

D@dtfbest7 ч

Watch Dogs 2 стала ещё одной игрой, которая получила всплеск внимания аудитории на фоне крупной скидки в Steam. В начале июля она достигла 16 тысяч одновременных пользователей, чего не происходило с релиза в 2016-м. https://dtf.ru/games/5161723

Геймдев watch-dogs-2 steam geimdev statistika rasprodaza

Обсуждение ограничений интернета в России

З@zatelecom7 ч

О как: https://t.me/tvrain/107003 Мощность заслона, очевидно, измеряется в количестве отключения интернетов, чтоб наблюдатели не могли ничего "врагам" сообщить? Или как это будет выглядеть?

IT internet cenzura rossiia sviaz texnologii

Проект «Локальный код» от Т-Бизнеса: предпринимательская экспедиция в Новосибирске

К@fomichevkirill8 ч

🧡💛1️⃣2️⃣3️⃣4️⃣🟨 Почему одни города рождают сильных предпринимателей, а другие нет? Последние несколько лет я очень много езжу по России. И чем больше общаюсь с предпринимателями, тем сильнее убеждаюсь в одной мысли, что у каждого города есть свой предпринимательский характер. Где-то сильнее производство. Где-то IT. Где-то люди умеют строить сообщества. Именно поэтому мне понравилась идея нового проекта Т-Бизнеса «Локальный код». Вместо того, чтобы делать просто конференцию, команда поехала в экспедицию, чтобы разобраться, чем на самом деле живет бизнес каждого региона. Следующая остановка Новосибирск. И, на мой взгляд, это один из самых интересных городов для такого разговора. Там я как раз буду выступать как спикер! Это город сильной инженерной школы, науки, производства, IT и предпринимателей, которые привыкли строить бизнес, потому что умеют создавать ценность. Мне вообще кажется, что сегодня особенно важно встречаться не только в Москве, так есть много сильных бизнесов, которые развивается по всей стране. А такие мероприятия помогают увидеть, какие практики работают у других, познакомиться с предпринимателями региона и найти новые идеи. Тем более формат здесь совсем не похож на привычную конференцию, это скорее, как и писал выше, предпринимательская экспедиция с интервью, выступлениями, дискуссиями и большим фестивалем в конце дня. Обязательно посмотрите фотографии в этом посте с прошлого мероприятия во Владивостоке. Выглядело просто грандиозно! Если будете 9 июля в Новосибирске, рекомендую зарегистрироваться и заехать. Иногда одна встреча оказывается полезнее десяти просмотренных видео. 🟨 Регистрация по ссылке

Стартапы biznes predprinimatelstvo novosibirsk t-biznes netvorking

Ещё ↓

GFusion: обучение диффузионной LLM на базе GigaChat