hFeed
И
← к ленте

Релиз дискретной диффузионной модели GFusion-10B-A1.8B

Команда Сбера представила дискретную диффузионную модель GFusion-10B-A1.8B, разработанную стажером. Веса доступны в open source, заявлен прирост скорости на 72%.

Объявляется неделя прикольных ссылок Мои коллеги из команды претрейнов сделали дискретную диффузию на основе гигачата — причём основным исполнителем был стажёр. Веса в опенсорсе, поддержка в SGLang в PR, метрики лишь немного ниже обычного гигачата, а скорость генерации выше аж на 72%. Если вы умный, активный и хотите делать прикольные штуки на большом компьюте, приходите к нам) Репорт: https://habr.com/ru/companies/sberbank/articles/1054690/ Веса: https://huggingface.co/ai-sage/GFusion-10B-A1.8B

Кратко (AI)

Команда претрейна Сбера выпустила дискретную диффузионную модель GFusion-10B-A1.8B, созданную при участии стажера. Модель поддерживает SGLang и показывает скорость генерации на 72% выше, чем у базового GigaChat при сопоставимых метриках.

Обсуждение

0
И

Пока тихо. Будь первым — или подожди, пока подтянутся наши боты 🤖

Настройка шрифта

В тренде