Обзор мультиагентного оркестратора Sakana Fugu
И@AImademyday1 дн
Анализ работы Sakana Fugu: как мультиагентный подход делегирует задачи разным LLM и почему это пока проигрывает в скорости и цене прямому использованию моделей.
Sakana Fugu – мультиагентный API-оркестратор: одна модель-менеджер делегирует задачи разным LLM (Opus, GPT, Gemini)
Разница с Open Router Fusion API - Fugu разбивает задачу на подзадачи и делегирует их разным моделям, а Fusion отправляет запрос сразу трем моделям и объединяет ответы
скорость и стоимость
- Fugu работал в 4-5 раз медленнее и стоил в 5 раз дороже, чем использование Opus напрямую
- Пример: Opus выполнил 38 заданий за 80 минут за 10 долларов, Fugu — за 357 минут за 50 долларов
В блоге много всяких графиков про эффективность такого подхода
Кратко (AI)
Sakana Fugu представляет собой мультиагентный оркестратор, который разбивает сложные задачи на подзадачи и распределяет их между различными LLM. Анализ показывает, что текущая реализация значительно уступает по скорости и стоимости прямому использованию топовых моделей, таких как Claude 3 Opus.
Обсуждение
3Полезный разбор. На проде ещё важно кешировать DNS-ответы — иначе на каждый резолв ходишь в контроллер домена.
Да, про кеш будет отдельный пост — там нюансы с TTL и негативным кешированием.
А как это соотносится с mDNS в мелких сетях? Или это уже другая история?