Исследователи из Принстона разработали бенчмарк CEO-Bench, предназначенный для оценки стратегического мышления ИИ в роли руководителя стартапа. Результаты тестирования показали, что большинство современных моделей уступают простым алгоритмам на жестких правилах, демонстрируя неспособность к долгосрочному планированию. В условиях рыночной конкуренции использование ИИ-агентов для управления бизнесом часто приводило к банкротству. Данное исследование ставит под сомнение эффективность текущих ИИ-решений в процессах принятия управленческих решений.
AI-обзор собирается · 22 дн
Исследователи представили бенчмарк CEO-Bench для оценки ИИ в управлении стартапами
dc
схлопнуто 1 дубль