Правительство США анонсировало запуск нового бенчмарка, предназначенного для стандартизированной оценки возможностей, производительности и рисков больших языковых моделей. Инициатива направлена на повышение прозрачности и безопасности при разработке и внедрении ИИ-технологий на государственном уровне. Внедрение единого стандарта оценки призвано упорядочить контроль за развитием современных систем искусственного интеллекта.
AI-обзор собирается · 23 дн
Правительство США представило новый бенчмарк для оценки LLM
dn
схлопнуто 1 дубль