GigaChat занял первое место среди открытых AI-моделей по результатам русскоязычного теста MERA
По итогам тестирования модель GigaChat PRO получила 53,7 балла из 100, а GigaChat Lite — 50,4 балла. Результат ближайшего конкурента оказался хуже более чем на два балла.
Благодаря обновлениям GigaChat PRO и GigaChat Lite теперь точнее отвечают на вопросы по экономике, медицине, химии, биологии и другим наукам, а также стали лучше разбираться в сложных терминах. Кроме того, в нейросети Сбера появились персонажи для выполнения специализированных задач.
GigaChat PRO доступна в веб-версии, «Телеграме» и «ВКонтакте». Разработчики и бизнес также могут использовать все модели Сбера через GigaChat API.
Бенчмарк MERA (multimodal evaluation for russian-language architectures, открытый бенчмарк для русского языка для оценки фундаментальных моделей) — набор из 21 задачи, который проверяет широкий спектр навыков искусственного интеллекта — от общих знаний до программирования. Этот тест позволяет объективно оценивать способности современных языковых моделей. Чем больше баллов набирает AI, тем лучше он справляется с различными задачами. В создании тестов MERA участвовали компании Альянса в сфере AI, а также Skoltech AI и НИУ ВШЭ.
Источник: Газета.ру
Статья была вам полезна?
Да
Нет
Другие новости
Эксперты оценили перспективы России на глобальном рынке услуг до 2035 года
2 июля
3 мин
С 1 июля вступил в силу закон о внесении границ сельхозугодий в ЕГРН
1 июля
1 мин
Маркировка шоколадных изделий и карамели стала обязательной
1 июля
1 мин
Минэнерго внесло в кабмин программу развития угольной промышленности до 2050 года
30 июня
1 мин
В России утверждены первые ГОСТы для систем промышленной автоматизации
30 июня
2 мин
Потенциал роста экономики может составить 2–2,5% за счёт ИИ
29 июня
1 мин