Сбер создал решение для непрерывного обучения фундаментальных нейросетевых моделей

4 минуты

  • Что это значит? Благодаря этому пользователи Cloud ML Space получили через API доступ к наиболее актуальной версии нейросети ruGPT-3, которая всегда в курсе свежих новостей, трендов и мемов.

Команда SberDevices представила новый инструмент для работы с пайплайнами больших языковых моделей. Проект, представленный на проходящей 23—24 ноября конференции по искусственному интеллекту AI Journey, получил название Molotilka (ML Toolkit for Continuous Learning).

В современном мире поток знаний непрерывен, каждый день происходит множество событий. При обучении большой нейросетевой языковой модели обычно используется срез данных, доступных в интернете или других источниках на текущий момент. Таким образом, модель не будет обладать знаниями о том, что произошло в этом году, если её обучили в прошлом. Для этого и была создана Molotilka, которая обладает актуальными знаниями в каждый момент времени.

В ней реализована автоматизация постоянного дообучения с минимальным забыванием старых знаний. Сервис для использования постоянно дообучаемых при помощи Molotilka больших нейросетевых моделей доступен в Cloud ML Space — платформе для ML-разработки полного цикла. Инструмент позволяет проводить непрерывное обучение языковых моделей с повторением некоторых заранее заданных действий. Таких, например, как скачивание актуальных данных из новостных источников, их предобработка, создание датасета для дообучения языковой модели и её оценка на разных задачах.

ML Toolkit for Continuous Learning может применяться в следующих областях:

● стандартное применение ruGPT-3 как языковой модели, обладающей актуальными знаниями о мире;

● задание кастомизированных задач с постоянным дообучением модели на новых данных: классификация, извлечение информации, диалоговые системы и пр.

«Molotilka — базовый инфраструктурный элемент „электронного мозга фирмы“. Специализированные интернет-краулеры экосистем будущего будут днём и ночью сканировать бездонные просторы всемирной паутины, а мощные тензорные суперкомпьютеры будут постоянно дообучать фермы больших моделей машинного обучения, которые станут интеллектуальным ядром множества продуктов, инструментов и сервисов. При этом на продуктовом уровне возникнет не только возможность опираться на актуальную информацию и тренды, но также и изучать динамику информационного пространства для того, чтобы быстро и качественно принимать важные решения, влияющие на стратегию и тактику компаний на рынке», — пояснил руководитель управления экспериментальных систем машинного обучения SberDevices Сергей Марков.

Источник: Сбер

Поделиться в соцсетях

Статья была вам полезна?

Да

Нет

Другие новости