Интересное
Монотонный ручной труд может быть не только физическим — немало рутинной работы сегодня выполняется за компьютером. О том, как сделать работу с текстами более продуктивной и почему алгоритмы не заменят живых копирайтеров, СберПро Медиа рассказал Михаил Степнов, один из создателей сервиса AI-копирайтер.
Обработка естественного языка с помощью искусственного интеллекта — часть амбициозной научной задачи по созданию алгоритма, способного воспроизводить мыслительные процессы человека. Тем не менее даже промежуточный результат — возможность с помощью ИИ генерировать тексты на заданную тему — находит сегодня широкое коммерческое применение.
Сервисы генерации текстов создают описания товаров, рекламные сообщения и продающие посты в соцсетях. Как правило, они работают по подписной модели (SaaS). Их коммерческое преимущество перед живыми копирайтерами — в способности генерировать множество версий каждого рекламного сообщения.
В сочетании с A/B тестированием, позволяющим быстро выявить наиболее эффективные версии, они обеспечивают возможность постоянной динамической оптимизации контента. В результате такие сервисы решают более комплексную задачу, чем просто генерация текстов, и позволяют серьёзно увеличить эффективность рекламной кампании.
строк в секунду генерирует сервис, разработанный в 2019 году Alibaba Group
AI-копирайтер — первый русскоязычный сервис по созданию уникальных описаний товаров для онлайн-магазинов и маркетплейсов — был создан в рамках нефинансового партнёрства Sber AI и стартапа CopyMonkey.ai.
Разработчики Сбера занимаются совершенствованием технологии, тогда как их коллеги из CopyMonkey в большей мере ориентированы на создание коммерческого продукта. Сейчас они ведут успешный бизнес, а сервис AI-копирайтер находится в свободном доступе.
Толчком к появлению сервисов генерации текстов на базе ИИ стало создание нейросетей GPT — программ обработки естественного языка. Они находят связи между словами и формируют из них последовательности, которые имитируют логически организованную человеческую речь. Работая по такому принципу, алгоритмы GPT способны моделировать даже диалоги и серии вопросов и ответов.
Языковая модель GPT-3 (generative pre-trained transformer) — третье поколение алгоритма обработки естественного языка, выпущенное компанией Open AI в мае 2020 года. Для обучения алгоритма был использован датасет из 570 ГБ текстовых данных, его обработка велась с использованием суперкомпьютера Microsoft Azure AI.
На основе GPT-3 командами SberDevices и Sber.AI была создана модель ruGPT-3, предназначенная для написания текстов на русском языке. В отличие от модели Open AI, разработка Сбера изначально имела открытый исходный код, благодаря чему стало возможно некоммерческое партнёрство со стартапом CopyMonkey.
Архитектура ruGPT-3 интересна своими возможностями тонких донастроек (fine tune) для выполнения узкоспециальных задач. Именно эта её особенность была использована при создании AI-копирайтера. Здесь узкоспециальной задачей стало создание контента для онлайн-торговли.
Для обучения модели были использованы обширные данные, полученные путём парсинга карточек товаров на маркетплейсах.
Система ориентирована на генерацию специфичного типа текстов — описаний товаров для интернет-магазина. Также модифицирован пользовательский принцип её работы: на вход нужно подавать не начало фразы, как в классической версии, а ключевые слова и названия товара. Именно они используются в качестве «затравки для генерации».
Было бы неверно предполагать, что AI-копирайтер способен заменить копирайтера. Скорее, он дополняет и облегчает работу специалиста над созданием многочисленных однотипных текстов — десятков тысяч описаний товаров для запуска нового интернет-магазина или маркетплейса. Проверка и редактирование текстов, созданных ИИ, быстрее и проще, чем их написание с нуля.
Теперь, работая над объёмным заказом, специалист может создавать с помощью AI-копирайтера базовый контент, после чего вносить в него необходимые правки.
Качество и релевантность текстов от AI-копирайтера может повышаться в результате дополнительного обучения под конкретного крупного заказчика. Версия сервиса, которая находится в открытом доступе, регулярно получает на вход безграничное разнообразие запросов. Если же сервис развёрнут на сервере заказчика и работает с ограниченным кругом запросов, он способен дообучаться в режиме реального времени, наращивая количество нужных «нейронных связей». По такому же принципу совершенствует свои навыки живой продавец, выбравший специализацию на определённом бренде или товарной группе.
Модель AI-копирайтера была обучена на данных нескольких крупных русскоязычных маркетплейсов и ориентирована на типичный для них ассортимент.
Если подать на вход запрос на описание чего-то, не имеющего отношения к e-commerce, на выходе, скорее всего, будет бессмыслица. Иногда это смешно, но это не значит, что модель плохо работает по своему целевому назначению. Её задача — создание описаний товаров для интернет-торговли по заданным ключевым словам.
Чтобы получить оптимальный результат, AI-копирайтеру нужно дать 6—8 ключевых слов. Получив 1—3 слова на вход, алгоритм может попытаться «приукрасить» текст самостоятельно, добавить в описание несуществующие характеристики. Если ключевых слов будет слишком много, он также может дать сбой, пытаясь увязать их в рамках ограниченного по объёму текста.
Коммерческим развитием действующего сервиса в рамках наших договоренностей занимается наш партнерский стартап — CopyMonkey.
Sber AI занимается чистым R&D. Мы планируем работать над развитием функционала, в первую очередь над увеличением объёмов данных и количества категорий, которые используются для обучения модели. В работе над обучением модели большего размера мы рассчитываем на вычислительные мощности «Кристофари» — суперкомпьютера Сбера. Когда эта работа увенчается успехом, мы, возможно, также будем готовы представить коммерческую версию продукта.
Вес сферы e-commerce в экосистеме Сбера, скорее всего, будет только увеличиваться, пропорционально с её ростом будет увеличиваться внутренняя потребность в услугах AI-копирайтера. В перспективе модель можно дообучить генерации текстов на других языках, эта функция уже реализована в версии продукта от CopyMonkey. Также, кроме генерации текстов для e-commerce, AI-копирайтер может охватить смежные рынки контекстной рекламы и SMM.