ИИ
LAM — большие модели, способные думать и действовать
LAM (Large Action Model) — большая модель действий, нейросеть, основанная на поведенческих данных, которая «генерирует» или выполняет практические действия на основе команд пользователя или инструкций. Например, LAM может автоматически проверить складские остатки, заказать недостающий товар у поставщика и обновить данные в учётной системе без участия менеджера.
Что это значит для бизнеса?
Подробнее о технологии и о том, как ее применяют российские компании, — в полной версии материала.
Введение
Что такое LAM
LAM (Large Action Model) — большая модель действий, нейросеть, основанная на поведенческих данных, которая «генерирует» или выполняет практические действия на основе команд пользователя или инструкций. Например, LAM может автоматически проверить складские остатки, заказать недостающий товар у поставщика и обновить данные в учётной системе без участия менеджера.
Руководитель лаборатории AI Школы управления «Сколково» Александр Диденко отмечает, что термин знаком российским специалистам, однако общего стабилизированного понимания пока нет.
«Технически LAM означает модель, дообученную определённым образом, — объясняет эксперт. — Но по факту этим словом могут назвать любую agentic-систему на базе „коробочной“ LLM (Large Language Models). Поэтому свидетельства в стиле „наша компания экспериментирует с LAM“ нужно читать как „наша компания экспериментирует с AI-агентами“. И это справедливо: кажется, что потенциал агентских систем ещё не до конца исчерпан. Компании просто не столкнулись с ограничениями, которые могли бы потребовать полноценную внутреннюю LAM».
Почему LAM — это следующий шаг в развитии ИИ
Если LLM автоматизировали генерацию текста, то LAM добавляют уровень автономии и действия, превращая языковую модель в «мозг» агента, который может не только планировать, но и выполнять задачи без постоянного вмешательства человека.
Александр Диденко,
руководитель лаборатории AI Школы управления «Сколково»:
Мультимодальные доменно-дообученные LAM имеют потенциал в качестве «движков» для универсальных промышленных и домашних коботов. Они могут быть хороши в гибкой автоматизации бизнес-процессов, сменив традиционные RPA-решения. Они понадобятся там, где от агента нужен какой-то нестандартный tooling (инструментарий), и при этом у компании есть хороший источник ground truth (набор эталонных примеров и данных для обучения модели).
С помощью LAM можно добиться более глубокой интеграции AI в бизнес‑процессы. Такие модели позволяют создавать сквозную автоматизацию от распознавания запроса до исполнения сложного сценария: оформление заказа, запуск отчётности, управление роботами на складе.
Особенности больших моделей действий
Отличие от больших языковых моделей (LLM)
LLM может написать идеальный инструктаж для менеджера по закупкам о том, как найти поставщика. LAM же выполнит весь процесс: просканирует базы данных, отфильтрует компании по ИНН и истории, отправит коммерческие запросы, проанализирует предложения, согласует смету с учётом бюджета проекта в 1С, инициирует согласование договора в СЭД и отследит поставку.
Ключевые возможности LAM
Автономное многошаговое планирование и исполнение
LAM способны разбивать сложную цель (например, «оптимизировать логистику доставки для Дальнего Востока») на последовательность взаимосвязанных шагов: проанализировать исторические данные по срокам, проверить доступность транспорта и тарифы, рассчитать оптимальные маршруты с учётом погоды, согласовать смены водителей, автоматически обновить ETAs в системе для клиентов.
Контекстно-зависимая адаптивность
LAM постоянно мониторят состояние среды выполнения и могут динамически перестраивать план при сбоях или изменении условий. Например, если поставщик сообщил о задержке, LAM не просто уведомит менеджера, а автоматически найдёт альтернативного поставщика, пересчитает бюджет и сроки, обновит производственный график.
Глубокая интеграция с экосистемой инструментов
LAM не существуют в вакууме. Их преимущество — в способности взаимодействовать с множеством внешних систем через API (Application Programming Interface, программный интерфейс приложений) и GUI (Graphical User Interface, графический интерфейс пользователя).
Координация между агентами
Будущее LAM — в создании экосистем, где агенты разных компаний или подразделений могут взаимодействовать между собой для достижения общих целей. LAM-агент покупателя может автономно согласовывать условия контракта (цену, сроки, штрафы) с LAM-агентом поставщика на основе заложенных бизнес-правил и рыночных данных.
Архитектура больших моделей действий
Базовый слой: LLM как основа
В ядре LAM лежит большая языковая модель. Это фундамент, который отвечает за:
Один из современных трендов: использование в основе LAM специализированных (fine-tuned) или небольших (SLM) моделей для работы над узкими задачами в определённых отраслях (например, финансы, логистика, юриспруденция). Такой подход снижает расходы на вычисления и повышает точность результатов в предметной области.
Компоненты LAM
Архитектура LAM представляет собой сложную оркестровку компонентов.
Планировщик
Разбивает запрос пользователя на подзадачи и формирует детализированный и последовательный план действий. Высокоуровневая цель превращается в конкретную пошаговую инструкцию.
Менеджер контекста
Хранит состояние задачи, историю диалога и другие данные, управляет критически важной информацией. Этот модуль понимает пользовательский контекст, учитывает предыдущие результаты и ошибки.
Исполнитель
Отвечает за вызов API, манипуляции с GUI или отправку команд RPA‑роботам. Этот модуль непосредственно выполняет действия, которые сгенерированы планировщиком. Он использует компьютерное зрение для взаимодействия с графическими интерфейсами (определение элементов, клики, ввод данных) и может иметь встроенные ограничения на допустимые операции и инструменты.
Валидатор
Отслеживает результаты действий, фиксирует ошибки, успехи, неожиданные события. Формирует обратную связь для планировщика (нужна ли корректировка плана?) и для системы обучения (нужны ли новые данные для улучшения модели?). Это главный элемент для адаптивности нейросети.
Инструментальный слой
Каталог доступных для LAM инструментов и функций (API-интеграции, GUI-скрипты). Каждый инструмент имеет чёткое описание и параметры исполнения.
Варианты реализации архитектуры и примеры
Принцип работы LAM
Контекст и состояние
LAM сохраняет полный контекст задачи: от первоначального запроса до результатов промежуточных шагов. Это позволяет модели возобновлять операции и адаптироваться к изменениям. Контекстный менеджер постоянно обновляет векторное или структурированное представление текущей ситуации.
Обучение: Zero-shot, Few-shot и планы
LAM обучаются сложнее, чем LLM, так как требуют данных не только о том, «что сказать», но и о том, «что сделать» и «как».
Роль пользовательских данных и действий
Для эффективной работы LAM необходимы лог‑данные: история кликов, API‑вызовы, успешные и неуспешные сценарии. Модель может обучаться на паттернах конкретных пользователей и подстраивать под них свою стратегию принятия решений и действия.
Интеграция с интерфейсами: GUI и API
Это два подхода к созданию LAM и LLM-агентов и их интеграции с ИТ-системами.
GUI
LAM взаимодействуют с программами через графический интерфейс и совершают в них действия как обычный пользователь. С помощью такой интеграции можно автоматизировать любую систему, имеющую интерфейс, например мобильные приложения.
API
LAM взаимодействуют с внешними сервисами напрямую через программный интерфейс. Такой подход считается максимально быстрым, надёжным и безопасным. Активное развитие OpenAPI-стандартов и внутренних API-платформ у российских технологических лидеров стимулирует расширение таких интеграций, они становятся обязательным элементом для современных цифровых сервисов.
Узнать больше
Применение LAM в реальных задачах, примеры
Кибербезопасность
Российский ИТ-разработчик летом этого года выпустил несколько LAM, интегрированных в сервисы по информационной безопасности. Они анализируют риски, запускают диагностику, используют ИТ-инструменты для отслеживания инцидентов и могут самостоятельно нейтрализовать угрозу. Кроме того, они автоматизируют рутину, связанную с отчётностью и настройками кибербезопасности.
Промышленная робототехника
Российский научно-исследовательский институт разработал универсальную LAM для управления производственным оборудованием, промышленными роботами и индустриальными ИТ-решениями. Её адаптировали к условиям эксплуатации в промышленной среде — шуму, плохой видимости и другим внешним факторам.
Финансовый сектор
Сбер внедрил AI-ассистента на основе нейросетевой модели в службу поддержки корпоративных клиентов. Помощник распределяет звонки по операторам, оценивает их работу, сам закрывает часть обращений и помогает искать информацию. Скорость маршрутизации увеличилась в 3,5 раза. В ближайшие годы компания планирует внедрить AI-агентов на основе LAM в большинство своих бизнес-процессов.
Преимущества и ограничения
Ключевые плюсы LAM
По подсчётам аналитиков, AI-агенты на основе нейросетей к 2029 году возьмут на себя порядка 80% задач в обслуживании клиентов.
Их главные преимущества.
Ограничения и вызовы
Александр Диденко отмечает, что принципиальных барьеров с точки зрения регулирования или технологии именно для LAM практически нет. «Да, существует недостаток квалифицированных кадров, неясен ожидаемый экономический эффект и влияние на метрики, но это всё общие для LLM проблемы», — подчёркивает эксперт.
Среди проблем также выделяют:
Заключение
По прогнозам аналитиков, к 2028 году около 15% от всех рабочих решений будут приниматься AI-агентами на основе нейросетевых моделей и эти инструменты будут встроены примерно в каждый третий корпоративный сервис. При этом эксперты подчёркивают, что рынок таких технологий станет более прозрачным и понятным. В частности, будет снижаться количество разработок без реальной автоматизации, а компании будут внедрять AI-агентов, которые обеспечивают очевидную ценность и окупаемость инвестиций.