ИИ

LAM — большие модели, способные думать и действовать

13 августа 2025

8 минут

Поделиться в соцсетях

LAM — большие модели, способные думать и действовать

LAM (Large Action Model) — большая модель действий, нейросеть, основанная на поведенческих данных, которая «генерирует» или выполняет практические действия на основе команд пользователя или инструкций. Например, LAM может автоматически проверить складские остатки, заказать недостающий товар у поставщика и обновить данные в учётной системе без участия менеджера.

Что это значит для бизнеса?

LAM добавляют уровень автономии и действия, превращая языковую модель в «мозг» агента, который может не только планировать, но и выполнять задачи без постоянного вмешательства человека.
LAM имеют потенциал в качестве «движков» для универсальных промышленных и домашних коботов. Они могут быть хороши в гибкой автоматизации бизнес-процессов, сменив традиционные RPA-решения.
Классическая нейросеть напишет инструктаж для менеджера по закупкам о том, как найти поставщика. LAM же может выполнить весь процесс автономно: просканирует базы данных, отфильтрует компании по ИНН и истории, отправит коммерческие запросы, проанализирует предложения, согласует смету с учётом бюджета проекта в 1С, инициирует согласование договора в СЭД и отследит поставку.

Подробнее о технологии и о том, как ее применяют российские компании, — в полной версии материала.

Введение

Что такое LAM

Руководитель лаборатории AI Школы управления «Сколково» Александр Диденко отмечает, что термин знаком российским специалистам, однако общего стабилизированного понимания пока нет.

«Технически LAM означает модель, дообученную определённым образом, — объясняет эксперт. — Но по факту этим словом могут назвать любую agentic-систему на базе „коробочной“ LLM (Large Language Models). Поэтому свидетельства в стиле „наша компания экспериментирует с LAM“ нужно читать как „наша компания экспериментирует с AI-агентами“. И это справедливо: кажется, что потенциал агентских систем ещё не до конца исчерпан. Компании просто не столкнулись с ограничениями, которые могли бы потребовать полноценную внутреннюю LAM».

Почему LAM — это следующий шаг в развитии ИИ

Если LLM автоматизировали генерацию текста, то LAM добавляют уровень автономии и действия, превращая языковую модель в «мозг» агента, который может не только планировать, но и выполнять задачи без постоянного вмешательства человека.

Александр Диденко,

руководитель лаборатории AI Школы управления «Сколково»:

Мультимодальные доменно-дообученные LAM имеют потенциал в качестве «движков» для универсальных промышленных и домашних коботов. Они могут быть хороши в гибкой автоматизации бизнес-процессов, сменив традиционные RPA-решения. Они понадобятся там, где от агента нужен какой-то нестандартный tooling (инструментарий), и при этом у компании есть хороший источник ground truth (набор эталонных примеров и данных для обучения модели).

С помощью LAM можно добиться более глубокой интеграции AI в бизнес‑процессы. Такие модели позволяют создавать сквозную автоматизацию от распознавания запроса до исполнения сложного сценария: оформление заказа, запуск отчётности, управление роботами на складе.

Особенности больших моделей действий

Отличие от больших языковых моделей (LLM)

LLM может написать идеальный инструктаж для менеджера по закупкам о том, как найти поставщика. LAM же выполнит весь процесс: просканирует базы данных, отфильтрует компании по ИНН и истории, отправит коммерческие запросы, проанализирует предложения, согласует смету с учётом бюджета проекта в 1С, инициирует согласование договора в СЭД и отследит поставку.

Ключевые возможности LAM

Автономное многошаговое планирование и исполнение

LAM способны разбивать сложную цель (например, «оптимизировать логистику доставки для Дальнего Востока») на последовательность взаимосвязанных шагов: проанализировать исторические данные по срокам, проверить доступность транспорта и тарифы, рассчитать оптимальные маршруты с учётом погоды, согласовать смены водителей, автоматически обновить ETAs в системе для клиентов.

Контекстно-зависимая адаптивность

LAM постоянно мониторят состояние среды выполнения и могут динамически перестраивать план при сбоях или изменении условий. Например, если поставщик сообщил о задержке, LAM не просто уведомит менеджера, а автоматически найдёт альтернативного поставщика, пересчитает бюджет и сроки, обновит производственный график.

Глубокая интеграция с экосистемой инструментов

LAM не существуют в вакууме. Их преимущество — в способности взаимодействовать с множеством внешних систем через API (Application Programming Interface, программный интерфейс приложений) и GUI (Graphical User Interface, графический интерфейс пользователя).

Координация между агентами

Будущее LAM — в создании экосистем, где агенты разных компаний или подразделений могут взаимодействовать между собой для достижения общих целей. LAM-агент покупателя может автономно согласовывать условия контракта (цену, сроки, штрафы) с LAM-агентом поставщика на основе заложенных бизнес-правил и рыночных данных.

Архитектура больших моделей действий

Базовый слой: LLM как основа

В ядре LAM лежит большая языковая модель. Это фундамент, который отвечает за:

понимание намерения пользователя из промпта;
генерацию высокоуровневого плана достижения цели;
разбивку плана на конкретные, исполняемые шаги;
обработку ответов от систем или пользователей;
объяснение действий и предоставление отчётов.

Один из современных трендов: использование в основе LAM специализированных (fine-tuned) или небольших (SLM) моделей для работы над узкими задачами в определённых отраслях (например, финансы, логистика, юриспруденция). Такой подход снижает расходы на вычисления и повышает точность результатов в предметной области.

Узнать больше

Небольшие большие языковые модели: какие прикладные задачи они решают

Компоненты LAM

Архитектура LAM представляет собой сложную оркестровку компонентов.

Планировщик

Разбивает запрос пользователя на подзадачи и формирует детализированный и последовательный план действий. Высокоуровневая цель превращается в конкретную пошаговую инструкцию.

Менеджер контекста

Хранит состояние задачи, историю диалога и другие данные, управляет критически важной информацией. Этот модуль понимает пользовательский контекст, учитывает предыдущие результаты и ошибки.

Исполнитель

Отвечает за вызов API, манипуляции с GUI или отправку команд RPA‑роботам. Этот модуль непосредственно выполняет действия, которые сгенерированы планировщиком. Он использует компьютерное зрение для взаимодействия с графическими интерфейсами (определение элементов, клики, ввод данных) и может иметь встроенные ограничения на допустимые операции и инструменты.

Валидатор

Отслеживает результаты действий, фиксирует ошибки, успехи, неожиданные события. Формирует обратную связь для планировщика (нужна ли корректировка плана?) и для системы обучения (нужны ли новые данные для улучшения модели?). Это главный элемент для адаптивности нейросети.

Инструментальный слой

Каталог доступных для LAM инструментов и функций (API-интеграции, GUI-скрипты). Каждый инструмент имеет чёткое описание и параметры исполнения.

Варианты реализации архитектуры и примеры

Монолитная LAM. Единая большая модель, обученная и на языковых задачах, и на действиях. Мощнее, но сложнее в обучении, развёртывании и контроле.
Модульная LAM. Нейросеть, которая управляет множеством специализированных агентов. Каждый агент отвечает за свою функцию (планирование, исполнение API, работа с GUI, анализ данных) или домен (финансы, HR, логистика). При такой архитектуре для каждой подзадачи можно использовать наиболее подходящую модель.
Гибридный подход. На начальных этапах внедрения LLM могут использовать в комбинации с традиционным ПО для исполнения задач, например, с RPA-скриптами.

Принцип работы LAM

Контекст и состояние

LAM сохраняет полный контекст задачи: от первоначального запроса до результатов промежуточных шагов. Это позволяет модели возобновлять операции и адаптироваться к изменениям. Контекстный менеджер постоянно обновляет векторное или структурированное представление текущей ситуации.

Обучение: Zero-shot, Few-shot и планы

LAM обучаются сложнее, чем LLM, так как требуют данных не только о том, «что сказать», но и о том, «что сделать» и «как».

Zero-shot. LAM сразу пробуют выполнить задачу без примеров, опираясь на общее понимание языка. При таком методе возникает риск ошибок из-за неоднозначности или недостаточной детализации промпта. Требует очень хорошего базового обучения и чётких описаний инструментов.
Few-shot. Пользователь даёт LAM несколько примеров (демонстраций) выполнения похожей задачи. Это могут быть скринкасты действий пользователя и их описание или логи последовательных API-вызовов. Такое обучение может значительно повысить точность для специфичных или сложных корпоративных процессов.
Планы. Специальные промпты, где указываются этапы и условия завершения задачи. Чаще всего их используют для стандартизированных и критически важных процессов (например, для проведения платежей). Как правило, это жёстко заданные шаблоны действий, которые LAM выполняет строго последовательно и с минимальными вариациями.

Роль пользовательских данных и действий

Для эффективной работы LAM необходимы лог‑данные: история кликов, API‑вызовы, успешные и неуспешные сценарии. Модель может обучаться на паттернах конкретных пользователей и подстраивать под них свою стратегию принятия решений и действия.

Интеграция с интерфейсами: GUI и API

Это два подхода к созданию LAM и LLM-агентов и их интеграции с ИТ-системами.

GUI

LAM взаимодействуют с программами через графический интерфейс и совершают в них действия как обычный пользователь. С помощью такой интеграции можно автоматизировать любую систему, имеющую интерфейс, например мобильные приложения.

API

LAM взаимодействуют с внешними сервисами напрямую через программный интерфейс. Такой подход считается максимально быстрым, надёжным и безопасным. Активное развитие OpenAPI-стандартов и внутренних API-платформ у российских технологических лидеров стимулирует расширение таких интеграций, они становятся обязательным элементом для современных цифровых сервисов.

Узнать больше

Спецпроект «Заработать на API»

Применение LAM в реальных задачах, примеры

Кибербезопасность

Российский ИТ-разработчик летом этого года выпустил несколько LAM, интегрированных в сервисы по информационной безопасности. Они анализируют риски, запускают диагностику, используют ИТ-инструменты для отслеживания инцидентов и могут самостоятельно нейтрализовать угрозу. Кроме того, они автоматизируют рутину, связанную с отчётностью и настройками кибербезопасности.

Промышленная робототехника

Российский научно-исследовательский институт разработал универсальную LAM для управления производственным оборудованием, промышленными роботами и индустриальными ИТ-решениями. Её адаптировали к условиям эксплуатации в промышленной среде — шуму, плохой видимости и другим внешним факторам.

Финансовый сектор

Сбер внедрил AI-ассистента на основе нейросетевой модели в службу поддержки корпоративных клиентов. Помощник распределяет звонки по операторам, оценивает их работу, сам закрывает часть обращений и помогает искать информацию. Скорость маршрутизации увеличилась в 3,5 раза. В ближайшие годы компания планирует внедрить AI-агентов на основе LAM в большинство своих бизнес-процессов.

Преимущества и ограничения

Ключевые плюсы LAM

По подсчётам аналитиков, AI-агенты на основе нейросетей к 2029 году возьмут на себя порядка 80% задач в обслуживании клиентов.

Их главные преимущества.

Автономность. Выполнение сложных сценариев без постоянного контроля.
Эффективность. Ускорение бизнес‑процессов, сокращение ручного труда.
Гибкость. Адаптация к новым условиям за счёт контекстного планирования.
Интеграция. Возможность сразу связываться с любыми API и пользовательскими интерфейсами.

Ограничения и вызовы

Александр Диденко отмечает, что принципиальных барьеров с точки зрения регулирования или технологии именно для LAM практически нет. «Да, существует недостаток квалифицированных кадров, неясен ожидаемый экономический эффект и влияние на метрики, но это всё общие для LLM проблемы», — подчёркивает эксперт.

Среди проблем также выделяют:

сложность интеграции (особенно с устаревшими корпоративными системами);
отсутствие чётких правовых рамок (как определить ответственных за действия автономных систем);
риски по безопасности и нежелательным действиям моделей;
наличие сложных и структурированных данных для обучения.

Заключение

По прогнозам аналитиков, к 2028 году около 15% от всех рабочих решений будут приниматься AI-агентами на основе нейросетевых моделей и эти инструменты будут встроены примерно в каждый третий корпоративный сервис. При этом эксперты подчёркивают, что рынок таких технологий станет более прозрачным и понятным. В частности, будет снижаться количество разработок без реальной автоматизации, а компании будут внедрять AI-агентов, которые обеспечивают очевидную ценность и окупаемость инвестиций.

Чтобы быть в курсе важных трендов и мнений ведущих экспертов, следите за нами в телеграм-канале. О развитии навыков управления, личностном росте пишем в «Дзене». Про технологии и развитие в IT — в блоге на VC.

AI Технологии

Поделиться в соцсетях

Статья была вам полезна?

Да

Нет