Главная
Проприетарные чипы для AI. Почему бизнесу нужно к ним присмотреться
России нужно в 10 раз больше чипов для AI, чтобы эффективно развивать технологию. Для обучения и применения различных AI-моделей требуются специальные чипы, которые умеют производить вычисления параллельно. Чаще всего в роли чипов для AI выступают GPU — графические процессоры. За год цены на ускорители в Китае выросли на 10% без учёта логистики до России.
Зарубежные компании разрабатывают собственные проприетарные чипы, которые менее функциональные и стоят дешевле решений Nvidia, AMD и Intel.
Что это значит для бизнеса
Сотрудничество с компаниями из дружественных стран, которые разработали собственные чипы, может помочь преодолеть дефицит чипов. Подробнее о проприетарных чипах для AI читайте в полной версии статьи.
Дефицит чипов начал тормозить масштабирование проектов на базе технологий искусственного интеллекта (AI): Microsoft называет дефицит вычислительных мощностей главным риском для дальнейшего развития этой технологии. Российские власти регулярно заявляют о необходимости увеличить вычислительные мощности в 10 раз.
Чипы для интеллекта
Что такое чип?
Чип (или интегральная микросхема, микрочип, компьютерный чип) — это небольшое электронное устройство, состоящее из множества электронных компонентов: транзисторов, резисторов и конденсаторов. Эти компоненты на небольшой кусочек полупроводника, который называют полупроводниковой подложкой (обычно его изготавливают из кремния).
Для обучения и применения различных AI-моделей требуются чипы, которые умеют производить вычисления параллельно, то есть одновременно. Процессоры общего назначения выполняют операции последовательно со скоростью, равной тактовой частоте, которая показывает число циклов, совершаемых за одну секунду. Как правило, в роли чипов для AI выступают GPU — графические процессоры, которые специализируются на параллельной обработке данных. CPU (центральные процессоры общего назначения), в свою очередь, ориентированы на последовательное выполнение инструкций с малой задержкой (тактовой частотой).
Также чипы для AI обладают и другими особенностями, например имеют ускоренный доступ к памяти и используют специально созданные для соответствующих чипов языки программирования. Так, в архитектуре CUDA c помощью SDK для чипов Nvidia используется упрощённый синтаксис языков программирования С и С++. С их помощью можно реализовывать доступ к вычислительным возможностям и памяти графических ускорителей Nvidia.
Технология параллельных вычислений с помощью графических процессоров стала особенно актуальной из-за стремительного развития нейросетей и генеративного AI. Обучение современных моделей требует больших мощностей, создание которых обходится недёшево.
Для обучения самой известной модели ChatGPT компания OpenAI использовала «десятки тысяч» графических процессоров А100. Набор данных составил около 100 трлн параметров. Скотт Гатри, исполнительный вице-президент Microsoft (компания инвестировала 1 млрд долларов в OpenAI), курирующий облачные технологии и искусственный интеллект, не стал называть конкретную стоимость проекта по созданию вычислительных мощностей для обсчёта модели, но сказал, что, вероятно, она превышает несколько сотен миллионов долларов.
Илон Маск рассказал, что большая языковая модель Grok 2 обучалась с помощью 20 000 ускорителей Nvidia H100. Для обучения модели следующего поколения Grok 3 может понадобиться уже 100 000 таких чипов.
Что такое проприетарные чипы и при чём здесь AI
Проприетарными чипами называют микросхемы, архитектуру которых компания разработала самостоятельно, а затем получила лицензию или патент. Никто другой не может производить и копировать её без разрешения владельца.
Проприетарные чипы крупнейших производителей Nvidia и AMD постоянно дорожают, а сроки поставок увеличиваются. Выручка Nvidia в 2023 году выросла до 61 млрд долларов по сравнению с 27 млрд долларов в 2022-м. По прогнозам Nvidia (занимает около 80% рынка чипов для AI), спрос на чипы продолжит расти: в компании ожидают, что новое поколение Blackwell также будет в дефиците, как и чипы H100 на микроархитектуре Hopper (ожидание поставки составляет около года).
Ожидать улучшения ситуации с существующими решениями не приходится. Постоянно растущий мировой спрос на чипы толкает цены на них вверх. Самое мощное решение для центров обработки данных Nvidia H100 уже стоит в Китае около 40 000 долларов, цена которого на старте продаж составляла 36 500 долларов. Стоимость одного сервера DGX POD выросла за два года примерно на 1 млн долларов — до 10,5 млн долларов.
Данные по объёму рынка производства полупроводников для AI (млрд $)
Источник: Gartner, август 2023 года
Финансовые результаты Nvidia, $
Источник: marketcap.ru
Всероссийский дефицит
Недостаток вычислительных мощностей касается всех, кто применяет или планирует применять AI. Руководитель научного направления «Микроэлектроника» ИНМЭ РАН Николай Шелепин отмечает, что вопрос нехватки чипов в России, в частности для AI, стоит очень остро. Крупные компании обучают и тренируют множество моделей, для чего нужны соответствующие чипы. Если своих вычислительных мощностей недостаточно, можно арендовать их у специализированных компаний, которые построили центры обработки данных. Однако в случае использования облачных вычислений возникают вопросы с безопасностью передачи и обработки данных — для многих компаний передавать даже обезличенные пользовательские данные за периметр безопасности недопустимо.
Повышенный спрос на специализированные микросхемы отмечают и международные исследователи из аналитического агентства BCG, которые полагают, что спрос открывает двери для появления новых локальных производителей проприетарных чипов. Похожие выводы делают и аналитики GMI.
В 2021 году в разгар дефицита чипов J.P. Morgan оценивал разрыв между спросом и предложением в 10—30%. С тех пор близкие оценки озвучивают различные эксперты без ссылок на источники своих данных.
По словам Николая Шелепина, сейчас невозможно производить чипы для AI в России, потому что пока нет соответствующих технологий для производства. Например, производство литографов (с их помощью наносится «рисунок» на кремниевые пластины), необходимых для производства микросхем, сосредоточено в Голландии (крупнейший в мире производитель литографического оборудования компания ASML Holding N. V. занимает 91% рынка в денежном выражении) и в Японии (Nikon — 6%, Canon — 3%). Эти страны ввели ограничения на поставки оборудования в Россию.
Кроме технологий нужны и кадры. По оценкам экспертов, в России насчитывается всего 2000 инженеров — проектировщиков микросхем. Заместитель министра промышленности и торговли Российской Федерации Василий Шпак сказал, что российская система образования ежегодно поставляет в промышленность около 1000 специалистов в области микроэлектроники, то есть около 20% от требуемого количества.
Как решают проблему в мире
В ситуации дефицита и постоянного роста цен и длительных сроков поставки крупнейшие разработчики AI-моделей (Google, OpenAI, Microsoft, Amazon, Alibaba) представили собственные чипы для ИИ или объявили о работе над ними. Например, Azure Maia 100 (5-нм техпроцесс и 105 млрд транзисторов) нужен для оптимизации работы с LLM. Первый чип компании с жидкостным охлаждением. На основе Maia 100 реализовано модульное серверное решение специально для AI. Tesla также разрабатывает собственные нейронные чипы для обучения автопилота.
Чипы, разработанные компаниями, доступнее по цене и позволяют без проблем масштабировать AI-модели и облачные сервисы. Российскому бизнесу стоит начать сотрудничество с азиатскими компаниями из дружественных юрисдикций для совместной разработки и производства AI-чипов, полагают эксперты Sber Innovation & Research.
Аналитики Sber Innovation & Research считают, что проприетарные чипы компаний будут менее продвинутыми, чем разработки Nvidia или AMD. Они ориентированы на узкие AI-задачи. Создание собственной архитектуры чипа может быть недоступным для небольших компаний, но они вполне могут присмотреться к уже созданным решениям, которые обойдутся дешевле покупки Nvidia А100 или H100.
Наиболее перспективной площадкой для размещения заказов российских компаний Николай Шелепин назвал SMIC. Однако, по его словам, для успешного сотрудничества может потребоваться соглашение на уровне руководства государств.
Свои GPU (GPU или graphics processing unit — графический процессор) уже появились у ряда китайских разработчиков Tianshu Zhixin, Biren Technology и их число растёт. Бигтехи усилят этот процесс: открывается окно возможностей для формирования партнёрств с зарубежными игроками и собственных команд, полагают эксперты Sber Innovation & Research. Проприетарные чипы разрабатывают не только на Западе, но и в Индии, Китае.
Что делать российским компаниям
Разрешить существующую проблему недостатка вычислительных мощностей в России можно двумя способами, полагает Шелепин. Первый из них — «доставать» зарубежные микросхемы каким-либо способом, а второй — планомерно развивать собственные технологии.
Ещё летом 2022 года Тайвань официально запретил экспорт микропроцессоров и микросхем в Россию и Беларусь. Сейчас сроки поставки чипов ведущих производителей в Россию выросли с нескольких недель до нескольких месяцев, а цены подскочили в 2—3 раза за последний год, указал директор по развитию веб-технологий Artezio Сергей Матусевич. Вдобавок к срокам TSMC (Тайвань), крупнейший контрактный производитель чипов, недавно анонсировал очередное повышение цен на 6—9% для всех покупателей.
Сложнее всего пробиться в очередь небольшим компаниям и стартапам: приоритет отдаётся крупным игрокам, которые размещают заказы на миллиарды долларов, добавил Матусевич. По этой причине многие проекты приходится откладывать или сокращать из-за нехватки чипов, добавил он.
По мнению Матусевича, бизнес, который планирует внедрять AI-технологии (например, разработку собственной GPT-модели, голосовых роботов-помощников, которые умеют распознавать речь и генерировать ответ голосом), должен учитывать риски дефицита вычислительных мощностей и искать альтернативные подходы. Разработка проприетарных чипов — один из самых многообещающих вариантов в таких условиях, добавил он.
Впрочем, разрабатывать собственные чипы или искать проприетарные решения не от Nvidia или AMD может оказаться необязательным, потому что вычислительные мощности можно арендовать (например, у поставщиков облачных вычислений), если есть задача и деньги на её решение, полагает руководитель Лаборатории инноваций Норбит Дмитрий Демидов.
Альтернативный путь решения проблемы
Другой способ разрешить дефицит вычислительных мощностей — это повышение эффективности использования существующих ресурсов, полагает Дмитрий Демидов. На первый план выходят:
Также может помочь оптимизация ПО, считает генеральный директор компании «Системы компьютерного зрения» Михаил Смирнов. По его мнению, от использования проприетарных чипов в выигрыше окажутся все отрасли, где требуется низкое энергопотребление на единицу вычисления: беспилотная техника, возможно, специализированные кластеры для AI-задач.