Битва за чипы: стартапы мешают Nvidia расслабиться

С ростом популярности искусственного интеллекта возник новый рынок — специализированные чипы, необходимые для обучения и запуска нейросетей. В прошлом году его оценили в 73 миллиарда долларов, и к 2034 году прогнозируется рост до 900 миллиардов. Как это ни удивительно, но главные инновации на этом рынке происходят не благодаря крупным компаниям, а благодаря стартапам.

Одним из таких примеров является компания Groq, которая разработала новый подход к запуску ИИ-моделей. Они сделали уникальные чипы с архитектурой LPU (Language Processing Unit), которые предназначены для последовательной обработки токенов и языковых задач. Это делает их в 10 раз быстрее и энергоэффективнее, чем видеокарты от Nvidia. И это на 14-нанометровом техпроцессе (а уже в 2025 году планируют сделать 4 нанометра).

Их достижения произвели такое впечатление на Саудовскую Аравию, что Aramco Digital инвестировала в Groq 1,5 миллиарда долларов для создания крупнейшего центра ИИ на Ближнем Востоке, который открылся ранее в этом месяце. Планы довольно амбициозные — создать инфраструктуру, способную обслуживать 4 миллиарда человек в регионе и за его пределами.

Ещё одной «звездой» на рынке является компания Cerebras, которая разработала собственную архитектуру Wafer Scale Engine. Её главная особенность — огромный размер чипа и количество транзисторов, что позволило ей обойти даже Groq по скорости работы и быстро занять лидирующие позиции.

Однако, как показывает практика, стартапы могут успешно развиваться только до тех пор, пока крупные компании не выкупят их или не создадут собственные, более совершенные решения. OpenAI уже предпринимала попытки купить Cerebras в 2017 году через Tesla, но тогда сделка сорвалась. Сейчас они планируют сотрудничество с TSMC для производства собственных чипов.

Другие компании тоже активно работают в этом направлении: Google с Trillium, Microsoft с Azure Maia, Amazon с Trainium, Alibaba с Hanguang, Huawei с Ascend и так далее. Никто не хочет зависеть от Nvidia, которая занимает 80% рынка ускорителей для ИИ. Google заявляют, что благодаря Trillium их последняя модель Gemini 2.0 стоит дешевле конкурентов и работает быстрее.

В России пока о собственных чипах говорят мало, да и спрос на них сильно ниже — оборудование для дата-центров проще импортировать. Единственный выход для компаний в параллельном импорте и сотрудничестве с дружественными странами.

//Илья Власов