Baidu и Samsung запустят в производство чип для ускорения задач ИИ

Компания Baidu и Samsung Electronics объявляют о создании первого ускорителя искусственного интеллекта от Baidu — процессора Baidu KUNLUN, который предназначен для работы в самых различных платформах, от облака до периферии. Компании готовы запустить его в массовое производство уже в начале следующего года.

В основе чипа Baidu KUNLUN лежит передовая разработка Baidu XPU — собственная архитектура нейронных процессоров для облачных и граничных вычислений, в нем используется 14-нм техпроцесс и технология пакетирования I-Cube™ от Samsung.

Новый процессор обеспечивает пропускную способность памяти на уровне 512 гигабайт в секунду (Гб/с) и позволяет осуществлять до 260 тераопераций в секунду (TOPS) при энергопотреблении 150Вт. Кроме того, в чипе поддерживается Ernie, предварительно обученная нейронная модель для обработки данных на естественном языке, которая осуществляет построение логических выводов втрое быстрее, чем традиционная модель ускорения GPU / FPGA.

Благодаря большой вычислительной мощности и низкому энергопотреблению новый процессор позволит Baidu с высокой эффективностью выполнять самые различные задачи, в том числе запускать масштабные рабочие нагрузки с использованием искусственного интеллекта, например, ранжировать поисковые результаты, распознавать речь, изображения и естественные языки, а также разрабатывать системы автономного вождения и реализовывать платформы глубокого обучения, такие как PaddlePaddle.

В рамках пилотного сотрудничества Baidu предоставит свои передовые платформы искусственного интеллекта для обеспечения максимальной производительности, а Samsung запустит производство на своих полупроводниковых фабриках процессоров для высокопроизводительных вычислений (HPC), предназначенных для работы в облаке и на периферии.

«Мы рады оказаться в числе лидеров индустрии высокопроизводительных вычислений вместе с Samsung Foundry, — говорит Оуянг Цзянь (OuYang Jian), заслуженный архитектор в Baidu. — Baidu KUNLUN — это чрезвычайно сложный проект. Он не только обеспечивает высокий уровень надежности и производительности, но и задействует самые передовые технологии в полупроводниковой отрасли. Благодаря инновационным технологическим процессам Samsung и высоким компетенциям специалистов, работающих на полупроводниковых фабриках компании, мы смогли достичь нашей цели и даже превзойти ее, предложив еще более качественный пользовательский опыт при работе с искусственным интеллектом».

«Проект Baidu KUNLUN представляет собой важную веху для Samsung Foundry, поскольку теперь мы расширяем сферу нашей деятельности и производим не только микросхемы для мобильных устройств, но и процессоры для центров обработки данных, разрабатывая и запуская в массовое производство чипы для ускорения задач искусственного интеллекта. Samsung предоставит комплексные решения для всего цикла полупроводникового производства, начиная с оказания помощи в проектировании чипов и заканчивая передовыми техпроцессами, такими как 5LPE, 4LPE, а также технологией 2,5D упаковки», — говорит Райан Ли (Ryan Lee), вице-президент по маркетингу полупроводниковых решений Samsung Electronics.

Поскольку в различных приложениях, таких как рабочие нагрузки искусственного интеллекта или HPC-вычисления, постоянно требуется более высокая производительность, все большую актуальность сегодня приобретают технологии пакетирования (chip integration technology). Представленная Samsung технология интеграции I-Cube™, соединяющая логический чип и память с высокой пропускной способностью (HBM2) с подложкой (interposer), позволяет добиться еще более высокой плотности и пропускной способности при минимальном размере за счет использования дифференцированных решений Samsung.

По сравнению с предыдущими разработками новые решения позволяют значительно увеличить производительность процессора и обеспечивают прирост вычислительной мощности / целостности сигнала более чем на 50%. Считается, что внедрение I-CubeTM ознаменует начало новой эпохи на рынке гетерогенных вычислений. Кроме того, Samsung разрабатывает еще более совершенные технологии пакетирования, такие как технологию RDL-подложки (redistribution layers), а также интегрированные корпуса с 4x и 8x HBM памяти.