
Больше стран решают, что зависеть от американских или китайских моделей не комильфо, и делают свои. Теперь к клубу таких стран присоединилась и Южная Корея. Консорциум во главе с телеком-оператором SK Telecom прошел первый этап государственного отбора на создание «суверенного ИИ». Это уже не только декларация о намерениях, а проект, который должен избавить страну от необходимости арендовать (или дообучать) чужой ИИ, платя за это своими данными и деньгами.
Одной корейской компании такое вытянуть оказалось непросто, поэтому SKT собрали консорциум из 8 участников: от создателей чипов Rebellions до разработчиков игр Krafton. A.X K1 заявлена как большая языковая модель на 519 млрд параметров. Правда, работает на архитектуре Mixture-of-Experts (MoE). Это значит, что для генерации ответа используются не все ресурсы, а только выборочно 33 миллиарда активных параметров. Главное заявление разработчиков — что они учили модель с нуля, а не дообучали открытые западные аналоги вроде Llama.
Идея в том, чтобы построить фундамент, на котором в будущем будут работать корейские банки, госуслуги и корпорации. Заказчик здесь правительство, которое хочет получить безопасный и контролируемый ИИ. Чиновникам нужно, чтобы национальные системы не зависели от политики OpenAI или американских регуляторов. Китайские решение они, в общем-то, и не рассматривали — там добавляются геополитические причины.
SK Telecom только рады, ведь могут получить доминирующее положение не только на рынке связи, но и на рынке инфраструктуры для ИИ. Правда, с оператором на этом поле соревнуются 2 другие команды — LG AI Research и Upstage, у них более маленькие и дешёвые модели. Решение о финальном победителе и кандидате на внедрение будет принимать государство.
Корея не первая вписалась в этот тренд. Россия одна из первых создавала с нуля (по заявлениям Яндекса и Сбера) свои модели. Франция поддерживает Mistral, ОАЭ продвигают Falcon, Индия тоже пытается строить свой стек. Но порог входа высокий, нужно много вычислений и компетенций, поэтому многие всё ещё идут по пути наименьшего сопротивления и дообучают чужие модели локальными данными.
