Мозги роботов на вынос

Индустрия робототехники уперлась в аппаратный тупик. Чтобы запустить на роботе современную LLM, внутрь корпуса нужно поместить вычислительные мощности, сопоставимые с серверной стойкой. Это либо невозможно физически, либо экономически бессмысленно, поэтому вычисления часто переносят в облако. По этому пути пошла «Наносемантика» и выпустила софт, который превращает робота в терминал для связи с подобным облаком.

Решение работает на платформе DialogOS. Компания заявляет, что на борту машины остаётся только скрипт для передачи аудио, а тяжелые задачи (распознавание, синтез речи, генерация ответов и вычленение команд для управления) работают в облаке. По словам разработчиков, к системе можно подключить актуальную нейросеть, будь то Gemini или отечественные модели (провайдеров не называют, но догадаться можно).

На тестах софт проверили на роботе-собаке: говорят, что комбинация детекторов голоса и ключевых фраз позволила псу реагировать на кличку и вести осмысленный диалог. Такие истории не новость — даже игрушки с базовым софтом и LLM, сделанные по подобному принципу, уже запускали в продажу (а ещё ловили на том, что они рассказывают детям про спички и БДСМ).

Подход компании решает проблему производительности, но создаёт уязвимость — зависимость от связи. Если мы говорим про роботов, то в цеху может пропасть Wi-Fi, вырасти пинг или просто «отвалиться» сервер, и тогда конструкция превратится в дорогой кирпич. То же касается домашней собаки-робота. Тем показательнее, чем на сегодня это чуть ли не единственно рабочий способ дать роботу адекватный интеллект.