Вясофона не будет: мобильную платформу Вконтакте, Яндекс и Сбер будут разрабатывать отдельно

Коллеги из Коммерсанта сообщили, что Яндекс, VK и Сбер решили отказаться от совместной разработки мобильной платформы. Как и оригинальная новость о таких намерениях, вышедшая в сочельник 2022 года, она основана на информации от источников, только в этот раз в их роли выступают не сотрудники редакции, а вполне себе живые люди с рынка.

Ученые МТУСИ разработали нейросетевую модель распознавания голосовых команд для системы управления роботом-манипулятором

30 октября 2023, 18:20

роботы, сделано в России, искусственный интеллект

Взаимодействие человека с роботом-манипулятором все чаще входит в практику работы в пищевой промышленности и медицине. По словам ученых, для такой работы целесообразно по максимуму использовать возможности нейросетевой модели для распознавания и классификации голосовых команд.

Благодаря перебору параметров нейронной сети, учеными МТУСИ определена наиболее результативная архитектура, состоящая из пяти скрытых (8, 16, 32, 64, 128 нейронов) и двух полносвязных слоев (256 и 128 нейронов). Представленная архитектура обеспечивает точность распознавания команд 87.17% на тестовом наборе.

В ходе обучения нейронной сети использована часть набора данных от компании Google, включающая 64 728 аудиофайлов, содержащих записи одной из 30 команд на английском языке, 12 из которых могут быть использованы в системе управления роботом-манипулятором.

«В рамках дальнейшей работы планируется собрать собственный набор данных, состоящий из команд для робота-манипулятора на русском языке, попробовать увеличить точность распознавания команд до 95% и осуществить передачу исполнительной команды непосредственно роботу-манипулятору», — рассказал Данил Подпалый, магистрант МТУСИ.

Разработанная модель распознавания голосовых команд может использоваться при проектировании и разработке системы управления промышленным роботом-манипулятором на базе голосового управления либо при разработке полноценной диалоговой системы для коллаборативной работы человека и робота-манипулятора.

Ученые из МТУСИ выразили уверенность в том, что ещё более широкое внедрение нейросетевой модели распознавания голосовых команд позволит предприятиям выйти на новый уровень выполнения задач, увеличить эффективность работы и перераспределить обязанности между устройствами и людьми.

Apple Vision Pro рискует остаться без приложений

Подпишитесь на наш Telegram-канал @contentreview

Вясофона не будет: мобильную платформу Вконтакте, Яндекс и Сбер будут разрабатывать отдельно

Айфон лихорадит, Android поджимает

«Синяя галочка позора»: Twitter/X пометил журналистов насильно

Ученые МТУСИ разработали нейросетевую модель распознавания голосовых команд для системы управления роботом-манипулятором