Аккредитация в обмен на вузы: ИТ-компании обяжут тратить 3% сэкономленных налогов на студентов Аккредитация в обмен на вузы: ИТ-компании обяжут тратить 3% сэкономленных налогов на студентов Anthropic наносит ответный удар по Пентагону Anthropic наносит ответный удар по Пентагону Amazon решил поджечь рынок смартфонов Amazon решил поджечь рынок смартфонов Xiaomi меняет фокус со смартфонов на электромобили Xiaomi меняет фокус со смартфонов на электромобили

Ученые МТУСИ разработали нейросетевую модель распознавания голосовых команд для системы управления роботом-манипулятором

Россия 1 мин
Фото Pavel Danilyuk/pexels.com (CC)

Взаимодействие человека с роботом-манипулятором все чаще входит в практику работы в пищевой промышленности и медицине. По словам ученых, для такой работы целесообразно по максимуму использовать возможности нейросетевой модели для распознавания и классификации голосовых команд.

Благодаря перебору параметров нейронной сети, учеными МТУСИ определена наиболее результативная архитектура, состоящая из пяти скрытых (8, 16, 32, 64, 128 нейронов) и двух полносвязных слоев (256 и 128 нейронов). Представленная архитектура обеспечивает точность распознавания команд 87.17% на тестовом наборе.

В ходе обучения нейронной сети использована часть набора данных от компании Google, включающая 64 728 аудиофайлов, содержащих записи одной из 30 команд на английском языке, 12 из которых могут быть использованы в системе управления роботом-манипулятором.

«В рамках дальнейшей работы планируется собрать собственный набор данных, состоящий из команд для робота-манипулятора на русском языке, попробовать увеличить точность распознавания команд до 95% и осуществить передачу исполнительной команды непосредственно роботу-манипулятору», — рассказал Данил Подпалый, магистрант МТУСИ.

Разработанная модель распознавания голосовых команд может использоваться при проектировании и разработке системы управления промышленным роботом-манипулятором на базе голосового управления либо при разработке полноценной диалоговой системы для коллаборативной работы человека и робота-манипулятора.

Ученые из МТУСИ выразили уверенность в том, что ещё более широкое внедрение нейросетевой модели распознавания голосовых команд позволит предприятиям выйти на новый уровень выполнения задач, увеличить эффективность работы и перераспределить обязанности между устройствами и людьми.