
Baidu задалась вопросом «О чём говорят животные?» (не зря же у них на логотипе лапка) и теперь исследует возможность перевести их речь на человеческий язык с помощью искусственного интеллекта. По крайней мере, соответствующий патент они уже подали. Акцент в СМИ почему-то делают именно на кошачьем мяуканье, хотя мы ознакомились с патентом и речь в нём идёт о животных в целом.
Система Baidu интересна тем, что предполагает сбор мультимодальных данных из разных каналов — не только звуков, но и поведения животных, фиксацию их физиологического состояния. Это нужно, чтобы распознать эмоциональное состояние животного и уже потом преобразовать звуки в понятные нам слова.
Правда, Baidu на этом поприще не первые. Ученые по всему миру активно работают в попытке расшифровать язык животных. Например, исследователи из Мичиганского университета разработали ИИ, способный отличать игривый лай собаки от агрессивного, и определять по нему возраст, пол и породу животного. Параллельно идет масштабный проект Project CETI, где с 2020 года анализируют коммуникацию кашалотов (оказалось, у них есть структура, похожая на фонетический алфавит людей). А Google DeepMind вместе с Wild Dolphin Project выпустили языковую модель Dolphin Gemma для интерпретации звуков дельфинов.
Но всё это ещё очень далеко от реального понимания языка животных, так что лишний раз радоваться подобным новостям не стоит — со своей кошкой поговорить пока не удастся.