Разработанную учеными НГУ нейросеть научили распознавать голосовые команды управления автономными роботами.
Специалисты из Исследовательского института искусственного интеллекта (AIRI) и Московского физико-технического института (МФТИ) в ходе совместной работы дообучили разработанную учеными НГУ нейросеть Wav2Vec2-Large-Ru-Golos для распознавания голосовых команд управления автономным роботом, сообщается на сайте вуза.
Научный сотрудник Лаборатории прикладных цифровых технологий Международного научно-образовательного математического центра НГУ Иван Бондаренко отметил, что нейросетевые модели Wav2Vec2-Large-Ru-Golos и Wav2Vec2-Large-Ru-Golos-With-LM ввиду своих высоких показателей качества распознавания речи, а также из-за простоты использования и доработки, оказались востребованными в сообществе специалистов по распознаванию речи на русском языке.
«Глубокую нейросеть, которая «понимает» язык, вполне можно дообучить превращению команды, поставленной человеком, в цепочку визуально-моторных инструкций управления, обеспечивающих выполнение роботом этой команды. Так, например, простая команда человека «подай стакан воды» должна быть трансформирована в достаточно длинную цепочку манипулирований объектами и перемещений в пространстве, выполняемых роботом», – отметил ученый.
Бортовой интеллект робота не только должен уметь генерировать детальный план низкоуровневых управляющих инструкций по высокоуровневой команде человека, он еще должен быть способен правильно услышать эту команду. Эту проблему специалисты AIRI решили с помощью нейросетевых моделей распознавания речи Wav2Vec2-Large-Ru-Golos и Wav2Vec2-Large-Ru-Golos-With-LM.
Филиал № 4 ОСФР по Москве и Московской области информирует:
Более 12 тысяч жителей Москвы и Московской области получают повышенную пенсию за работу в сельском хозяйстве
Уроженец из Узбекистана помогал другим мигрантам нелегально закрепиться в России
Из-за дождя обрушилась насыпь дороги Шахтерск – Бошняково на Сахалине
Гайд по регистрации, установке и входу в Throne and Liberty для игроков из России и СНГ
Activision secretly experimented on 50% of Call of Duty players by 'decreasing' skill-based matchmaking, and determined players like SBMM even if they don't know it
Arena Breakout празднует 1 годовщину новой картой, игровым режимом и наградами
A Google Doodle animator is my new favorite Elden Ring lore theorist thanks to this cartoon retelling of Shadow of the Erdtree set to a Taylor Swift song