Искусственный интеллект учится: чат-бот переводит якутскую речь в текст
В День родного языка и письменности Национальная библиотека Якутии представила инновационный проект, направленный на развитие и поддержку якутского языка в цифровой среде. Был создан телеграм-бот «Саҥа-сурук/Speech to text/Речь в текст», который переводит устную якутскую речь в письменный формат, сообщает пресс-служба библиотеки.
Проект был запущен год назад. В течение этого времени на платформе собрано более 12 000 текстов и аудиозаписей, которые стали основой для обучения искусственного интеллекта пониманию якутского языка. Благодаря этому ИИ начал распознавать и анализировать речь, а чат-бот стал одним из доступных инструментов для пользователей. Работа реализовалась благодаря сотрудничеству Национальной библиотеки республики со Сбербанком и Арктическим государственным институтом культуры и искусств, рассказал ЯСИА заместитель директора Национальной библиотеки Василий Борисов.
Комментируя развитие проекта, он также отметил, что сервис пока продолжает обучение.
«Некоторые пользователи замечают, что чат-бот делает ошибки. Это нормально, потому что он находится в процессе обучения. Чем больше людей будет использовать его, тем быстрее накопятся знания и повысится точность распознавания якутской речи», — сказал Борисов.
С помощью чат-бота пользователи могут отправлять голосовые сообщения на якутском языке и получать их текстовую расшифровку.
Кроме того, важным результатом работы стала технология синтеза речи «Истиҥ», которая позволяет преобразовывать текст в аудиоформат. На сайте Национальной библиотеки уже опубликованы первые книги, озвученные искусственным интеллектом: роман Николая Лугинова «Чыҥыс Хаан ыйааҕынан» и рассказ Василия Яковлева «Кытта кырдьыбыт тэҥкэ тиит».
Национальная библиотека Якутии продолжает работу над развитием технологий для сохранения и популяризации якутского языка, создавая новые цифровые инструменты для его изучения и использования.