Лингвисты из Марий Эл научат Google-переводчик понимать марийский язык
Лингвисты планируют добавить марийский язык в Google-переводчик, а также улучшить работу «Яндекс.Переводчика».
Йошкар-Ола, 23 марта. Лингвисты планируют добавить марийский язык в Google-переводчик, а также улучшить работу «Яндекс.Переводчика».
К 100-летию республики Марий Эл специалисты создают национальный корпус параллельных текстов на марийском и русском языках. С 2018 по 2020 год они смогли собрать 20 миллионов словоупотреблений. Об этом рассказал специалист Марийского института языка, литературы и истории Андрей Чемышев.
Данный корпус станут использовать с целью эффективного обучения программы машинного перевода. Планируется, что такая система будет содержать в себе 1 миллион предложений. Чемышев отметил, что в Яндексе и в Google для идеального перевода англо-русская пара составляет именно миллион предложений, пишет «МедиаПоток».
«Если базу параллельных текстов мы догоним до этого показателя, то мы сможем создать собственный переводчик», — подчеркнул лингвист.
Россияне в 2021 году впервые смогут написать Тотальный диктант не только на русском, но и на английском языке. Он состоится в Москве, Петербурге, Екатеринбурге и еще 15 городах РФ.