Насколько хорошо искусственный интеллект знает якутский язык
Искусственный интеллект (ИИ) учится общаться на якутском языке. Он может не только понимать, но и переводить, составлять простые тексты и даже поддержать простую переписку. Корреспондент ЯСИА разбиралась, насколько развиты возможности различных нейросетей, и какая лучше всего работает с якутским языком.
Для объективного сравнения нейросети были протестированы на одном и том же предложении. Например, на запрос написать поздравительный текст на якутском языке GigaChat от Сбербанка поприветствовала пользователя и написала общий текст о значении якутского языка, OpenAI предоставила короткое поздравление с переводом на русский язык, а наиболее полно просьбу выполнила китайская нейросеть DeepSeek, создав развернутый текст.
Google Gemini и Microsoft Copilot вовсе не поддерживают якутский язык, что делает их не актуальными для пользователей, желающих работать с этим языком.
OpenAI
OpenAI активно работает с большим количеством языков, но поддержка якутского остается ограниченной из-за недостатка данных. ChatGPT может генерировать фразы на якутском, но его уровень понимания структуры языка остается поверхностным. GigaChat
GigaChat или GPT3, представленный Сбербанком в 2022 году как mGPT, позиционируется как первый российский ИИ, способный генерировать тексты на якутском языке, но его качество сильно зависит от исходных данных. DeepSeek
DeepSeek, созданный в Китае 1,5 года назад, отличается от многих других существующих ИИ благодаря фокусу на малоизученных и менее распространенных языках. Нейросеть демонстрирует хорошие результаты за счет эффективного использования ресурсов и узкой специализации.
Преимущество DeepSeek перед другими нейросетями отметил учитель французского языка Владислав Коротов. Для подготовки научной статьи он поручил ИИ перевести на якутский язык объемный текст на десяти страницах, и нейросеть справилась с этим за пять минут. По словам Коротова, перевод получился с хорошим уровнем точности.
«Несмотря на наличие в статье специфической спортивной терминологии, а также понятий, связанных с Якутией, перевод сохранил смысл и был выполнен без значительных искажений. Конечно, автоматические переводы не всегда бывают идеальными, но в данном случае результат оказался на достойном уровне», — рассказал Владислав Коротов.
Якутский язык и ИИ
Использование ИИ для разработки инструментов перевода, анализа текстов и создания образовательных приложений на якутском языке открывает новые возможности для его сохранения и развития. Это особенно важно в эпоху глобализации, когда многие малые языки оказываются под угрозой исчезновения.
Значимость проникновения языка саха в технологии подчеркнул член Совета по развитию языков при главе Якутии, кандидат медицинских наук, магистр лингвистики Николай Павлов-Халан. «Без этого язык может потерять свою привлекательность для молодежи, а значит, потерять со временем своих носителей, перестать быть средством общения и, главное, творчества», — считает эксперт.
«Мы должны всемерно приветствовать проникновение языка саха и языков малочисленных народов Якутии в эти технологии. И не только приветствовать, но и содействовать этому. Делать это не так сложно, как кажется. Нужно во-первых, использовать эти технологии в своей жизни, а во-вторых, участвовать в общественных активностях, содействующих этому», — отметил Николай Павлов-Халан.
Чтобы повысить знания нейросетей о якутском языке, лингвист предлагает дать им, например, задачу написать стихи в стиле Алампа, сократить большой якутский текст из хрестоматии, собрать статистику по наслегам Якутии за какой-то период. Чем больше запросов будет на якутском языке, тем быстрее он сможет интегрироваться в цифровой мир, за которым будущее.