Впервые абазинский и абхазский языки вошли в крупнейший переводческий сервис страны и получили инструмент, открывающий доступ к ним для миллионов людей по всему миру.
Президент «Алашары» Мусса Хабалевич Экзеков отметил важность этого шага:
«Сохранение и развитие языка — это комплексная работа. Здесь нет одного решения, которое способно изменить ситуацию. Язык нужно поддерживать в школе, в семье, в общественной жизни и, конечно, в современных технологиях. Появление абазинского и абхазского языков в цифровой среде — ещё один важный инструмент в большом общем деле, которым мы занимаемся много лет. И мы продолжим эту работу дальше».
Работа над добавлением абазинского языка шла почти два года и стала результатом сотрудничества Министерства по делам национальностей КЧР, Министерства цифрового развития КЧР, Министерства образования КЧР, Института гуманитарных исследований им. Х.Х. Хапсирокова и организации «Алашара».
За последние полгода команда «Алашары» провела масштабную работу по созданию корпуса данных для нейросети. Было собрано, переведено и систематизировано около 70 000 абазинских предложений с подстрочным русским переводом — это архивные публикации организации «Алашара» за более чем 12 лет, материалы ВААК, книги, статьи, журналы и другие тексты. Ещё примерно 50 000 сложных предложений было переведено ипередано Институтом гуманитарных исследований.
В итоге Яндексу был предоставлен корпус из 120 000 параллельных предложений, на котором и была обучена модель.
Руководитель «Алашары» Мурат Гедугов поясняет:
«Хочу в первую очередь выразить большую благодарность Министру КЧР по делам национальностей, массовым коммуникациям и печати Есенееву Мурату Мухарбиевичу за инициирование этого важного проекта. Мы видим огромную перспективу в том, чтобы использовать нейросети для изучения и преподавания языка. Это позволит создавать учебные материалы, распознавать речь, строить новые цифровые проекты. Медленно, шаг за шагом мы формируем основу для качественной цифровизации нашего языка, что в будущем открывает огромные возможности для его преподавания, изучения и развития с использованием современных технологий. Конечно, качество нынешнего перевода ещё далеко от идеала. Мы только сделали первый шаг в обучении нейросети. Теперь можно постепенно улучшать модель и последовательно расширять её возможности».
Благодаря Яндекс.Переводчику теперь абазинский язык доступен абазинам диаспоры, школьники и студенты получают дополнительный инструмент для обучения, а цифровая среда — основу для развития проектов по распознаванию речи, оцифровке текстов и созданию новых образовательных ресурсов. Впервые абазинский язык можно переводить на десятки мировых языков — от китайского до французского, что делает его заметным и узнаваемым далеко за пределами Кавказа. Это ещё один шаг к тому, чтобы язык звучал, развивался и уверенно жил в XXI веке.