В рамках инициативы Ana-Yurt была разработана модель синтеза речи (Text-to-Speech, TTS) для крымскотатарского языка на базе архитектуры SpeechT5. Модель предназначена для преобразования письменного текста на крымскотатарском языке в естественно звучащую речь и может использоваться в образовательных, исследовательских и прикладных цифровых решениях.
Основная цель проекта — поддержка и сохранение крымскотатарского языка с помощью современных технологий искусственного интеллекта, а также расширение его присутствия в цифровой среде.
Как работает модель
Модель обучена на крымскотатарском речевом корпусе и использует нейросетевой подход для генерации аудио из текста. На вход подаётся текст на крымскотатарском языке, а на выходе формируется синтезированная речь с естественной интонацией и ритмом.
Модель оптимизирована для работы с малоресурсным языком и может быть интегрирована в:
-
образовательные платформы,
-
онлайн-сервисы,
-
мобильные и веб-приложения,
-
исследовательские и open-source проекты.
Доступ и использование
Модель опубликована в открытом доступе на платформе Hugging Face. Подробные инструкции по установке, настройке и использованию, а также примеры кода доступны на странице модели.
🔗 Страница модели:
https://huggingface.co/servinosmanov/speecht5-crh-sevil
🔗 Профиль автора и другие проекты:
https://huggingface.co/servinosmanov
Проект развивается как часть более широкой экосистемы языковых и культурных технологий Ana-Yurt, направленных на цифровое сохранение и развитие крымскотатарского наследия.