В Кыргызстане представили открытую эмоциональную модель синтеза кыргызской речи
По информации от разработчиков, модель функционирует в реальном времени и не требует дорогого оборудования:
- на видеокарте RTX 3060 синтез речи осуществляется с задержкой около 0,5 секунды;
- на RTX 4080 - примерно 0,2 секунды.
Разработчики заявляют: "Мы уверены, что открытая экосистема вокруг Kani TTS поспособствует развитию новых сервисов на кыргызском языке - от голосовых интерфейсов в госсекторе до локализованных бизнес-решений".
Модель доступна для тестирования и применения:
протестировать;
скачать.
К разработке проекта приложили усилия Уланбек Абдуразаков, Денис Павлов и Нурсултан Бакашов.
Обсудим?
Смотрите также:
