Приложений и устройств с голосовым интерфейсом становится все больше. В условиях ограниченного бюджета разработчикам нужны доступные и безопасные TTS-решения, которые синтезируют качественный голос на русском языке на мобильных устройствах
Для многих брендов РФ синтез речи из текста на русском языке может стать конкурентным преимуществом. Обычно для таких целей используют услуги диктора, но это не позволяет покрыть всех сценариев и приводит к дополнительным затратам
Мы предлагаем готовый и доступный по цене речевой модуль на русском языке на основе новейших нейросетей и алгоритмов. Enbisys.TTS позволяет добиться реалистичного звучания человеческого голоса
Автономная система TTS позволяет преобразовывать текст в естественную речь в режиме реального времени на ограниченных вычислительных ресурсах. Технология позволяет добиться реалистичного звучания человеческого голоса и создавать персонализированные голосовые решения. ENBISYS.TTS создана на технологиях Java/Android Runtime, а также ONNX Runtime
60 - 120%
48 - 120%
34 - 120%
24 - 120%
20 - 140%
18 - 130%
16 - 150%
14 - 170%
12 - 130%
8 - 130%
СССР → эс эс эс эр, квт.ч. → киловатт-часов, 22 людям → двадцати двум людям, 22 мяча → двадцать два мяча)
* Восстанавливает из сокращенного текста, а также преобразует цифры в текст
Расстановка ударений и буквы Ё*
Преобразователь из графем в фонемы*
* Графемы (буквы) нужно преобразовать в фонемы (например в звуки IPA).
Различаем омограмы:
за́мок - замо́к в зависимости от контекста
* Согласно правилами русского языка устанавливаем ударную гласную.
* Кодирует фонемы и знаки препинания в коды (числа), для входа нейросети
End-to-End* нейросеть для синтеза речи
* На вход нейросети поступают токены, а на выходе получается сгенерированное аудио
Система бесшовно интегрируется в ваше решение с возможностью дальнейшей кастомизации в будущем
Лингвистическая нейросеть
Восстановление сокращений
Транслитерация английских слов