Настройка речевого вывода

LUWRAIN имеет динамически конфигурируемую подсистему управления речевыми синтезаторами для организации качественного вывода речи — одной из важнейших своих функций. Речевые синтезаторы подключаются в виде расширений и могут быт выбраны через Панель управления или при помощи аргументов командной строки. С техническими особенностями создания расширений для подключения речевых синтезаторов можно ознакомиться на странице документации для интерфейса org.luwrain.speech.Engine.

Каждый поддерживаемый синтезатор задаётся двумя параметрами: именем и списком аргументов. Аргументы задаются в виде ключ1=значение1, ключ2=значение2.... В Панели управления можно задать два подобных блока параметров: для интерактивного взаимодействия с системой и для прослушивания текстов. Соответствующие настройки находятся в разделе Ввод/вывод->Речь->Общие. Для прослушивания текстов задаются также скорость и высота голоса.

Как говорилось выше, дополнительно к настройке в Панели управления синтезатор для интерактивной работы можно задать через ключ командной строки –speech=. Например, если нужно принудительно включить синтезатор RHVOice с голосом "Александр", то необходимо указать параметр –speech=rhvoice:voice=Aleksandr.

Поддерживаемые синтезаторы

Список поддерживаемых механизмов вывода речи включает в себя:

cmdtts;
emacspeak;
mssapi (Microsoft Speech API);
rhvoice (Russian HTS Voice);
picotts (SVOX Pico);
voiceman.

Указанные синтезаторы неравноценны по своему функционалу и могут быть доступны только для ограниченного подмножества поддерживаемых платформ. К примеру, Microsoft Speech API недоступен в GNU/Linux, а речевые серверы Emacspeak не могут быть использованы для прослушивания текстов.