メモ書き程度ですが、どういう方針で開発を進めているかを紹介します。
- バージョンが上がっても、
/audio_query
で返ってくる値をそのまま/synthesis
に POST すれば音声合成できるようにする予定ですAudioQuery
のパラメータは増えますが、なるべくデフォルト値で以前と変わらない音声が生成されるようにします
- バージョン 0.7 から音声スタイルが実装されました。スタイルの情報は
/speakers
から取得できます- スタイルの情報にある
style_id
をspeaker
に指定することで、今まで通り音声合成ができます- style_id の指定先が speaker なのは互換性のためです
- スタイルの情報にある