また新しいAI歌声合成ソフトが出ました。その名もAmadeuSY。

AmadeuSY
楽譜を投げるとAIが人間っぽい歌声を作って返してくれるシンプルなソフト。打ち込み機能と調声機能はないので外部ソフトを使う。
インストール
公式サイトの「Get started」を押すとGoogleドライブにつながるので「Synth.zip」を落とそう。ファイルサイズは1.2GB。
落としたZIPファイルを展開すればインストール終了。
楽譜
対応している楽譜は多分「.xml」と「.musicxml」。USTはUTF-8がどうので非対応だった。
歌詞
使える歌詞は基本ひらがなのみ。
使えない歌詞は以下の通り。
基本的にUTAUと同じだと思ったほうがいい。UTAUは上で示したような歌詞をたいてい使えないので(ずぃは普通歌えるけど)。
しいていえば使えない難読音の判別が難しい。作者が使える表記リストを出してくれるのを待とう。
実行
楽譜ができたらいよいよ合成。手順は以下の通り。
起動
synth.exeをダブルクリックするだけ。ちなみに私の環境では起動に約1分かかる。
音源の指定
起動するとCUI(UTAUでよく見る黒いやつ)が出る。最初に歌わせたい音源を選ぶ。例えば波音リツを使いたいなら「ritsu」と打ってEnterキー。
楽譜の指定
音源を指定できたら次は楽譜の指定。読み込ませたいXMLをCUIにドラッグアンドドロップすればOK。パスの直打ちでもOK。
出力WAV名の指定
書き出すWAVEファイルの名前を入力する。「Shutsuryoku.wav」とかではなく「Shutsuryoku」まででいい。
後は待つだけ。終了メッセージとかはないので、CUIが消えたらsynth.exeと同じ場所にあるoutputフォルダを開こう。
エラーメッセージ
AmadeuSYは合成がうまくいかなかったときにCUI上でエラーメッセージを出してどこがダメなのか教えてくれる。
私が出会ったエラーについて紹介します。
Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
エラーではない。無視していいやつ。
音源フォルダが見つからない
へんなところにZIPを展開すると「ritsu歌わせぇゆうけどそないなフォルダあらへんで」的なエラーを吐く。音源名を打ち間違えてるか、AmadeuSYそのものの置き場所が悪いかのどっちか。Dドライブ直下や日本語を含まない場所にAmadeuSYフォルダを丸ごと移動するとかしよう。
UnicodeDecodeError
USTを読み込むと出る。XMLにしろ。
非対応の歌詞
エラーが出たらだいたいこれ。歌えない歌詞がある。どの歌詞が非対応なのか書いているので、動体視力を駆使してエラーメッセージを読んで歌詞を変えよう。
合成するたびに1番最初に見つけた非対応歌詞1個教えてくれるので、変な楽譜を渡すと非対応歌詞を探しつくすだけで死ぬほど時間がかかるぞ。
あらかじめ非対応歌詞を把握して楽譜を作ればいい。基本はUTAU単独音式だ。