AIシンガーきりたんは自動調声するから個性が出せないらしいので実験してみた

AIシンガー

出せます。

AIシンガーきりたんが登場してからそろそろ半年。この間、AIシンガーきりたんに対してずっっっっっっっっっっっっっっっっっっっっっっっといわれてきたことがあります。

それが「AIシンガーきりたんは自動調声するから個性が出せない」。

出せます。今回はAIシンガーきりたんを使っても個性が出せるという主張を私の愚痴とともにお送りします。

「全部同じに聞こえる」

これには原因がある。初期の動画がことごとくベタ打ちだったのです。

AIシンガーきりたんというか、NEUTRINOという歌声合成ソフトの特徴は「無調整でも人間っぽく歌う」というところだった。その結果、多くの人がベタ打ち無調声の状態で動画にしてUPしていたのです。

ベタ打ち無調声なんだから全部同じに聞こえて当たり前なんだなーー。むしろ違ってたらソフトウェアとしての再現性に疑問が残る。

VOCALOIDでもUTAUでもなんでもそうだが、ベタ打ち無調声の状態だったらどんな歌声合成ソフトのどんなキャラでも全部同じに聞こえるわい。

「調声してても全部同じに聞こえる」

ところでこの「全部同じに聞こえる」っていうのはおそらく「○○さん家のAIシンガーきりたんみたいなPごとの違いが出ている調声がなされた動画があまり見当たらない」という意味だろう。

「あまり見当たらない」の部分に関しては前述のとおりだが、調声しててもあんまり個性が感じられないらしい。

それはね、正解です。調声してても個性たっぷりな動画はあまりない。認めるしかない。もちろんあることにはある。

「調声で個性が出せない」

でも、「個性が出てる動画が少ない」のと「個性が出せない」のは全く別案件のはず。この2つには以下のようなパターンがある。

・個性が出せないソフトだから個性が出ていない
・個性が出せないソフトだけど個性が出ている
・個性が出せるソフトなのに個性が出ていない
・個性が出せるソフトだから個性が出ている

個性が出せないソフトというのは、おそらく音声をいろいろいじれないソフトのことだ。楽譜を入力してから音声を出力するまでの間に、調声らしい操作ができないという意味だろう。

そういう意味で該当するのはVOCALOID SDK for UnityかSinsyくらいのはず。これらのソフトは楽譜の打ち込み機能やピッチ編集機能を持っていない。

ただ、これらも最終的に個性が出せないなんてことは一切ない。楽譜の入力から音声の出力までにいじれないなら、楽譜の入力前と音声の出力後にいじり倒せばいいだけだし。

実際にいじり倒すとこれくらいの個性が出る。前者が操作なし。後者が操作ありだ。

入力前にいじるというのは、いい出力が得られるように歌詞やノートの配置など楽譜の記述方法を工夫することを指す。出力後にいじるというのは、メロダインなどでピッチやなんやをいじること。

「調声」の概念が違うんだな。そういう意味では「既存の調声で個性を出すのは無理」だが、「これからの調声で個性を出すのは別に普通にできる」ともいえる。

AIシンガーきりたんではそもそも楽譜の入力から出力の間で普通に調声作業ができる。NEUTRINO調声用のエディターが2個ほどあるから。個性が出ていないとすれば、それは個性が出せないソフトなのではなくユーザーが個性を出していないだけだと思う。

ユーザーが個性を出さない理由はたぶん自動調声にある。ベタ打ちで普通に歌がうまいので直す気になりにくいのだ。でもそれは「できない」のとは違う。

自動調声があるから調声する気にならないなら、自動調声をキャンセルしてゼロから作り直すのがいい。実は普通にしゃくりやビブラートを消し去る方法がある。全部まったいらにしてゼロから書き始めればいい。

そうするとCeVIO(CS6)と同じくらいいじる要素があるのだ。タイミングとピッチ、ボリューム、ビブラート、全体のジェンダー。つまりCeVIO程度には「○○さん家のAIシンガーきりたん」が十分作れるはず。

個性を出す実験

AIシンガーきりたんを使って、実際に個性が出せるか実験してみた。

音声は、無調声→普通に自由に調声→個性を追求した調声の順で流れる。

AIシンガーきりたんは自動調声しちゃうから個性が出せないとのことなので実験

男声化までできるのに個性が出せないとかある? ちなみにトークやラップも普通にできる。

無調声の音声は、ベタ打ちの楽譜を入力して調声はしないまま出力した音声。殿御のピッチ加工もなし。ビブラートはほとんど入らないし、しゃくりもそこまで多いわけではないので、全体的にストレートな印象だ。

調声した音声は、楽譜をきりたん用に編集して入力。ピッチや音量を調整したうえで出力した。ジェンダーを使ってちょっと大人っぽくした。ビブラートバリバリにしたし、ノートの途中でピッチが次のノートの音程に移ったりこぶしが入っていることがわかると思う。わからない人は耳を鍛えてください。

個性追及音声は、きりたん用に編集した楽譜を入力して自動調整をいったんリセット。ゼロからピッチ調声したうえでエディター上で男声化して出力した。ピッチカーブを見れば非常に人工的なことがわかるだろう。

もちろん、ジェンダーをアゲアゲにしてピッチ調声をリセットしたうえでたまに深めのしゃくりを入れればナユタンさんっぽくもできる。できるけどほとんどの人はAIシンガーきりたんにそれを求めていないのだ。

個性出してる人が少ないだけで、ソフトウェアとして出す能力は普通にあるので、「個性が出せないソフト」という認識は改めてほしい。
タイトルとURLをコピーしました