SynthVとSynthV AIはどれくらい違うか?

その他歌声合成

12月25日に、AI歌声合成ソフト「Synthesizer V AI」がリリースされましたね。ソフトはほぼ同じ(Synthesizer VにAI歌声合成機能が付いた)なんですが、今後はSynthV音源というと「スタンダード版」と「AI版」の少なくともどちらかが出ることになります。

で、このスタンダード版(めんどいのでSDと呼ぶ)とAI版がどのくらい違うのかという話です。例えば、今後小春六花を買おうと思った場合にSD版にするかAI版にするかは迷うと思うんですよね。両方という選択肢もあるでしょうけど。

今日は、SD版とAI版の音源の違いを見ていきましょう。

Synthesizer V AI

AI歌声合成ソフト。楽譜を打ち込むと、AIが歌声の波形を生成する。「ピッチ自動調整」の機能を使えば、ピッチカーブも勝手に描いてくれる。AIじゃないほうのSynthesizer Vは主に素片接続方式で歌声を合成していた(収録した波形を切り貼りするやり方)。

「Synthesizer V AI」というパッケージがあると言うよりは、Synthesizer VがアプデでAI歌声合成に対応したというのが近い。すでにSynthesizer Vを持ってる人はソフトを更新するだけでAI歌声合成機能が使えるようになる。

他にも「テンション」と似た効果の「トーンシフト」パラメーターが追加されてたりする。

ソフトをアップデートしても、今持っている音源が勝手にAI版音源になるわけではない。SD版はずっとSD版のまま。AI歌声合成したいならAI版音源を買わないといけない。

音の違い

既にリリースされているSaki(SD版)とSaki AIの音を聞き比べてみましょう。

SD版

AI版

基本的には好みで選べばいいと思います。個人的には、調声しなくてもAIの方が人間に近い自然な声をしていると思う。ボカロ曲に合うのはSD版。なので、使い分けかなという感じ。

機能の違い

SD版もAI版もSynthesizer Vのエディタを使うのは一緒なので、基本的な機能はほぼ同じ。

SDにはあるがAIにはない→音程グループ
AIにはあるがSDにはない→AI自動調整

主な違いはこの辺。

SD版音源は、再生するサンプルを切り替える「音程グループ」という機能があった。発音が気に入らんなーというときに、「か_sample1」を「か_sample2」に切り替えるとかいうことができる(表記はイメージ)。AI版音源では使えない。

AI版音源は、AIが自動でピッチカーブを描く自動調整機能がある。SD版には(音源によって)簡易版自動調整機能がある。あることにはある。対応している音源だけ(日本語音源の場合現状はSaki、琴葉姉妹だけ)。

今後出てくる音源の仕様がどうなるかは分からないが、おそらく、SD版もAI版も両方作られる音源は、SD版にも簡易調声機能は付いてくるんじゃなかろうか。

選び方

基本的には、自分のやりたいこと(ボカロっぽい曲がやりたいのか人間っぽいのがいいのか)と、試聴してみたときの声の好みで決めればいいんじゃないかと思う。模試、音程グループやAI自動調整機能が絶対欲しいということであれば、それがある方を選べばいいが、多分それは優先順位低い。

タイトルとURLをコピーしました