新型Piapro Studioによる「初音ミク NT」や、AI歌声合成ソフトNEUTRINOによる「AIシンガーきりたん」など、歌声合成ソフトのリリースがまた増えてきましたね。今回はこの2つのソフトを比較してみましょう。超対極にあるので面白い。
やりこみ要素

初音ミク NTは“手動ガチ勢向け”だと思います。今までコントロールしたかったのにできなかったことができるようになっているので、細かく作りこみたい人にはかゆいところに手が届くソフトでしょう。

AIシンガーきりたんは“自動ガチ勢向け”だと思います。できるだけ短い時間で手間をかけずに人間に近い歌声を合成できます。曲と楽譜が適切ならコスパよくクオリティの高い音声が作れます。
機能の量

プロトタイプ版はV4Xなどと比べると機能が若干少ないです。E.V.E.Cのような複雑な機能を少ないパラメーターで実現する方向性なのか、実はシンプルな作りになっています。

NEUTRINO本体にはほぼ機能がありません。楽譜の打ち込み機能もありません。これ以上シンプルにはなりようがないです。sigさんが作ったエディターを使えばNTより機能は少ないですが、十分歌声を編集できます。
音質

V4Xと比べるとかなりこもった音になっています。EQやエキサイターでかなり高音を持ち上げてやらないとオケに埋もれてしまうので注意です。弱々しい声にするとこもりすぎた音になり、力強い声にすると飽和感のある鈍った声になるのでEQ力が試されます。

WORLD版はCeVIOに近い音質です。200~300Hzあたりを少し削って、高音域をハイシェルフで少し持ち上げるとすっきりとした音になります。NSF版はもう少し乾いた音になりますが、高音域が10kHzくらいまでしか出ないのでそれはそれで若干扱いに困ります。
難易度

ただ歌わせるだけならNTのほうが圧倒的に簡単です。公式サイトで購入してインストーラーを実行すれば普通に導入できるし、鉛筆ツールでノートを置いて歌詞を書けば普通に歌えます。

NEUTRINO自体にはGUIがないので、PCにある程度なれていなければ音を出すまでが難しいでしょう。楽譜も別のソフトを使って作るので初心者にはハードルが高いです。一度歌わせられれば、人間に近い歌声を作るのは世界で1番簡単と言っても過言ではないと思います。
ピッチ調声方法

プロトタイプ版はピッチカーブを直接手描きして編集します。AIシンガーきりたんもsigさんエディターではピッチカーブを直接手描きして編集するので、ここには差がほとんどありません。

sigさんエディターには「ビブラート付加」「ケロケロ化」「ピッチの平滑化」など、歌声編集ソフトと似た機能があるので、手描き以外もできますが、すべて手書きで作り上げるほうが速い場合もあります。
その他調声方法

ピッチ編集をのぞけば、基本的にはVOCALOIDに近い操作感です。VOCALOIDのシーケンス(VSQ/VSQX)や旧型Piapro Studioのシーケンス(PPSF)も読み込めます。

こちらは基本CeVIOに近い操作感です。CeVIOで書き出したシーケンス(XML)が読み込め、sigさんエディタなら簡易的なタイミング調声や音量調整ができます。

結論、ミクNTは「いじり倒して作りこみたい人」向けで、AIシンガーきりたんは「低コストで人間っぽくしたい」人向けです。
「手動ガチ勢はミクNT」「自動ガチ勢はAIシンガーきりたん」です。私はどっちも好きで使いますが。
ちなみに、どちらも歌声合成初心者にはおすすめしません。これからの時代のことも考えると、初心者はCeVIOから入るのがいちばんだと思います。