歌声合成ソフト界隈の話題は巡る……。
2020年が早くも後半戦に差し掛かった今日この頃。歌声合成ソフト界隈では定例となっている「歌声合成ソフトの総称は何がふさわしいか総選挙」の時期がやってまいりました。第何百回目かな?
この記事では、歌声合成ソフトの総称としてふさわしい資質を見ていきます。理論って言っても理論ではなくくろ州の持論なのであんまり信用してはいけない。
「(便宜上)ボカロでいいじゃん」と思ったそこのあなた。それはそう。
歌声合成ソフトの総称
2007年に初音ミクが登場してVOCALOIDブームが起こって以降、キャラクター歌声合成の総称としては事実上「ボカロ」が使われている。
VOCALOID/ボカロというネーミングセンスの鬼みたいな名前の使い心地が良すぎてだれも手放せなくなってしまったんだな。
ただし、VOCALOID/ボカロは歌声合成ソフトの総称としては残念ながら不適切なのだ。なぜならヤマハが「総称として使うのはやめて」(意訳)って言ってるから。
「VOCALOID」の基礎知識
VOCALOID/ボカロという名前には以下のような2つの定義がある。
2020年現在はこれが正しい定義。実は意味が2つある。
前者は、VOCALOID1~VOCALOID5など、ヤマハが製品としてすでに発売しているソフトのこと。
後者は、製品としてのVOCALOID+VOCALOID:AI(など)のことなんだな。
2019年にヤマハが「AI美空ひばり」の開発を発表したときに、VOCALOIDの定義が変わって後者の意味が付け足された。
いずれにしても、ヤマハ的にはVOCALOIDという名前を、ヤマハ以外の歌声合成ソフトも含めた総称としては使ってほしくないという認識がまだ続いているだろうと思う。
UTAUと初音ミク NT
ニコニコ動画のタグだけの話なら、例外的かつ明示的にVOCALOIDタグをつけていいことになっている(とされる)歌声合成ソフトがある。UTAUとPiaproStudio NTだ。
この二つは、ヤマハの人が「動画にVOCALOIDタグが付いてるのは容認する」的なことを言っていたことがある。
ただ、これも永続的に容認されているかは確かめようがない。たぶん今後も怒られないだろうけど。
総称にふさわしい資質
ここからは私の持論なんだが、いろいろ考えた結果、歌声合成ソフトの総称にふさわしい名前に必要な要素というのが見えてきた。
多い。
一目で「歌声合成ソフトの総称だ」と分かる
当たり前っちゃ当たり前。ぱっと見て分からないならそもそも名詞としての性能が悪い。
商標じゃない
これが一番大事。VOCALOID/ボカロを総称に使えない最大の理由の一つ。商標を使えば常に同じ問題がまとわりついてくる。
人間との分離
歌う機械である以上、人間じゃないアピールをしないといけない。厳密に言うと機械であることを明示しないといけない。
歌うVTuberとの分離
VTuber文化の登場以降、「バーチャルシンガー」「VSinger」の意味するところが大きく変化してしまった。それまでは「歌声合成ソフトキャラの総称っぽいワード」「中国VOCALOIDシリーズの名前」だったものが、最近では歌うVTuberを指すワードになってきた。
歌声合成ソフトと歌うVTuberはさすがにモノが違いすぎるので明確に分離したい。
ソフトとハードの分離
歌声を合成できるシステムには、大きく分けてソフトウェアとハードウェアがある。歌声合成ソフトの総称を考えている中で、実は「ポケみくやVOCALOID Keybordは……?」という声をそこそこ聴いて、確かにハードウェアのことも考えた方がよさそうだなと思うようになった。
文化圏が違うのでソフトもハードもひとまとめにするのは不正解。必要に応じてソフトウェアのみ、ハードウェアのみ、両方を指すワードがあるとベスト。
TTSとの分離
文字情報を音声に変換するTTSと、文字と楽譜から歌声を合成する歌声合成ソフトは別物。上位カテゴリー「音声合成ソフト」でくくれば同じ所に入る。
ただし、異端児「歌うボイスロイド」の扱いをどうすれば良いのか、明確な答えはまだない。
キャラクター性の扱いが上手
キャラクターの有無を正確に記述できているかどうか。例えば、クリプトンが使っている「バーチャルシンガー」「キャラクター・ボーカル」あたりの名前には明らかにキャラクター性が表れている。
「歌声が鳴る箱みたいな無機質なオブジェクト」があったとして、それを「歌手/シンガー」と呼ぶ人はあまりいないだろう。逆に「シンガー」と聞いてそういうオブジェクトを思い浮かべる人もたぶんいない。せいぜい「シンギングボックス」だろう。
現在の「ボカロ文化」はキャラクターの有無が重要な一つの指標になっているはずなので、ここは明確にできた方がよさそうだ。
ちなみに、キャラクター性は別にどうでもいいかなという場合は「歌声合成ソフト」が一番正確。
覚えやすく、いいやすく、省略しやすく、マイナスイメージがない
必須要件ではないが、総称というからには人口に膾炙しないといけない。VOCALOID/ボカロはこの点において他の追随を許さない。ダサい名前や覚えにくい名前は、例え的を射ていても絶対に使われない。
マイナスイメージがないのも使われやすさの一因になる。例えば「ボーカルスレイブ」なんて名前付けたときには炎上しても文句言えない。
気を付けるべき類義語
以下のワードたちは似ているが全く別のものを指すので注意が必要だ。
音声合成/歌声合成
歌声合成はざっくり「歌声を合成すること」でよしとして、音声合成は「歌声も話声も含む音声を合成すること」や「TTS」(文字情報を音声に変換すること)を指すワード。後者は若干誤用感あるが、結構多くの人が使っている印象。
音声合成/合成音声
音声合成は「音声を合成すること」(コト)で、合成音声は「合成された音声」(モノ)なので本当に全く別物。
歌声合成/歌声合成ソフト
歌声合成は「歌声を合成すること」(コト)や「歌声合成技術の略」「歌声合成ソフトの略」として使われることもある。歌声合成ソフトは「歌声を合成するソフトウェア」のみを指す。
総称としてよく使われるパーツ
歌声合成ソフトの総称はいろんな人がいろいろ考えている。中でも以下のパーツよく使われている。
ボーカル
「歌声」や「歌手」を示すパーツ。
ボイス
「声」を示すパーツ。歌声だけでなく、話声やボイスパーカッションのような非言語音も場合によっては含む。
シンガー/シンギング
「歌手」を示すパーツ。シンギングは「歌う○○」のように形容詞的に使う。
ROID/LOID
機械っぽいニュアンスを演出するパーツ。厳密には「-oid」で、意味は「○○のようなもの」。例えばVOCALOIDは「ボーカル(歌手)のようなもの」。実際にはおそらく「アンドロイド」の後半部分を引っ張ってきたもので、聞く人も「アンドロイド/ロボット/プログラムのような何か」というニュアンスを感じ取るものと思われる。
シンセサイザー
「合成機」もしくは「(楽器の)シンセサイザー」を示すパーツ。ソフトウェアもハードウェアも含む。
バーチャル/V
仮想の/電子的なといったニュアンスを演出するパーツ。厳密には「現実味はあるが現実とは違うもの」。