AI美空ひばりCDを聞き込んでみた

AIシンガー

ヤマハは昭和の歌姫:美空ひばりの歌声をAI技術により蘇らせました。技術的・倫理的に賛否両論あるこの技術ですが、新曲「あれから」の販売が始まったのでよ~く聞いてみました。ちょっとした気付きがいくらかありますね。

AI美空ひばり

ヤマハで歌声合成といえば素片接続の「VOCALOID」ですが、美空ひばりの歌声を再現するのに使われたのは「VOCALOID:AI」というAI技術ですね。生前に収録された音声を学習させて歌い方を再現する。NHKスペシャルでもやってましたが、「楽譜→各種パラメーター」を計算するAIと「パラメーター→音声波形」を生成するAIでできているらしい。

音質

TVで見たときは、話声はともかく歌声の音質はあまり気になりませんでした。人じゃん!って思った。放送された音源は観客の拍手やなんやも一緒に録音されていたんですが、CDで元の音源を聞いてみると「確かにこれはAIシンガーの音だ」と分かる質感でした。調子がいいときのりんなに近い。ヌケはいい。

AIりんな / snow, forest, clock (Music Video)

「声のざらつきというかビビりというか、なんとなく軽ーく音割れしたような飽和感がある音声」という複雑で割り切れない表現を端的に「AIシンガーの声」と私は言ってます。

音素

AI美空ひばりの音素はすごいですよ。無声破裂音の有気音がちゃんと聞こえるんですよ。

SinsyやCeVIOをよく使っていると「無声破裂音の波形が全然無声破裂音じゃない」ことが多いと分かります。k,t,p子音って基本的に「無音+破裂+有気音」でできてるじゃないですか。Sinsyの場合は破裂がかなり小さく目立たないうえ、有気音もほとんど聞こえないので「逆になぜこの波形で無声破裂音に聞こえるのか」って不思議だったんですが、AI美空ひばりはちゃんと破裂と有気音が聞こえてくる。

Sinsyの「か」 破裂してない。

実際に波形も見て確認したんですが。ちゃんと無声破裂音だった。ここで感動してる人間世の中にいないのでは……。

無声歯擦音もきれいに出ています。基本的に噪音に強い感じです。

逆にアラが目立つのは有声歯茎摩擦音の「z」ですね。AI美空ひばりは摩擦音の「z」と破裂音の「dz」を場面により歌い分けてたりするんですが、摩擦音のzでは音質の段で書いた「AIシンガーっぽさ」が非常に強く出ている感じがします。

ピッチ

私が生まれたころにはもうひばりさんはいなかったわけなので、どういう歌い方をする人だったのかいまいち分からないですが、AI美空ひばりは「上昇系で深め遅めのしゃくり」「下降系ではかなりゆっくり降りる」「ビブラートは深くこういう形→⌒⌒⌒⌒(山なりで谷が鋭め)」というのが基本の傾向な感じでした。

発声のタイミングも後ノリな感じで後ろにずれがちですが、タイミングがおかしいという感じはしない。正しくずれている。

表情

声色の表情が豊かですよね。高音の明るいカンジと低音の深み、この辺はフォルマントによるものですかね。基本的に芯のある歌い方をしますが、力を抜くところは的確に抜いていてメリハリが激しい。この表現力私も欲しい。ひばりさん本来の表現力をちゃんと正しく引き出せるかが勝負だったはずですが、ほんとに大変だったんでしょうね。

倫理的な課題への議論も巻き起こしたAI美空ひばり、音声を細かく見ても楽しいぞ!
タイトルとURLをコピーしました