私のAIきりたん動画コメント全チェック

AIシンガー

私が投稿したAIきりたん動画、結構見られてとてもうれしいので、調子乗ってコメントを全見読みました。

面白そうなモノやツッコミどころがあるものにこたえていきます。超長いので気を付けて

  1. AIきりたんの豹変っぷりに驚くウナ【カラオケにやってきたウナきり】
    1. ちょっと〜曲も声のバランス調整忘れてんよ〜ヌシ〜
    2. 歌を邪魔しないよう静かに騒ぐ名人芸
    3. 一人称がウナじゃなくなってるあたり細かい
    4. 小学生が二人っきりでカラオケなんかに来ちゃ……ダメだろ !(クソリプ)
    5. 中森明菜みたいな?
    6. ウナちゃんにはウナちゃんにしか出来ないことあるじゃん?
    7. ウナちゃんもAIシンガー化しよう(提案)
    8. 今度はデュエットしてくれw
    9. promise(ゲッタン)歌ってほしいなぁ……
    10. ウナちゃんも出始めの時歌上手いって話題だったやん…
  2. AIきりたんに高速歌唱マウントをとるミクパイセン
    1. ボカロだからできる表現、ニュートリノだからできる表現、その上でなにさせたいか考えるの楽しいやろな ・勝つ負けるの話ではないとは思う
    2. 人間に寄せたがための功罪/人間に近づいた代償
    3. 小学生が早口言葉苦手なのは当たり前だろ !
    4. またこいつ新人潰ししてるよ
    5. でもミク先輩って結局何言ってるのか昔から全然分からない…
    6. 息継ぎの概念がある歌唱ソフトだからねぇw
    7. 噛みまくってるように聞こえてこれはこれで良いな
    8. 人外であるミク音源は「人」の歌じゃないから再現できんのだ
    9. 万能ツールではないんだな
    10. こんなひどくなるのか
    11. UTAUきりたんだと滑舌はともかく速度はいける?
    12. ええー、じゃぁミクさんて地声でエフェクトとかできるんですかぁー?
    13. 編集でテンポ加速してあげろよwwww意地悪か ! !
    14. ちなみに消失は人間でも歌える
    15. 進化の弊害の例としてめちゃくちゃ参考になる
  3. ブルーバード
    1. 悟りかんが半端なくてここホント好き
    2. すごいけど、この技術はAIじゃないんだが・・・
    3. めっちゃあるあるの外し方しててビビる
    4. 完全に肉声やんけ !
    5. 装飾音やしゃくりは調整とかオペレーションか
    6. あれ、素でもしゃくりがある?
    7. 調声無しの方が、素人っぽくてむしろ人間っぽく聞こえる気も 調整やオペレーションが無くなると逆にどんどん人間っぽくなるな
    8. これもう人間の歌手が要らない時代が来てしまうのでは 近い将来なくなる職業に歌手が急激ランクインやな
    9. フラットになるね
    10. 抑揚というか声の伸びというか、すさまじい
    11. 俺より上手いんだが
    12. 無調整のとこロングトーンがマジ中の人っぽい
    13. すごいけどきりたんの声じゃない
    14. きりたんの声じゃないニキはずんだホライずん100万回見ろ
    15. みんながドリ音Pになれる時代
    16. CeVIOっぽい/ささらっぽい/ONEっぽい
    17. 肉声にエフェクトかけたみたい 加工した歌い手って言われても信じる
    18. 人間のPがボカロを非人間的にする一方でAIが人間に最も近づいたとはなあ・・・
    19. 空の「ら」の部分すごいスムーズすぎて人間やんけ
    20. カラオケのガイドボーカルとか充分に務まりそう
    21. 確かCevio作ってる所の次期エンジンもこんな感じになってたな
    22. 俺絶対長生きしてアンドロイド美少女に平沢歌わせる事を決心したわ…
    23. 錆のハーモニすこ ここのハモり男に聞こえる
    24. ハモり男声でつられてきた
    25. ありあり版のフルも聴きたい
    26. 何がすごいって亡くなった人の新曲出せることだよな。
    27. ここまで凄まじいとジャスラックが動きそうだな。
    28. ボーカルドール/らぁら/プリズムボイス
    29. これよりすごい人力調教はいくらでもあるけどこれは「数時間で」これを「自動で」作れるのがちょっとやばすぎる 今まで手打ちで何日も何週間も掛けてやっと調整してたのが数時間とはな
    30. 素だと確かに従来より人っぽくはあるけど上手くはないからオペーレーションは最低でも必要かな?
    31. 伸ばすところ一生懸命な感じで良き いってー !の外し方大好き
    32. ボーカロイドが霞む
    33. 色々聞いたけど何だかんだ調声の腕前は如実に出るな
    34. もう中の人いらないな
    35. 本当にすごい AIの恩恵を1番間近に感じる
    36. 息継ぎしている感をもっと加えるとさらに人間っぽさが出そう。
    37. 確か、去年の紅白で美空ひばりの合成で曲歌わせてたな
    38. ニコニコトップ掲載おめでとうございます
    39. 20年遅く生まれたかった兄貴は初音ミクめっちゃ楽しんだでしょ
    40. ありありは確かに聞きたいけどVer上がってからその時がいいな
    41. いい声だがもう遅いもうちょい早く来てれば人気出てたぞ
    42. これは大御所音楽家が騒ぐ訳だわ…
    43. 不気味の谷現象
    44. UTAUなら調教次第では勝てる()
    45. 曲次第ではかなり音痴になるらしいけどな
    46. これ人間に聞こえるやつは病院行っとけ まだ人に近づけそうな可能性を感じる
    47. そのうちAIが勝手に作詞曲歌唱までやりそう
    48. 無料でこれ使えるとか作者正気か !?
    49. この声で俺の名前呼んでほしい
    50. 20年足らずで電子の歌姫と言える技術が飛躍的に上がる。次の20年間でどうなってるか楽しみな自分がいる。
    51. 逆に人間にしか出せない声ってあるんかな?
    52. 左足草
    53. 無料は良い事だけども、発展するためには何処かと組んで商業化すべきだよ
    54. ねりものがかかり
    55. 外国語歌わせられるかな
    56. ボカロのよさは無機質さにあると思うんだが
    57. 次はAI視聴者だな
    58. 歌うボイスロイドだったと思う。だったらボカロ(ボーカロイド)じゃない。
    59. AIが歌ってAIがコメ打ったら俺らいらないじゃん
  4. キリトリセン
    1. りんなや美空ひばりもこれ?
    2. つまりどういうことなの?産業でお願い
    3. ここまでやって22分………?
    4. 投稿者記事と、NEUTRINO(歌声)大百科にも曲があるので聴こう!(ダイレクトマーケティング)
    5. これでボイロみたいに感情値とか設定出来たらもっと化けそう
    6. お前にもう秋田県は狭いよ
    7. よぉ の「ぉ」の部分がたしかに合成音声
    8. 8250Uってミドルスペックのノートで作れんの !?
    9. これからこれがスタンダードになったら調教が原因で埋もれてた良曲が救われるな
    10. 中の人だけどぎりきりたん成分あるのが良い
    11. ボ↑カ→ロ↓?ボ→カ↑ロ→?どっちですか?
    12. きりたんだからキリトリセンなのか?
    13. 40mpは人間が歌える曲に作ってるから、こうなるととんでもなく人間味しかないな
    14. ④だけ理解できた
    15. 去年の学習データセットに関する著作権法の改正でできるようになったのね
    16. プロの歌手雇ってデータ集めて欲しい
    17. Vtuberを駆逐しろ
    18. アレンジとかもできるんすかねぇ…?
    19. 調整あってもいいんだよ。最終目的は素敵な歌を作る事だ。
    20. 何も知らないで聞かせてAIだって分かる人どれだけいるんだ
    21. 学習データに適した歌い方の人間という需要が生まれたり
    22. ボカロ好き友達に聴かせても人間と間違えてた
    23. 俺の7億倍くらい上手くて草
    24. 技術者の人ありがとう
    25. なろう小説でよくある地球からオーバーテクノロジー持ち込まれた異世界人ってこんな気持ちなんだろうなって
    26. 右枠歌詞じゃなくて草
    27. 振込先を教えてくれ
    28. ボカロじゃなくてボイロにNN噛ませる別アプローチやぞ
    29. 世界よ、これがプリパラだ
    30. 久々にボカロ曲作る気が起きた/ボカロ苦手だけど/ボカロ久々に聞いたけど
    31. ボーカロイドも、CeVIOもゴミと化したww
    32. これふと付けた車のFMラジオで流れても多分AIボイスだと気づく自信無いわ俺
    33. AI美空ひばりとか少し懐疑的だったのにきりたんのお陰で少し前向きになれそう、いや凄いわ
    34. お前ら新しいおもちゃが手に入って良かったねえ
    35. 4AーGの高回転域の音並みに美しい
    36. 12GBって変則的だな オンボ4GBに8GBメモリ増設したんでしょ
    37. いよいよボカロ調教師の出番がなくなる
    38. あえて水を刺すようなことを言うと、P毎の個性とか多様性とか、そんな側面では難がありそう。

AIきりたんの豹変っぷりに驚くウナ【カラオケにやってきたウナきり】

ちょっと〜曲も声のバランス調整忘れてんよ〜ヌシ〜

調整した結果がこのざまです。

歌を邪魔しないよう静かに騒ぐ名人芸

実はウナトーク持ってないので……。

一人称がウナじゃなくなってるあたり細かい

純粋に表記ゆれだったけどその解釈はアリなので採用する。ちなみに、直前で「きりたん」って呼んでるのもゆれ。

小学生が二人っきりでカラオケなんかに来ちゃ……ダメだろ !(クソリプ)

ダメだぞ!

中森明菜みたいな?

(デビュー当時)幼めの顔で、低く挑発的な声が良いですよね。しゃべりより歌のほうが圧倒的にパワーがある? ただ、私1996生まれなので分析できるほどその世代に生きてなかった。

ウナちゃんにはウナちゃんにしか出来ないことあるじゃん?

VOCALOID音街ウナの使いやすさは異常。同じシーケンスでも上手に歌ってくれる。

ウナちゃんもAIシンガー化しよう(提案)

田中あいみさーん?

今度はデュエットしてくれw

準備中。

promise(ゲッタン)歌ってほしいなぁ……

あぁーちょっと苦手そう。歌えると思うけど。それはそうと、フリーソフトだから使ってみてほしいな。

ウナちゃんも出始めの時歌上手いって話題だったやん…

あれは衝撃だった。ミクV4X発売の1か月前だから、買い控えが起きるかもとか思ってたんだけど、全然そんなことなかった。ポテンシャルの高さが強い。

AIきりたんに高速歌唱マウントをとるミクパイセン

ボカロだからできる表現、ニュートリノだからできる表現、その上でなにさせたいか考えるの楽しいやろな ・勝つ負けるの話ではないとは思う

ミクにはミクのエモさ、AIきりたんにはAIきりたんのエモさがある。それぞれが刺さる人には刺さるんだ。得意不得意は適材適所で対応しよう。

人間に寄せたがための功罪/人間に近づいた代償

仕事で使おうとすると確かに罪というか面倒なところでもある。私は高速歌唱できないのエモいと思う。

小学生が早口言葉苦手なのは当たり前だろ !

な!

またこいつ新人潰ししてるよ

AIきりたんを意図的に潰すネタをやるという私の戦略は当たりだったようだ。

でもミク先輩って結局何言ってるのか昔から全然分からない…

耳慣れが必要ですね。私は人間の歌も何言ってるか分からないのでよくわかりません。

息継ぎの概念がある歌唱ソフトだからねぇw

AIきりたんの息継ぎ概念良いよね。

噛みまくってるように聞こえてこれはこれで良いな

「噛みまくってる感」が思ったよりうまく出て来たので、個人的にも結構満足いく出来。

人外であるミク音源は「人」の歌じゃないから再現できんのだ

肉体というデバイスの制限から解放された初音ミク。その概念が初音ミクをここまで成長させてきたとも言えそう。

万能ツールではないんだな

たいていのものはそう。

こんなひどくなるのか

なる。実は工夫すれば普通に歌える。ベタ打ちだとこうなる。

UTAUきりたんだと滑舌はともかく速度はいける?

行ける。

ええー、じゃぁミクさんて地声でエフェクトとかできるんですかぁー?

煽りよる。ミクを使うとわかるけど、「いじらない状態でミクっぽい」ってあると思う。なんか私がヘタに触るとだんだん「ミクじゃなくなってきたな……」ってなることあるから、あれはあれでベタ打ちでの完成度が非常に高いと思う。

編集でテンポ加速してあげろよwwww意地悪か ! !

それやったらおもんないだろ!

ちなみに消失は人間でも歌える

弟の姉さんとかね。懐かしい。ピアノ弾きながらっていうのがわけわからんポイント。

進化の弊害の例としてめちゃくちゃ参考になる

「できなくなった」という点で「進化」と呼ぶかどうかは学問によると思うけど、これがなかなか面白くて、機械化や自動化で人間離れが進むというSFよくあるけど、AIって結構人間っぽいとこあるなって思う。AIと一般人が1対1で触れ合う機会ってたぶんあんまりないんだけど、AIきりたんを使う中で、AIそのものへの理解も深まる感じがして面白い。

ブルーバード

悟りかんが半端なくてここホント好き

小学生女児こんな歌うまいか?

すごいけど、この技術はAIじゃないんだが・・・

「AI」の定義が定まり切ってないので、私も割と困っている。AIって最近騒がれている感があるけど、「第1次AIブーム」って1950年代ごろなんですよね。今一般によく言われるAIとは明らかに意味が違う。最近だと「機械学習と深層学習」あたりをAIと言いがちだけど、「問題を解く機械」まで広げるとたいていのものがAIと言えてしまう。超偉い学者が誰もが納得いくAIの定義を早めに提唱してくれないかな?

めっちゃあるあるの外し方しててビビる

それなー。低音を上に外しやすいのがAIきりたんの特徴かなーと思っている。

完全に肉声やんけ !

多分、ボカロ耳じゃない人からすると「かなりリアルだが人間でないことはわかる」くらいだと私は思っている。

装飾音やしゃくりは調整とかオペレーションか

装飾音はオペレーション(楽譜)で、しゃくりは調声です。今回の動画で「オペ―レーションなし」と言っている場合は、「1ノート1モーラ」「1ノート1シラブル」で打ち込んでいます。「2ノート1モーラ」や「1ノート2シラブル」はないはずです。

あれ、素でもしゃくりがある?

ある。調声もオペレーションもなしでしゃくりはある。ビブラートはそんなにない。

調声無しの方が、素人っぽくてむしろ人間っぽく聞こえる気も 調整やオペレーションが無くなると逆にどんどん人間っぽくなるな

今回の調声は私の脳内DBから引き出した「普段のボカロ調声」テクで作っているので、調声によってボカロっぽくなった部分はある。

これもう人間の歌手が要らない時代が来てしまうのでは 近い将来なくなる職業に歌手が急激ランクインやな

例えば、あなたが曲を作っているとして「AIきりたんと茜屋さんどっちも呼べるけどどっちがいい?」って言われたらどうする? 私はノータイムで茜屋さんを選ぶ。多少値が張ってもそれだけさまざまな価値があると思う。

フラットになるね

なる。前半は結構しゃくりとビブラートを追加したので。

抑揚というか声の伸びというか、すさまじい

波形で見るとわかるけど、低音は小さく、高音は大きく歌うところがある。一般的な歌はサビが高音寄りなので、サビの音量が大きくなりがち。これがAIきりたんにもちゃんとある。音量差は大きすぎず小さすぎずでちょうどよかった印象。

俺より上手いんだが

私よりもうまい。

無調整のとこロングトーンがマジ中の人っぽい

最近のアイドル声優が歌うアニソン、MIXでそうしてるのかわからないけどロングトーンであんまりビブラートしてない印象ある。なんでだろう。調声した前半にはビブラートをかけたので、たぶんこの感覚は正しい。

すごいけどきりたんの声じゃない

中の人感が強い。少なくともVOICEROIDきりたんとはだいぶ違う声をしている。

きりたんの声じゃないニキはずんだホライずん100万回見ろ

刑が重い。私は25回くらいしか見てないので25回でいいと思う。

みんながドリ音Pになれる時代

人力の人ですね。聞いてみてマジで!? って思った。アイドル声優っぽい曲って楽譜で表現しにくい音が多くて難しいイメージなのに人っぽい。めっちゃ耳いい人なんだろうなぁ。

CeVIOっぽい/ささらっぽい/ONEっぽい

私はCeVIO耳が完全に育っているのでわからないが、もしかしたらそうなのかも。いろんな人の分析によればスペクトルやピッチの動き方、子音、息成分には大きな違いがあるので、たぶん明らかに違うんだけど、人間はそれ以外にも「何か」を聞いているのかも。こえぇ。何が聞こえてるんですか? それ聞こえてもいい奴ですか?

肉声にエフェクトかけたみたい 加工した歌い手って言われても信じる

ここでいう「エフェクト」はたぶん「ピッチ編集」かと思う。ピッチ編集による音質劣化は今回低めに抑えたけど、ばれるときはバレる。商業テクが欲しい。ピッチ遷移が若干急というのもあるかもしれない。それはAIきりたんというよりは私の調声癖。

人間のPがボカロを非人間的にする一方でAIが人間に最も近づいたとはなあ・・・

さんざん言われている通り、VOCALOIDの非人間的アプローチは黎明期から今に至るまでVOCALOIDを構成する大きな要素の一つであり、音楽表現としてものすごくアリ。当初は「非人間的初音ミク」が目立っていた感じがあるが、最近では「非人間的vflower」もかなりよく見る気がする。今の流行りはこの2大巨塔なイメージ。

空の「ら」の部分すごいスムーズすぎて人間やんけ

AIきりたんの「ら」は結構使いやすい。日本人の「ら」は特殊で、VOCALOIDでも使われるX-SAMPA表記だと「4a」だとされている。この子音、めっちゃ短くて引き延ばしに弱いんだけど、AIきりたんの「ら」は「l」寄りなんだな。今時の歌手って感じ。引き延ばしに強いので重宝する。

カラオケのガイドボーカルとか充分に務まりそう

カラオケのガイドボーカルには、CeVIOのカラーボイスシリーズが採用されているらしい。要するにすでに務まっている。

確かCevio作ってる所の次期エンジンもこんな感じになってたな

あれはいいものだ……。好き。早めに出てきてほしい。

俺絶対長生きしてアンドロイド美少女に平沢歌わせる事を決心したわ…

長生きしても来ないときは来ないので自分で作るのだよ。

錆のハーモニすこ ここのハモり男に聞こえる

サビの低音男声はSinsyのm01083jで、私結構好きなんですが、やはり圧倒的知名度のNASA。Sinsyを崇めよ。

ハモり男声でつられてきた

マニアックさんめ。

ありあり版のフルも聴きたい

残念ながら予定ないです。

何がすごいって亡くなった人の新曲出せることだよな。

この技術ではないが、亡くなった人の新曲は出せるという事例がAI美空ひばりで十分に示された。あれはあれで賛否両論あるけど、ニーズ自体はあるんだなと実感する。

ここまで凄まじいとジャスラックが動きそうだな。

今話題になっているのはJASRACというより「発声権」のデジタルボイスパレットですね。私にはちょっと難しいので各自調べてください。なお、今回のブルーバードカバーについてはちゃんと手続きを踏んでやってます。

ボーカルドール/らぁら/プリズムボイス

みんなぷりぱら好きね。中の人関連なので、VOICEROIDよりは声が近いし、調声云々へのしがらみもそんなにないので、結構手放しでほめてくれがち。ただ、たぶん「AIらぁら」として出てきてたら「声が違う」ってなったんだろう。

これよりすごい人力調教はいくらでもあるけどこれは「数時間で」これを「自動で」作れるのがちょっとやばすぎる 今まで手打ちで何日も何週間も掛けてやっと調整してたのが数時間とはな

ミッチーさんとかタカオカミズキさんとか清水寺さんとかもうわけわからんよね。AIやRPA(業務自動化システム)のよくある使い方は効率化。人間がやる作業を機械に任せている間に、人間はもっと有意義なことに時間をさけるというのがAI活用の基本かなと思う。人間っぽくする作業はAIに任せて、人間はそれを魅力的に仕上げる作業に注力すれば、調声時間が同じでもよりクオリティーが上げられそう。
ちなみに「人間らしさの再現」はある程度自動でやってくれるが、「歌としての完成度」は自分で上げないといけないので注意。

素だと確かに従来より人っぽくはあるけど上手くはないからオペーレーションは最低でも必要かな?

曲との相性がべらぼうに高ければオペレーションもいらない。普通は要る。ブラッシュアップしようと思うとオプションとしての調声があったほうがいいかなというくらい。

伸ばすところ一生懸命な感じで良き いってー !の外し方大好き

私も。

ボーカロイドが霞む

いいものを上げるのに他を下げるのは幸せではない。NEUTRINOが素晴らしいのはNEUTRINOが素晴らしいだけであって、VOCALOIDや人間が素晴らしくないのではないのでその辺ご理解ください。

色々聞いたけど何だかんだ調声の腕前は如実に出るな

なんだかんだある。超うまい人の調声は「私にはできねぇわ」ってなったもん。

もう中の人いらないな

中の人がいないとAI作れないぞ。

本当にすごい AIの恩恵を1番間近に感じる

AIきりたんは、技術者以外から見たときにかなり分かりやすいAIです。社会の役に立っている度合いではもちろんウイルス除去AIや医療診断AIなどのほうが圧倒的だが、「目で見て手で触って体験できるAI」はそれはそれで貴重だなといった感じ。

息継ぎしている感をもっと加えるとさらに人間っぽさが出そう。

息継ぎしてるんですよね。私が聞こえるようにMIXしなかっただけで。音楽的に必要なブレスは聞かせるべきだった。

確か、去年の紅白で美空ひばりの合成で曲歌わせてたな

技術は好きだけど、あれを何回も何回も見せて、曲を売ってっていうのはなんか違う感ある。

ニコニコトップ掲載おめでとうございます

「ボカロ界の革命」だって。正直めっちゃ調子乗った。

20年遅く生まれたかった兄貴は初音ミクめっちゃ楽しんだでしょ

初音ミクの登場は13年前なので、同じ年度に生まれた子どもたちは20年度に中学生になります。世の小学生以下はみんな初音ミクより後に生まれたとか衝撃が過ぎる。私は逆に10年早く生まれたかったかも。

ありありは確かに聞きたいけどVer上がってからその時がいいな

3月中にNN Vocoder版をリリースするかもという話ですね。結構難産の予感らしい。

いい声だがもう遅いもうちょい早く来てれば人気出てたぞ

とりあえず人気出たので良し。

これは大御所音楽家が騒ぐ訳だわ…

超びっくりした。

不気味の谷現象

不気味の谷を越えた人と谷に落ちた人がいるっぽい。私は音声合成の不気味の谷がどこらへんかわかってないので、いつの間にか超えたのかもしれないし、まだ来てないのかもしれない。

UTAUなら調教次第では勝てる()

UTAUの神調教はガチ。絶対悪魔に魂売ってる。

曲次第ではかなり音痴になるらしいけどな

きりたんはわがままだからなぁ。

これ人間に聞こえるやつは病院行っとけ まだ人に近づけそうな可能性を感じる

病院に行ったらなんで来たの?って言われる。というのはネタとして、まだ人間に近づけるはずなのは確か。

そのうちAIが勝手に作詞曲歌唱までやりそう

作詞AIや作曲AIはすでにあったはずなので、コラボしてほしい。

無料でこれ使えるとか作者正気か !?

無料というのも衝撃は大きい。メインの驚きではないがこれも重要なポイント。

この声で俺の名前呼んでほしい

「きりたんが歌う俺の名前.musicxml」を頑張って作るのです。

20年足らずで電子の歌姫と言える技術が飛躍的に上がる。次の20年間でどうなってるか楽しみな自分がいる。

どうなるかな。

逆に人間にしか出せない声ってあるんかな?

気になる。「人間に出せる声ーソフトウェアシンガーが出せる声」の結果ってどうなるんだろう。

左足草

急に左足が気になりだしてたまらない人々。

無料は良い事だけども、発展するためには何処かと組んで商業化すべきだよ

商業化はたぶん他のところがめっちゃやってくれると思うので、これは無料でもいいのかなという感じ。

ねりものがかかり

きりたんぽはねりものじゃないぞ。

外国語歌わせられるかな

使う側の超絶スキルがあればできるけど、AIきりたん自体にその機能はない。

ボカロのよさは無機質さにあると思うんだが

ボカロの良さは無機質さに“も”あると思う。AI云々抜かしても、人間のように歌うソフトウェアシンガー位だってちゃんと魅力はある。無機質さが「ボカロならでは」という部分なのは同意。

次はAI視聴者だな

2016年のVOCACONでそんな話あったね。

歌うボイスロイドだったと思う。だったらボカロ(ボーカロイド)じゃない。

きりたんはVOICEROID/UTAU/NEUTRINO音源として公開されているが、ざっくりいえばボカロでいいという個人的認識。私が推してるのは「ソフトウェアシンガー」。

AIが歌ってAIがコメ打ったら俺らいらないじゃん

ニコ動のコメントって割とテンプレあるから、AI音声認識・画像認識からのテンプレコメント作成AIとかは作れそう。いらないけど面白い。

キリトリセン

りんなや美空ひばりもこれ?

近いっちゃ近いけど、少なくとも別物。

つまりどういうことなの?産業でお願い

無償のAI歌声合成ソフトが登場
無調声でも人間らしく歌う
AIシンガーが一般人でも弄り回せるようになった

ここまでやって22分………?

投稿時間は22分だが、流石に事前にもらって半日かけて作った。というか私のPCでは動画の書き出しに22分以上かかる。

投稿者記事と、NEUTRINO(歌声)大百科にも曲があるので聴こう!(ダイレクトマーケティング)

聞こう! このコメントは私が書いたやつじゃないです。

これでボイロみたいに感情値とか設定出来たらもっと化けそう

できたら楽しいと思う。たぶん歌唱DBにはその設定ないけど。話声での感情モーフィングはそれこそ森勢先生の研究でかなり前からあったけど、歌声ではあんまり聞かないかも。

お前にもう秋田県は狭いよ

秋田さなめんでねぇ(似非東北弁)。

よぉ の「ぉ」の部分がたしかに合成音声

これは私の調声技術不足です。この動画の中で一番合成音声っぽいポイント。他でごまかせてもこの1点で絶対にばれると思う。

8250Uってミドルスペックのノートで作れんの !?

GPUも積んでないぞ。合成時間もあんまり遅くない。

これからこれがスタンダードになったら調教が原因で埋もれてた良曲が救われるな

一定数いるらしい「調声したくない/いらない勢」が使うかもしれないけど、調声したくない勢にとってはオペレーションが面倒かも。

中の人だけどぎりきりたん成分あるのが良い

一瞬「私中の人だけど、きりたん成分があっていいね」by 茜屋さんかと思った。

ボ↑カ→ロ↓?ボ→カ↑ロ→?どっちですか?

私は後者。

きりたんだからキリトリセンなのか?

もともとキリトリセンはずっとやりくて、AIきりたんを受け取ったときに相性よさそうだなと思って歌わせたら超ハマったのでキリトリセンになりました。作ってる途中で「きり」たんの「キリ」トリセンだなって思った。

40mpは人間が歌える曲に作ってるから、こうなるととんでもなく人間味しかないな

40mPさんの曲本当に歌いやすいので好き。

④だけ理解できた

たのしい。

去年の学習データセットに関する著作権法の改正でできるようになったのね

改正著作権法の施行は2018年で、きりたんDBが出たのが2019年。解説はこれ。

今風の曲が研究に使える 「東北きりたん歌唱データベース」公開
AIシンガーの学習に使える楽曲って、詳しいことはよく分からないんですが、著作権切れの古い曲しかないんだそうです。童謡とか。 でも、じゃあ今風の歌を歌うAIシンガー作るにはどうすればいいの? って話ですよね。今回東北ずん子公式さんが公開...

プロの歌手雇ってデータ集めて欲しい

そうやってできたのがAIきりたんです。

Vtuberを駆逐しろ

ジャンル違いです。

アレンジとかもできるんすかねぇ…?

しゃくりとフォール、フレーズ末のピッチ跳ね上げはできるけど、フェイクはできない。学習の仕方によってはできるのかも。AIきりたんはたぶんできない。

調整あってもいいんだよ。最終目的は素敵な歌を作る事だ。

無調声動画にしてもよかったんだけど、それだと「シンプルに技術がすごい」ってだけの動画になってしまう。私が言いたいのは「これ超よくない?」なので、調声して私の思う超良いにいくらか近づけた。なので、キリトリセンは技術動画ではないです。ブルーバードは技術動画です。

何も知らないで聞かせてAIだって分かる人どれだけいるんだ

これ実験しようと思ったら「お前がわくわくして言うんだったら歌声合成だろ」って見破られた。

学習データに適した歌い方の人間という需要が生まれたり

あるかも。

ボカロ好き友達に聴かせても人間と間違えてた

ボカロ耳だからでは?

俺の7億倍くらい上手くて草

もはや声出てなさそう。

技術者の人ありがとう

ありがとうございます。

なろう小説でよくある地球からオーバーテクノロジー持ち込まれた異世界人ってこんな気持ちなんだろうなって

「AIエンジニアの俺が異世界転生したら無双した件」。ガバガバの予感がする。

右枠歌詞じゃなくて草

表示タイミングも合わせたけど歌詞ではない。

振込先を教えてくれ

振り込めません。これ、商品として考えると、V5Editor+ライブラリみたいな値段だったら悩むけど、一般的なVOCALOID音源(平均1.2万くらい?)だったら迷わず払うし、CeVIOくらいだったら「もっと強気の価格設定しなさい」って怒るよね。

ボカロじゃなくてボイロにNN噛ませる別アプローチやぞ

それも違うぞ。

世界よ、これがプリパラだ

AIきりたんです。

久々にボカロ曲作る気が起きた/ボカロ苦手だけど/ボカロ久々に聞いたけど

AIきりたんは何人かのきっかけになっているらしい。

ボーカロイドも、CeVIOもゴミと化したww

私がVOCALOIDもCeVIOもあと30種以上の歌声合成を愛してやまないことは知る由もないのだろう……。

これふと付けた車のFMラジオで流れても多分AIボイスだと気づく自信無いわ俺

その音質なら確かに行けそう。

AI美空ひばりとか少し懐疑的だったのにきりたんのお陰で少し前向きになれそう、いや凄いわ

この認識の違いがどこから来るのかを分析してみるのは面白いと思う。わかりやすく大きな違いは「中の人が存命か否か」だとは思う。AI美空ひばりのときには「本人の意思が云々」という話を見たが、AIきりたんの場合は本人の意思を今聞けるから。でもほんとにそれが違いなのかといわれると、もっとちゃんと考えてみたい。

お前ら新しいおもちゃが手に入って良かったねえ

私はもっと欲しい。具体的にはテクノスピーチさん。

4AーGの高回転域の音並みに美しい

聞いた。知見が足りなかった。

12GBって変則的だな オンボ4GBに8GBメモリ増設したんでしょ

BTOで予算ぎりぎりに組んだらこうなった。

いよいよボカロ調教師の出番がなくなる

Twitterを見ていると、めちゃくちゃ上手に使う人と、エラーに対処できずに諦める人がいることが分かった。エラーに関してはこのブログに書いてあるので見るたびに「ブログ読めや」って思っているけど、とにかく明らかに使う人による差は出てきている。
完璧なライブパフォーマンスができるプロの歌手はいざ知らず、人間の歌だって音を整える作業は必要だし、AIきりたんも自動でしゃくるとはいえ結構控えめなので、積極的な音作りは十分できるしするべきだと私は考えている。

あえて水を刺すようなことを言うと、P毎の個性とか多様性とか、そんな側面では難がありそう。

調声によって個性を出す余地はあるけど、ヘタに出力音声が人間っぽいがために、作品の方向性は似ている感じがある。確かに何百本も「この調子」で動画が出てきたら飽きるかもしれない。

NEUTRINOを「技術」としてとらえると調声しない方向に行きがちだが、それぞれの意図する「表現」を持っている作者の動画を見ると少なからず違いがある。かなり手を加えて完全に自分のものにしている人もいるし、曲のストーリー性とフレージングでオリジナリティーを出している人もいた。独自の調声技術をもってディテールに凝った音声を作る人もいたし、ストレートにこれまでのボカロ曲らしい音を作る人もいた。

この技術はまだ目新しく、それ自体が注目されるフェーズにある。これが一般的なものになったときにはそれ自体への注目が薄れ、アーティストが個性を自由に伸ばして表現できるようになるんじゃないかと思う。

人気なものが出れば多様性が薄くなるのは自明。だって人気=数が多い=マジョリティーができるだもの。AIきりたんがいなくても、世の中にある20以上の歌声合成は私ともう2人しか触ってなかったりするんだから、それはAIきりたんのせいではないと私は思うな。

コメント

  1. Very nice article, totally what I wanted to find.

タイトルとURLをコピーしました