先日NEUTRINOというとんでもないものが公開されました。
これに伴いAIきりたんが歌う動画がニコニコなどに投下されていますが、正直興奮冷めやらぬ状態です。
AIきりたんとは
すさまじいクオリティ、プリパラの真中らぁらちゃんが歌っているのと変わらない・・・。今までの合成音声の域を越えています。これはNEUTRINOというフリーソフトを用いて製作されています。
そのNEUTRINOの中に東北きりたんのプリセットデータが入っており、それで上記の動画を制作されているわけですね。
NEUTRINO製作者のSHACHIさん(@SHACHI_KRTN)のツイート
AIきりたんの何がすごいのか
すごい点は2点あります。
ディープラーニングを利用した事、それらをフリーで使えるように環境を整備された方たちの努力
一つはクオリティが高いのはアウトプットされたものを聞けばすぐにわかりますが、今までのボーカロイド・合成音声ソフトと違い、ディープラーニングを用いているところにあります。
ちなみにディープラーニングには基本となるデータが必要不可欠なのですが、そちらは東北きりたんこと中の人 茜屋日海夏さんがi☆Risの曲を50曲ほど歌いそれらをデータ化。基礎データベースとして利用しているようです。どおりでらぁらちゃんっぽいわけです。
またこれらをフリーで使えるような法律・またデータを提供している方たちがいて成り立つ技術なのでありがたいですね。こと機械学習の分野は日本は遅れをとっているようなイメージがありますが、けしてそんなことはないのです。
クオリティを担保しやすくなった
ボーカロイドは出た当時でも画期的な技術でしたが、そのままデータを入力しただけではいかにも合成音声感が残り、自然な歌声には聞こえませんでした。
そんなボーカロイドですがMitchie M( @_MitchieM )さんによるイージーデンスというクオリティの楽曲が提供されたあたりで少し様相が変わってきます。
ただし、このレベルに至るまではそうとう根気強く調整(調声)をすることが必要で、ボーカロイドから出力されたデータを切り張りしてさらに人間らしく聞こえるような編集をされているようです(私は門外漢なのでもしかしたら厳密にはちがうのかもしれませんが、一般人がすぐに真似できる領域ではないのは確か)
NEUTRINOの凄いところは Mitchie Mさんのような卓越した技術、完成イメージに近づけるすさまじい根気がなくてもそこそこのレベルで聴けるものが制作できるという事にあると思います。もちろん技術がある方はさらに自然に聴こえるものをより短時間で作れるようになります。
AI技術の進歩はすごいですね・・・。
なによりこれらのものはフリーで利用できるので、これからきりたんが歌う曲が増えてくるのではないかとワクワクしています。茜谷さんのファンとしてもうれしい限り。
実際にこれらの技術をつかって制作してみたいかたは、上記の動画を投稿されたくろ州さんの記事が参考になるかと思います。ぜひ見てくださいね!
AIシンガーがとうとう我が手に……!! 新歌声合成ソフト「NEUTRINO」を使い倒した https://km4osm.com/neutrino-toujou/

VOICEROID+ 東北きりたん EX