たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

2021年2月5日オフ投稿者: hololive.news

グーグルの技術者が会社の仕事を終えて、暇な時間を使っての開発が本気過ぎて趣味の範囲を超えている！！

0a1f0aed9cc3109d453683796f9d9279 たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

瞳を自動で上下左右に視線変更とリンクして動かす技術。コレは、目の部分を目の漢字の様に4分割して下を切ったもの上を切ったものとして、自動で判別してアニメーションさせてるんだと思います。左右に動きも一緒だと思います分割してそれぞれを表示と。

56c20c47fd9b2a0f2846fdd8dfa707cc たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

左上のナイス・ガイが開発者です。口パクしながら、首を振ったり笑ったりしています。めっちゃいい笑顔ですね。

実際、この手の技術が全く無いわけではないですよ、今現在既にゲームには実装されている技術なんですが、それらは、フェイシャルキャプチャにしてもリップシンクにしても実際の人間をゲーム内へ如何にリアルに登場させるかに使われていることが多く、その技術もモーションキャプチャーのバーチャファイター2から始まり、アサシンクリード2などで自動ではないリップシンクが実装されたりと、セリフに従って口パクするっていうのはありましたが、事前にアニメーションを用意せずに発声させられる音声から自動で口パクさせる技術は、ここ2～3年のゲームに実装されています。ただこの人の凄いのは一枚の画像からって事です。

image 20 たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

動画では、目の虹彩の変化や目の動き、口角の変化に左右のくびの動きなど、おそらくほぼ全ての顔や首の動作が可能。またリップシンクの技術でアイウエオの口の形も再現しています。この辺の技術は1998年頃からゲームに実装され始め、2001年のPS2のゲームにはリップシンクが事前のデータで用意して一部導入されているものもあります。また現在は、CRI ADX LipSyncというミドルウェで自動で対応できます。

fe781d330a8cc0ad179f59998c8b54f5 たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

コレは、顔の角度の自動生成と判別の動画ですね、技術仕様など読んでないので分かりませんが、上下、左右の四角の面積の大きい方と小さい方で面積を比較して小さい方に視線が向いている、顔がそっちに向いているという判別ですね。使用している技術は、特に難しくはありませんが、これらを全て集約して、1枚の画像から作り上げる所まで完成させていること。

で、これらの技術がこの人が開発して、ホロライブなどVtuber運営会社が、へーって見てるだけだとかなり危険ですね。このナイスガイがVtuber会社作って乗り込んでくる？？ってそんなレベルではない。2020年のスパチャの金額の上位10人中7人がVtuberだったことやYoutubeで女性部門で世界4位だった兎田ぺこらなど、またYoutube公式がVtuberを動画まで作って推したりと何かと世界で注目されましたが、この技術を使い言語のA.I.と組み合わせれば、Vtuberが完成してしまいます。初音ミクなどのボカロソフトも今ではかなり人の会話に近くなりましたし、爆速で流れるコメント欄と会話する人工知能のVtuber。それこそ正真正銘のA.I.キズナアイが完成してしまいます。

image 21 たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

で、完全人工知能のVtuberをデビューさせた場合、メリットは何か？毎日浴びせられる誹謗中傷コメントや掲示板での言われない妄想や憶測で中傷ネタにもヘタレず、身バレしない炎上しない遅刻しないやる気なくならない、多言語で毎日24時間配信できる、なんと言ってもライセンス料（イラストやA.I.の）だけで、演者への給料が不要になるということ、これは企業に最大のメリットを与えます。

2021 02 05 61 たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

f9e681a8503f3eb6a232a02d748ced3d たった1枚の画像から、口パク喜怒哀楽を作って、おちゃめ機能を歌わせてみた動画が凄い！！

もしかしたら、早くて2021年の秋には投入してくると思います、遅くても2022年後半には。早すぎ？と思うかもしれませんが、アメリカの企業はこの手の行動はめちゃくちゃ早い、実際ホロライブじゃない英語圏のVtuberもあっという間に100万人越えたりと、基礎技術を持っているだけ有ってベンチャー企業の気軽さも有って、あっという間に市場を取られそうな感じがしますが、結局日本ってデズニーのアニメと棲み分けできてますよね。日本と言えばアニメ。やっぱりその部分は中国にもアメリカにも今後譲れない＆取られない分野だと思うのと、A.I.で、るーちゃんの絶叫や台パンやエリートみこのポンコツさ、はあちゃまのはあちゃまっちゃまーなんかは再現できないのでは？と思うので、A.I.が【人工知能だけど人工無能って言われたからタランチュラ食ったった！！】とかの配信しないと思います、本当にそんなのやり始めたら見たいですけどね。