2023年1月5日木曜日

Synthesizer V AI「Mai」が凄い ~自立型ボーカロイドへの道:その6~

昨年の11月に発表された歌声合成ソフト「シンセサイザー V」の最新バージョンが、話題になっている。YouTube上にも、音声データ「Mai」に歌わせた動画が投稿されていて、それなりに盛り上がっているようだ。

昨年の10月には、同じくAI技術を搭載したボーカロイドの最新バージョン「VOCALOID6」も発表されたのだが、インパクトの大きさはシンセサイザーVの方が、はるかに勝っていると云って良いだろう。

SynthVは、上海出身の天才プログラマー「Kanru Hua(華侃如)」氏によって開発された歌声合成ソフトである。ウィキペディアの記述には、

”従来のサンプルベース歌声合成と、 DPM(拡散確率モデル)を取り込んだ人工知能による歌声合成のハイブリッド手法によるエンジンを搭載。これにより、サンプルベースのエンジンにはない自然さと、人工知能を使用しているがユーザーの介入が制限されているシンセサイザーにはない高度な制御性を両立している。”

とあった。これは期待できる。古来より、世紀の大発明というモノは、大規模なプロジェクトでなく、1人の天才によってもたらされることが多いからだ。

SynthVの最大の特徴は、AI技術による人間そっくりの歌声にある。VOCALOID6もAI機能を持っているのだが、その効果は抑え気味で、調教の入る余地を(あえて)残しているとあった。確かに、人間そっくりに歌う初音ミクなんて、逆に気持ち悪いし、調教あってのボーカロイドということなのだろう。

一方、SynthVは、ベタ打ちの完成度が極めて高く、調教の余地はほとんど無いと云われている。では、早速、視聴させていただこう。まずは、YOASOBIの「夜に駆ける」で如何だろう。      


 SynthV がヲタクに注目されている理由の1つに、最新バージョンに添付されている音声データ「AI Mai」の声質がある。この子に歌って欲しい、歌わせたいと思わせるものが彼女にはあるのだ。云い方を変えれば、Maiちゃんの歌声はヲタク好みということである。

宇多田ヒカルさんの「First Love」である。AI+調教で作られた歌声を視聴させていただこう。

初音ミクは、そのキャラクターがビジュアル的にも歌声としても確立していた。ボーカロイドがブームになった重要な要素である。つまり、初音ミクは初音ミクであり、滑舌の改良に工夫はしても、人間の歌声に寄せたり、声質に手を加える必要はなかった。

Synth Vでは、ボーカルスタイル機能を使うことにより、同じMaiでも、声質の雰囲気を大きく変えることができるそうだ。こちらは、松田聖子ちゃんのカバー作品だが、かなり聖子ちゃんが入っている。ここまでくると、コンピュータに歌わせているという感覚は、ほとんど無いと云っていいだろう。

さらに、SynthVには、充実した「AIリテイク機能」があるそうだ。これは歌の一部を指定して歌い直しをさせる機能で、「もっと感情的に」などのアバウトな指示をすれば、AIが判断して表現を変えてくるというものだ。具体的な指示を与えずに演者にダメ出しを続ける意地悪な演出家のように、何回もテキトーに歌わせて、その中からしっくりきたテイクを採用すれば良いとのことである。

SPEEDの「White Love」である。この歌、フルコーラスで聴いたの初めてだと思う。        


SynthV AI Maiの実力は恐るべしである。人間そっくりに歌うということに関しては、かなり現実的になってきたと思う。


今回は、SynthVを褒めまくったが、このことはVOCALOIDの敗北を意味しない。上海出身のKanru Hua氏が日本で起業したのは、ボカロ文化が日本で定着しているからであり、そのボカロ文化は、VOCALOIDによって培われたものだからだ。

とは云え、VOCALOIDによって発展してきた歌声合成は、SynthVの登場で大きな分岐点を迎えたのは確かである。今後、歌声合成は、演奏的なボーカロイド系と、歌唱的なSynth V系の二極化が進んでいくように思う。

目指すべき、自立型ボーカロイドの次の段階は、歌詞を理解し歌唱に反映させることであるが、歌声合成に関するAIの可能性には期待しかない。

0 件のコメント: