2018年5月25日金曜日

「超絶凄ワザ!人類vsAI」に見る「初音ミクAI」の可能性

 NHKの「超絶!凄ワザ」。その前にあったフジテレビの「ほこ×たて」とともに、よく見ていました。だんだんネタ切れっぽくなっていって、視聴をスルーするようになったんですけど、最終回がAIに関する放送だったので、これだけは録画しておいたんです。

 番組は、AIが人間に挑戦する3本勝負ということで、ファッションコーディネートとか、流しのタクシーを取り上げていて、面白く視聴させていただきました。

 そして、3番目の対決が「俳句」でした。
 で、そこで紹介されていたAIに俳句を作らせる過程が、以前(2018年1月26日)に取り上げさせていただいた、人工知能搭載型ボーカロイド「初音ミクAI」による歌唱という課題と多くの共通点を持っているのではないかと。つまり、俳句と歌唱は、文字と音声という違いはあるものの、ともに人の心に訴える芸術分野ですから、AIに俳句を作らせる手順は「初音ミクAI」にも取り入れられるのではないか、と考えたんです。

 AIに俳句を作らせる手法について、番組で紹介されていたことは、次のようなものでした。
 まず、既存の6万首におよぶ俳句をデータとしてAIに入力し、次に、「切れ字」や「季語」などのルールを教えます。そして、AIに作らせた俳句を、人間が5段階で評価することによって、どのような俳句を作れば評価してもらえるのかをAIが学び、その後は、AIが作った俳句をAIが自己評価して、強化学習をするという手法だったと思います。

 これを「初音ミクAI」に当てはめると、既存の歌唱データと音楽理論の入力、ボーカロイド歌唱の人間による評価、そして、AIによる自己評価という流れになります。

 歌唱の評価については、今まで漠然と、1曲丸ごと評価するようなイメージを持っていたのですが、
楽曲は、フレーズの集合体と考えれば、フレーズごとに歌唱の評価をすれば良いのだと気づきました。
 学習の手順としては、まずはAIにワンフレーズ歌わせて、それに対して複数の人間が、「憂い」を感じたとか「切なさ」が伝わったというように評価を与えていきます。これが蓄積されていくことによって「憂い」を表現するには、どのような歌唱が好ましいかをAIが学んでいくようにします。
 そして、このような歌詞で、この曲調なら、こんなふうに歌唱すれば良いと、フレーズごとに得られた評価をデータベース化し、新たな楽曲を歌うときには、蓄積されたデータを対応させ、最終的に1曲を通したときに破綻が無いように微修正させれば良いわけです。

 で、俳句対決の方ですが、結果はAIの惨敗に終わりましたw

 講評の場で語られていたのは、人間の発想力の凄さでした。これについては、俳人さんがAIとの対決を意識してか、発想を飛ばした句を意図的に出してきた一方で、AIは、基本に忠実な正統的な作品を出してきたことによるものだと思います。

 番組に登場した「札幌AIラボ」の「AI 一茶くん」は、お題の写真から俳句を詠むために、どんな俳句がどんな写真にマッチするのかを、人間が手作業で教えたそうで、そのために、ネットで広くボランティアを呼びかけ、数十万というデータを収集したとありました。
 人類の集合知を教えたわけですが、知見というものは、データ数が多くなればなるほど平均化していきますし、最初に正統的な作品を高評価するように教えているのですから、この手法では、奇抜な発想は発現し難くなると思います。

 しかしながら、人間がAIに期待しているのが「人間の代わりに人間と同じように働くこと」であれば、あまり奇抜で冒険的な行動は好ましいものではありませんから、この結果は間違いとは云えません。
 まあ、ピカソだって画学生のときは、ちゃんとしたデッサン画を描いているように、正統的な基礎基本があってこその独創性なわけですから、修行中のAIが独創性を発揮するのは10年早いと云うことでしょう。

 と云うことで、この手法で実現される「初音ミクAI」の歌は、正統的で安心して聴ける歌唱ということになりそうです。

 では、AIに独創的な作品を作らせることは、不可能なのでしょうか。

 囲碁などのゲームの分野では、AIが人間の予想もしない手を指すことが知られています。悪手とされるには、それなりの根拠があるはずですが、AIはその先に新たな可能性があることを、気の遠くなるような試行の結果、見いだしているわけです。

 一方、俳句の世界にも「季重なり」とか「三段切れ」などのように、好ましくない手法があるのですが、あえてこれらを用いた名句というものも存在するそうです。
 AIが、このような手法を駆使して、既存の作品と全く異なる俳句を作ることは、作るだけならば十分に可能だと思います。ただ、ここで問題となるのは、AIが自らの作品を自己評価するにあたり、冒険的な作品を価値あるものと認識できるかということです。

 ゲームには、勝敗という明確な評価基準が存在しますが、芸術の評価は単純ではありません。

 人間の芸術家だって、前衛的な作品が受け入れてもらえるかなんて世間に委ねるしかないわけで、結局は、自らの感性を信じるかどうかに尽きると思います。
 そして、人間の感性と云うブラックボックスの先にあるものが独創性だとすれば、つまり、感性と云う「ワープ航法」でしかたどり着けない領域なのだとすれば、それはAIの手法の範疇の外の話になってしまいます。

 しかし、独創的な発想が、世間に受け入れられると云うことは、そこには、何らかの必然性があるはずです。ワープ航法で一気にたどり着けなくとも、気の遠くなるような論理的試行を積み重ねることにより、到着可能ではないかと期待しているのです。
 そこへ到着するための思考過程は、AIにとっては論理的必然であっても、人間にとっては、もはやブラックボックスです。

 人間の感性はAIには理解できませんし、AIの深層思考は人間には理解できません。しかし、この2つのブラックボックスこそが、独創性へのそれぞれのアプローチになるのだと僕は思うのです。

2 件のコメント:

korou さんのコメント...

深い考察で凄いですね。
参考になります。

最近読んだ「AI vs. 教科書が読めない子どもたち」(新井紀子/著)という本では
”AIにデータを入力さえすれば何でも可能になるというのは「妄想」だ”と
断じていますね。
1)そもそも有効なデータ作りが追いつかない
(ゆえにAIに「自習」させる方向に手法転換していった)
2)有効なデータが質量ともに確保されても、実社会で応用させた場合
 限界が見えてくる
(ゆえに”東大を受験するAI”計画は中止になった)
実際にAIを管理運営した立場からの意見なので
説得力がありますね。

この本の面白いところは
だからAIなんて恐れるに足らないという結論には行かずに
実はそんな”未熟なAI”にも劣る人間が
今の教育で続々と誕生しているという指摘です。

そのうち
俳句など作れない、初音ミクの進化もストップするといった
人間の退化が始まるのかもしれません。
そうなると
一定のレベルなら維持できるAIのほうが
それを上回ってくるという状況もあり得ます。

「AIって凄いなあ、俳句が作れるんだから。俺ら人間にはムリだよ」
なんてつぶやいている未来の人間たちの会話を想像すると
別の意味で怖いですww

さんのコメント...

コメントありがとうございます。
あくまでも妄想ということでお願いしますw

「新井紀子」氏は「東ロボ君」のプロジェクトリーダーさんでしたね。
話題本になってましたけど、本屋での拾い読みと、ネット記事をざっと読んだだけですので、何も云えないのですが・・・。

AI(東ロボ君)は、真の読解力がないから、MARCHは(国語ができなくても他教科でカバー可能なので)合格できても東大は無理と云う結論であったかと思います。正確には、「新井さんたちの手法では無理」だと思いますので、いつの日か、AIの読解力に関する新しいアプローチを構築してくれる「天才」が登場するのを待ちたいと思います。

まあ、現状では無理ということが分かったのも大切な結論ですから、それは尊重すべきだと思います。
それから、今の学生は教科書の読解もろくに出来ないという指摘も真実かと思います。
ただ、それを新井氏は、詰め込み教育とかと結びつけていたように思いますが、どうなんでしょうか。
だって、並の学生たちは、昔から読解力なんて有りませんでしたよ。

偉い先生たちに解明して欲しいのは、ほとんどの国民は教科書の読解も満足にできないのに、なぜ社会は成立しているのかと云うことです。
僕は、ヒトには、「読解できてなくても分かった気になれる能力」があるからだと思いますが、いかがでしょうかw

それから、「AI一茶君」の作った俳句は、名人との対決には敗れましたけど、僕にはとても作れないような良い俳句だったと思います。
「カエル」というお題の一句『又一つ 風を尋ねて なく蛙』とか、ありふれているかもしれませんけど、素直で正統派の微笑ましい俳句だと思います。それに比べて、人間の俳句は、僕にはあざとく感じてしまいました。
まあ、これは、「人間の歌うバラードはクドいので、初音ミクの方が心に染みる」とか云ってる僕だけの感情なのかもしれません。

ただし、「AI一茶君」の作る俳句の95%は、意味不明のガラクタだそうです。その中から、デキの良い作品を評価してあげるのは、結局人間なんですよね。俳句など作れなくても、歌など歌えなくても、作品の良さが分かる・・・分かったような気になれるのが、ヒトの能力なのだと思います。

それから、「初音ミクAI」は歌うことに特化したAIですので実現可能だと思うのですが、歌うからには、歌詞の読解は不可欠です。前回は、「歌詞は限定された文章なので・・・」みたいにAIと読解力の問題について逃げてしまいました。これについての妄想は次回への宿題とさせてください。