“モノづくり“という共通のフィールドで活躍する異業種クリエイターのインタビュー
徳井直生
株式会社Qosmo (コズモ) 代表取締役。東京大学工学系研究科博士課程修了。工学博士。
在学中から人工知能に基づいた音楽表現とユーザ・インタフェースの研究に従事するとともに、DJ/プロデューサとして活動。ソニーコンピュータサイエンス研究所パリ客員研究員などを経て、2009年にQosmoを設立。2015年には人工知能DJイベント「2045」をスタート。近作としては、AIを用いたBrian Enoのミュージックビデオの制作など。AIと人の共生による創造性の拡張の可能性を模索する。
http://www.naotokui.net/
先日、半年ほどかけて手掛けた映像作品が完成し、公開しました。イギリスの現代音楽家で“アンビエント・ミュージック(環境音楽)”の先駆者として世界的に有名なブライアン・イーノ氏のアルバム『The Ship』のミュージックビデオ作品です。
この曲は「歴史の中で繰り返される人間の野心や驕り、パラノイア」をテーマに作られたもの。20世紀初頭に建造された豪華客船「タイタニック号」のエピソードに象徴される、最先端の技術に対する過信と沈没という悲劇、そのあとに起こった第1次世界大戦によって崩れた人々の世界平和に対する絶望感、といった歴史上の出来事から、“人類は慢心と恐怖心との間を行き来するもの”とするイーノ氏の考え方を人工知能を用いて表現に取り組んだものです。
このプロジェクトは、Dentsu Lab Tokyoの菅野薫くんに誘われて参画しました。菅野くんとはQosmo設立以来、人工知能に関するさまざまなプロジェクトを手掛けてきた間柄で、今回も一緒に新たな取り組みにチャレンジすることになりました。
最初は、抽象的なコンセプトを新しいテクノロジーである人工知能を用いて、どのように表現しようかと探るために、Dentsu Lab Tokyoのメンバー、プログラマーの比嘉了くんらと一緒に相当な時間を費やしてリサーチを行いました。
驕りとパラノイアを繰り返している人間の歴史を、人間以外の目で観察して評価できたら面白いのではないか…つまり、人工知能に任せるのが良いのではないかと考えついたんです。そこで、過去の歴史的な画像を人工知能に見せて連想させるという取り組みを行いました。重視したのは、人工知能に回想させること。その結果、表されたものを見た人に気づきを与えられる、そんな映像にしようと思ったのです。
こうして『The Ship』は世界中のニュースサイトからリアルタイムで報道されているニュースを取り込み、人工知能が想起した過去の歴史的な写真から映像を生成する、という作品として完成しました。
人工知能の画像認識については、“ディープラーニング(深層学習)”を用いています。たくさんの画像を学習させて特徴量を作りだすという仕組みから、類似する写真を検索しているのですが、一般的な画像検索とは異なり、写真のコンテクスト(撮影された場所など)も加味するような学習をさせました。
その日起きている出来事が、過去の人間の歴史と映像でなんとなくリンクしていく。たまに人工知能が“人間だとこんな風に考えないな”というような勘違いやズレた解釈をして抽出した映像が生成されたりすることも。
映像から答えを示すことがこの作品の目的ではないんです。見た人にはその「ズレ」からいろんな風に感じ取ってもらえればと思っています。
プロジェクトを終えてみて、ディープラーニングの可能性を改めて感じました。人間が普段気づかないことを、設計さえうまくできれば自動的に抽出できるものなのだと。
ロジックと知識をベースにした従来の人工知能に対して、ディープラーニングは右脳的というか、たとえば、音楽を聞いた時の印象のようなものまで疑似的にデータ化して再現できるのが面白いなと思っていて。ここまで進化した人工知能に、どんどん“妄想”させることが今の僕のテーマでもあります。
今の自分の興味につながる出会いは、大学3年生のときです。ある映像を見て衝撃を受けました。それは、シミュレーションの物理空間の中で仮想的な生物を進化させるという実験です。骨格と関節と筋肉をランダムに組み合わせた「個体」をたくさん作り、それをシミュレーションの中で動かします。速く遠くまで動けた個体同士を組み合わせて、次の「世代」を作るということを繰り返していくと、徐々に生き物のような動きをする個体が生まれてくるんです。人が恣意的に動きをプログラミングしたわけではありません。コンピュータにルール付けするだけで、人間が想像もしないような仮想的な進化を遂げていくという研究を目の当たりにして、“これだな”と直感。「自分もコンピュータに驚かされるようなシステムを作ってみたい」と思うようになりました。
それだけではなくて、人工知能で自分の好きな音楽をやりたいな、とも思っていたんですね。ただ、人工知能の研究室に入ってしばらくは、ずっとかたい研究ばかりしていました。
そのうち、やっぱりちょっと違うなと思って、先生に思い切って「音楽やらせてください!」とお願いして、修士からテーマを音楽にシフト。コンピュータのシミュレーションを使って、ソフトウェアを使う側が想像もしないようなサウンドやリズムが生み出せないかという研究をやってました。
そして卒業後は企業の研究所に所属した後、2009年に会社を設立。アルゴリズムと表現について、さまざまな取り組みを通じて追求しています。
『2045』を始めたのは、ライゾマティクスの真鍋くんと一緒に遊びで、YouTubeから好きな音楽を探してDJをやっていたことがきっかけです。
YouTubeやSpotifyのようなツールが登場する時代のDJの在り方ってなんだろうね、と話していて。そこで、人工知能時代のDJ、VJを考えるというクラブイベントを2015年にスタートしました。
このイベントは、持ち寄ったアルゴリズムでDJをさせるという実験的なものです。その中で僕は、人と人工知能が交互に一曲づつ選曲していくことでDJプレイを行うという、いわゆる“Back to Back”スタイルのDJに挑戦しています。
しかもあえてアナログのレコードとターンテーブルを使うという… 一周回ってかなりハイテクなのですが、なかなか見ている人にはわかってもらえませんでした(笑)。
選曲・ミックスの部分をどう人工知能にやらせるかというと、ディープラーニングの仕組みを利用しています。単に楽曲を学習させるだけでなく、“音の印象”までも解析させる。つまり、人が音や曲を聴いた時の“(ある音や曲と)似ている、似ていない”といった印象の判断を疑似的に再現させるのです。それによって、人が聴いた時の感覚により近づけることができました。
大事なミックスについても同様にディープラーニングを用いています。英Google DeepMind社が、米ビデオゲーム会社AtariのゲームをAIにやらせたときの手法(Deep Q-Network)を応用して、ひたすらAIに“テンポ合わせ”を学習させるんですね。ターンテーブルの回転速度をコントロールしながら、テンポやリズムを合わせるにはどうしたらいいのか、ミックスされた音を聞きながらAIが学習していきます。
その学習が進んで、やっとテンポが合わせられるようになってきました。先日の2045でもAIがちゃんとテンポを合わせてくれたので、嬉しくて嬉しくて。ついニヤニヤしてしまっているのが記録映像にも残っています(笑)。
もう一つ、2045で非常に面白かったエピソードがあります。リハーサルの時に僕がかけた地味なテクノに対して、AIがフリージャズに近いびっくりするような選曲をしたんですね。僕だったら絶対選ばないような曲なのですが、すごくカッコよくミックスされたんです。あぁ、こんな選曲がありえるんだという嬉しい発見がありました。
と、ここまではいい話なんですが、本番では逆のことが起こったんです。リハーサルで僕が選んだ曲をAIがかけてしまった!とっさにAIの選曲をコピーしようと考えて同じレコードを手に取ったのですが、あろうことか、A面とB面を間違えてかけてしまったのです。場の盛り上がりを台無しにしてしまうという、痛恨のヒューマンエラー(笑)。AIと人が一緒に舞台に上がったからこそ、こういうことが起きるのだと思います。
こんなハプニングも含め、イベントの度に驚きや発見があって、次はどんな意外性を出してくれるのだろうとワクワクしますね。
人工知能に対する多くの人のイメージは、人間を打ち負かしたという囲碁や将棋、会話するロボットあたりでしょうか。でも囲碁なんかは、いくら最強レベルの人間に勝ったとしても、そのAIは囲碁しかできないんですね。それに比べて人間は判断基準があいまいなものを日々、秒単位で処理しているわけで。今進んでいる人工知能の研究はすべて特定の目的のためのもの。このような特化した人工知能が人間に置き換えられるというのは間違いです。“そのうち人間の仕事を奪ってしまうのではないか?”などと恐れる必要もないということ。仕事の中のタスクの一部がAIに取って代わられるだけのことです。
今後、人工知能の発展において、クリエイティブな領域に関わっている人達のインプットがますます必要になってくると考えています。海外では今、中国が国策として研究開発に取り組んでいてすごい勢いで発展していたり、グーグルなどのシリコンバレーの大企業も巨費を投じて開発プログラムを行っているなかで、日本は遅れを取っています。ですが、音楽やアートといったクリエイティブの領域に新しいテクノロジーを導入するという点で、日本にしかできないことがあると信じていますし、勝ちたいと思います。
僕が人工知能を使って表現したいのは、人間では想像もつかないようなもの、意外性から出てきたものです。たとえば、有名画家の絵を模写するAIを見て、すごいなと思う一方で、「ふーん」で終わってしまうんじゃないかと思っていて。僕はそこに興味はなくて、人とAIが一緒に何かをやるから意味があり、面白いものが生まれるのではないかと思っているんです。答えがないからこそ面白いんだと。AIによって総体的に表現の幅が広がっていくと考えています。
人工知能で何か表現してみたいなと思われた方は是非ジョインしてください。一緒にさまざまな表現の可能性に取り組んでいきましょう!