クリエイティブ分野の100年はディープラーニングでどう変わる?

これからの100年間は人工知能のない世界は考えられない。

アート・広告美術・コンテンツの領域こそ人工知能の活躍の場だ

2015年秋「ディープラーニングでおそ松さんの六つ子は見分けられるのか」(準備編、実践編)というブログ記事が、ネット上を駆け巡ったのをご存じだろうか? アニメ番組『おそ松さん』の2~5話から5644枚のおそ松さんの顔を自動的に切り抜いてラベリングして学習させ、人工知能で6つ子を見分けましょうという内容だった。

これをやったのは、「おうちハック同好会」の関係でもお世話になったりしていた石田陽太さんである。彼は、先端技術をこの種のネタ的なことに"無駄遣い"することに命を賭けているというスジの人である。これいまの日本らしいというか、自分の興味のあること好きなことを題材にしたほうが研究も仕事もやれるというお話でもありますね。

とかくディープラーニングのお勉強では、現在でもMNISTという手書きした数字のデータに代表される教科書的な"追実験"の範囲にとどまりがちだ。それが、一昨年の当時となると、いよいよ独自データでゴリゴリとディープラーニングの研究をしている人は多くはなかった。ちなみに、著作権法第47条の7・情報解析のための複製に「コンピュータを使った情報解析のために、必要と認められる限度において、著作物を複製することができる」とされているので参考まで。

Open Image Modal
BOHEMIAN916

石田陽太氏(ぼへみあ (id:bohemian916))のブログ「bohemia日記 」。おそ松さんの6つ子を見分けるには、株式会社Preferred Networks(通称PFN)の国産ディープラーニングフレームワーク「Chainer」を使用。

さて、その「おそ松さん」から半年ほど経過した2016年春頃、石田さんのブログに、今度は「ディープラーニングで色々な《だが断る》を作ってみた」という記事がポストされた。これは、岸辺露伴の「だが断る」というシチュエーションの画像を、コンピューターで自動生成するというものだ。「おそ松さん」では、画像の振り分けというアルバイト的作業だったが、こっちは新しい作品を生みだしてしまう。要するに、一定のセンスと能力を必要とするクリエイティブな行為である!

これは楽しそうというわけで、石田さんに無理やりお願いして作ってもらったのが、冒頭に掲げた私のアイコンの自動生成である(左がf-Watabeさんに描いてもらったオリジナル、右が人工知能によって生成された画像)。同じように、以下は、私のアイコン(左上)を元データに、ピカソの作品をお借りしたスタイル画像(左下)で「こんな風にお願いね」と人工知能に与えた結果、新たなアイコンが生成(右)されたものだ。

Open Image Modal
BOHEMIAN916

配色や適当な塗り分けが面白い。要するに人間のようにテキトーな仕事ができる!

当時のやりとりを見ると、石田氏から「僕もこんな上手くいくなんて思ってなかったので、驚きました!」とか、計算量が多いため「ゴールデンウィーク中に回しておいた画風変換ができたので送りますね」などとある。Preferred Researchの松元氏の「画像を変換するアルゴリズム」を元に行ったものだが、1年半も前のものなのでいまやるともっと凄い画像が生成できそうである。

これはもう、クリエイティブ分野の仕事をディープラーニングがやりはじめる準備がすっかり整っているという感じではないか?

Open Image Modal
BOHEMIAN916

遠目に見ると同じ絵のようにさえ見えるが、右は私のアイコン

人工知能時代の芸術

このお話に関連して、まさに「おそ松さん」や「だが断る」のディープラーニング活用例を示してくれた石田陽太氏、そうしたライブラリーを提供するPFNの米辻泰山氏、そして、日本デジタルゲーム学会理事の三宅陽一郎氏に集まっていただいて、クリエイティブ分野への人工知能の応用についてお聞きすることにした。

ちょっとお知らせになってしまうが、9月6日(水)に開催の『創作とディープラーニングの出会い AI時代のコンテンツ制作はいかに変容していく?』である。

石田さんには、実際にどんなツールやライブラリを使って、どんな手順で、どんな試行錯誤をしてディープラーニングを活用したのか? この種の事例は2017年のいまは多数ニュース等にもなっているが、あまり細かくは紹介されていない、そのやり方、はじめ方、注意点ななどをレクチャーしていただく予定だ。米辻氏には、ご自身が開発した線画自動着色技術 "PaintsChainer"を中心に、日本を代表する人工知能企業の開発者ならではの解説となるはずだ。

さらに、スクウェア・エニックスのリードAIリサーチャーであり、ゲームAIの立場のみならず人工知能全般について広い知見を持つ三宅陽一郎氏に加わっていただき、クリカイティブ分野においてディープラーニングによって何ができるのか? について展望。そして、ゲストに『ディープラーニングによるラーメン二郎全店舗識別』を手掛けたNTTコムウェア ビジネスインキュベーション本部の土井賢治氏にもおいでいただく。企業におけるディープラーニングの活用は、本当まだ端緒についたばかりである。

メディアアートや広告でもクリエイティブな分野は、とくにディープラーニングとの相性がよいことが想定できる。ユーザーの個別の反応やソーシャルメディア解析をもとに、リアルタイムで受け取り手にあった作品に変容することが考えられる。インタラクティブ(対話的)に触れることのできる作品ではなく、鑑賞者や環境によって作品自体が別のものになる。

一方、株式会社ドワンゴは、大量の投稿作品のレコメンデーションや動画への不適切コメント対策に、すでにディープラーニングを導入している。作品の生成もさることながら、いままで人間がやっていたプロデュースや番組編成、さらにはデリカシーを必要とする視聴者との接点など周辺の仕事もこの領域の大きなテーマとなる。

Open Image Modal
KNJCODE

土井賢治氏のスライドより。ディープラーニングなら見分けられる!

ところで、《オックスフォード大学が認定 あと10年で「消える職業」「なくなる仕事」》という記事が話題になったことがあるのをご記憶の方も少なくないと思う。『週刊現代』2014年11月1日号に掲載、ウェブに転載されたもので、元の論文は2013年9月に発表されたものである。

議論を投げかけてくれた記事だし、論文を書いた先生は「機械学習」が専門らしいのだが、さすがに2013年となるといま見るといささか古さを感じてしまう。記事の最後のほうで、「ロボットやコンピューターは芸術などのクリエイティブな作業には向いていません」などという発言が引用されている。芸術やクリエイティブな作業というのはとても「ソフトウェア」的で、いまやディープラーニングのいい素材ではないかと思うのだが。

それではどうするのか? 100年くらい前まで、音楽や芝居などの分野は生身の人間がその場で演じる「実演」というものしかなかった。それが、産業革命後の精密機械、電気、化学、光学技術によって、記録・再生できるレコードや写真や映画という媒体を生み出した。それに対して、これからの100年間は人工知能のない世界は考えられない。複製技術から人工知能時代である。芸術やクリエイティブな作業が「ソフトウェア的」でディープラーニングに向いているのなら、どんどん使うことである。 

最後にこれも宣伝みたいになってしまうが、『AI白書2017』(独立行政法人情報処理推進機構 AI白書編集委員会)を刊行させてもらった。ディープラーニングの応用は毎日のようにニュースになっているが、その中ではむしろ人間の感性がからむ(必ずしも芸術的なという意味ではないが)クリエイティブな作業を含む分野が有望に見える。

(2017年9月1日「遠藤諭のプログラミング+日記」を加筆転載)