日本のAI技術者が開発した囲碁ソフトが趙治勲名誉名人を破ったことが大きなニュースになるなど、近年人工知能が再び大きな注目を集めている。そのキーワードがディープラーニング(深層学習)と呼ばれる概念である。ディープラーニングは従来の機械学習に較べ、なにが新しいのか? それは人工知能の過去のブームを紐解くことで見えてくる。 人間の知的活動を機械で代替しようとする人工知能の歴史は古く、これまで何度かブームを生んできた。第1次ブームはコンピュータ草創期の1950〜60年代のこと。これまで計算する機械に過ぎなかったコンピュータが簡単なゲームや人間との対話を行えるという事実は人々に大きな驚きを与えた。 第2次ブームは1980年代で、それをけん引したのは、専門家と呼ばれる人々の推論はすべて“if than else”のロジックで再現できるという前提に基づいた「エキスパートシステム」だった。だが、これはまもなく大きな壁に直面することになる。人間の推論は「重い」「温かい」など数値化が難しい多様な情報にもとづき行われることが一般的だ。それを“if than else”に落とし込むことの困難さこそがその壁だった。また、推論プロセスは技術の進歩や法改正など、環境の変化に応じて変化する。仮にロジック化を実現したところで、その後のメンテナンスコストまで視野に入れると、この方法論はとても実用に耐えるものではなかった。 2005年頃からの第3次ブームの主役になったのは、「機械学習」という概念だった。機械学習では、大量の情報の反復的な分析を通し、情報に共通する要素をコンピュータ自身が学んでいく。それを通して得られた学習結果を意思決定に役立てることがその基本的な考え方になる。エキスパートシステムから機械学習への移は、人間の推論の過程を機械に置き換えることから、コンピュータの得意分野を 基盤としたより現実的なアプローチへの移行と言い換えることもできるだろう。だが機械学習も、その実用化には課題は少なくなかった。分析精度を高めるためには、必ず人の手が必要になることはその一例だ。 こうした問題を受け、新たに注目されることになったのが「ディープラーニング」という新たな学習法だった。そのもとになったのは、人間の脳の仕組みを模倣することで人工知能を実現しようとする「ニューラルネットワーク」という古くから存在するアイデアだった。 ニューロン(神経細胞)のネットワークとして説明可能な人間の脳の仕組みは、外部からの刺激に対応して特定ニューロン間の関係を強化することで処理能力を高めるという特徴を備えている。入力層と出力層を両端に持つ多層ネットワークであるニューラルネットワークは、入力データに対応し、階層間の情報伝達を自動的に調整していく点が大きな特徴だ。この仕組みを取り入れた機械学習の新たな方法論がディープラーニングである。 「コンピュータが猫の顔を自動認識した」という、かつてGoogleが行った実験を覚えている方も多いはずだ。YouTubeの動画からランダムに取り出した大量の画像を使って行われた実験では、1000台のコンピュータを使った3日間の実験を通して、人間の顔、猫の顔などを識別する仕組みがネットワーク上に自動的に構築された。このように、無作為に入力されたデータから、重要な要素を自動抽出することがディープラーニングの特徴だ。従来の機械学習で同様の成果を得るには、あらかじめ「人間の顔」「猫の顔」としてタグ付けされた大量のデータが必要であることを考えると、そのメリットは明らかだ。 現時点でディープラーニングが最も得意とするのは画像分析になる。中でも画像キャプションの自動生成技術はすでに実用段階にある。膨大な投稿画像を自動的にタグ付けし、より高度なユーザー分析を可能する同技術は、今後、ソーシャルメディア関連サービスのホットの話題になることは間違いない。