ネットワーク

GANによる画像生成の仕組みとビジネス活用

掲載日:2023/08/22

GANによる画像生成の仕組みとビジネス活用

昨今トレンドとなっている、AI画像生成技術。ビジネスへの導入を検討する企業もあることだろう。しかし、以前から耳にしたことはあったもののその詳細が分からない技術として、「GAN」を挙げる方は多いのではないだろうか。改めてその仕組みとビジネスでの活用事例を紹介しよう。

「敵対的生成」による効果とは

GAN(敵対的生成ネットワーク)は2014年に発表された生成モデルで、学習データを元に擬似的なデータを生成できる。

GANはGenerator(生成ネットワーク)とDiscriminator(識別ネットワーク)という2種類のネットワークから構成されている。Generatorは元データの偽物を生成する役割を、Discriminatorは元データとGeneratorが生成したデータとを識別する役割を持っており、両者を競合させることによってデータの精度を向上させていく。「敵対的生成」とは、生成ネットワークの生成データを識別ネットワークが真偽判定する様子を表しているのだ。

創造的な画像生成を実現するGANの学習方式

GANの特徴として、「教師なし学習」という学習手法が挙げられる。

教師なし学習の説明の前に、まずは対をなす教師あり学習について説明しよう。教師あり学習とは、あらかじめ人間が「正解」だと設定したデータをAIに学習させる手法だ。例えば、AIに「α」という文字を正しく画像認識させるという目標がある場合は、大量の「α」の画像データに「これが正解の『α』である」と設定して学習させる。これにより、AIは「α」を精密に認識可能になるという流れだ。教師あり学習は、気象変化の予測や市場の予測など、過去のデータを元にした予測に向いている方式とされている。

対して教師なし学習は、人間が正解を与えていないデータをAIが学習する手法だ。AIは自らデータを分析し、類似度や規則性に基づいて分類を行う。先の例で言うならば、大量のデータの中から「これらのデータはαという文字」「これらはβ」と、AI自身が分類していく流れで学習が行われる。

このような特徴があるため、教師なし学習は正解がなく創造的な分野のデータ生成に向いている方式だと言える。教師なし学習を採用したGANの活用方法として特に注目されているのが、写真やイラストといった画像の生成だ。GANに任意のテキストデータを入力することにより、指示した特徴を持った画像を生成する。

GANのビジネス活用事例

GANの創造的に画像を生成する特徴は、ビジネスでも活用できる。例えば、大手広告代理店はGANで架空の人物の顔写真を生成し、広告に活用している。広告に必要な撮影に際して、イメージに合ったモデルや場所の確保、日程の調整など広告業界が抱える課題の解決に有用だろう。

また、とある大手金属メーカーでは、GANを活用することで、製造不良の製品を識別するAIの性能を向上させる試みを発表している。これまで同社では、不良製品の識別をAIに学習させるために大量のサンプルデータを用意していたものの、GANで擬似的に不良製品の画像を生成したことで、データ収集に必要な期間を1/5に短縮できたという。GANは、画像生成だけでなく、AIや業務システムの補助においても活用できるのだ。

発表以来注目を集め続けてきたGANだが、2022年に高品質な画像生成AIである「Stable Diffusion」が発表されて以降は、そちらへの注目が増しているようだ。とはいえ、まだ見ぬ技術革新により話題の中心が変化し続けることは、現在のAIを巡る社会の特徴である。

「画像生成AI」の詳細はこちら!

まずはGANの特徴を把握し、ビジネスチャンスに備えてみてはどうだろうか。