中国のスタートアップが発表した生成AIモデルDeepSeek-R1が日・米・欧のハイテク銘柄の急落を招いた。米国の生成AIモデルとDeepSeekは、なにが違ったのか。DeepSeekショックの意味をあらためて振り返りたい。

中国国内市場を押さえたDeepSeek

DeepSeekは、中国・杭州を拠点にするヘッジファンドであるハイフライヤー・クオント(幻方量化)がAI開発を目的に2023年に設立したスタートアップ。2016年設立の幻方量化は早くからヘッジファンド運用にAIを活用してきたことでも知られ、AI愛好家という肩書で紹介されることも多い創業者の梁 文锋氏がDeepSeekの開発もリードしているとみられる。

DeepSeekを理解する上では、2010年代以降、中国が国を挙げて推進してきたAI立国の取り組みも押さえておく必要がある。まず注目すべきはAI人材育成における大々的な取り組みで、USニューズ&ワールド・レポートが発表する大学ランキング2024年版のAI分野において、中国AI研究の聖地ともいわれる精華大学がトップに選ばれ、ベスト5に2校、ベスト20に12校がランクインした。ちなみにベスト100にランクインした日本の大学はゼロで東大の128位が最高位である。

同様にAIの社会実装を目的とした中国独自の「AI+」と呼ばれる施策にも注目が必要だ。OpenAIなどの生成AIモデルは、サブスクリプションサービスや企業向けAPIサービスとして提供されることが一般的だ。それに対し中国では、アリババやファーウェイ、テンセントなどのクラウドベンダーがオープンソースの生成AIモデルをクラウド上で提供するというビジネスモデルが定着している。それにより企業は、自社の目的に応じより高精度なAI活用が可能になるが、利用ハードルは当然上がることになる。ここで大きな役割を果たすのが、全国の名門大学から輩出されるAI人材だ。年俸1000~2000万円でAI人材が引く手あまたという活況の背景にはこうした事情もある。

中国では、クラウドベンダー各社を中軸に生成AIモデルの開発も急速に進んだ。その勝者となったのが、コスト優位性を武器にシェアを広げたDeepSeekだった。中国国内市場を押さえたことは、スケールメリットにもつながった。GPT-4に相当する能力を1/10のコストで提供するといわれる強みの背景にが、技術とスケールメリットの二つがあると予想できる。

中国のAI政策には大きな泣き所があった。米国が主導する半導体輸出規制である。これまでAIのスムーズな運用には、高性能なAI半導体が不可欠とされてきた。

DeepSeekはビジネスモデルも注目

生成AIモデルの性能は学習データ量とパラメータ数に大きく依存する。パラメータは生成AIモデル内部で調整される変数を指し、一般論としてはその数が多いほど高性能なモデルになる一方、パラメータ数の増加は処理の複雑化に直結する。

GPT-4のパラメータ数は1兆を超えるとみられるが、DeepSeek-R1のパラメータ数は約6700億。簡単に言えば、同水準の性能が1/2強の処理能力で実現できるということができるが、その革新性はそれに留まらない。

生成AIの領域では、複数の専門家モデルを組み合わせて使用するMoE(Mixture of Experts)と呼ばれる手法が普及している。専門領域に分けられた複数のモデルを用途に応じて組み合わせることで、処理の大幅な省力化を実現することがその特長である。DeepSeek-R1にはアクティブパラメータという概念があるが、これはMoEによる効率的な処理に必要なパラメータ数という意味を持つ。その数は370億パラメータで、コンパクトで効率的なAIモデルとして知られるLlama-3の700億よりさらに小さい。簡単に言えばDeepSeek-R1は、GPT-4同等の学習データを備える生成AIモデルをLlama-3などの小規模モデルよりもさらに少ない処理量で実現する。NVIDEAの株価を1日で17%下落させ、時価総額約6000億ドルを雲消霧散したDeepSeekショックの本質は、これによりAI半導体需要の下方修正が必要になった点にある。

すでに触れたように、生成AIモデルをオープンソースで提供するというビジネスモデルもDeepSeekが注目される理由の一つだ。マイクロソフト、エヌビティア、アマゾンなどの米テック企業が、DeepSeekの生成AIモデルを自社サービスに組み込む発表を行った背景にもこうした独自のビジネスモデルがある。学習済みのモデルをAPIで利用する場合、データ漏洩の懸念が常に残るが、オープンソースの生成AIモデルを使い、自社環境で学習を行うのであればデータ漏洩の心配はないからだ。

近頃なにかと話題になる関税だが、経済学では自国産業の育成や技術移植に一定の意義を認めることが一般的だ。米国の半導体輸出規制は図らずも、中国のAI産業育成にそれと同様の役割を果たしたのかもしれない。