計算リソースを一括確保し補助金と併せて開発者に提供

日本政府による国産AI開発支援の本丸は、経済産業省と新エネルギー・産業技術総合開発機構(NEDO)が2023年11月にスタートした「GENIAC」である。GENIACはGenerative AI Accelerator Challengeの略。プロジェクトの起点になったのは、当時の世界的なGPU需要拡大に伴う、AI基盤モデル開発に必要な計算リソース不足だった。経済産業省は、AWSやマイクロソフト社のクラウドGPUを一括調達して計算リソースを量的に確保すると共に、低コストで調達した計算リソースを利用料金の補助と共に開発者に提供することでこの問題の解決を図ることにした。

AI基盤モデル開発において優位性を確保することは、時間との闘いでもある。経産省は次年度の新規予算獲得に伴うタイムラグを避ける狙いで、庁内のデジタル分野の既存研究開発基金である「ポスト5G情報通信システム基盤強化研究開発基金」をGPU調達に振り向けることで、2023年11月に公募開始し、翌2024年2月に第1期の生成AI基盤モデル開発をスタートしている。その後、2024年10月からは第2期、2025年8月からは第3期の生成AI基盤モデルがスタートしているが、採択案件の俯瞰は、国産生成AI開発の現在地やその可能性を知るうえで意義深いと思われる。採択案件の詳細はGENIACのWebサイトを参照いただくとして、ここでは全体像を整理して見ていきたい。

第1期の採択案件は10件。富士通、東京大学松尾・岩澤研究室、情報・システム研究機構を除くと、採択企業はスタートアップで占められている。なお生成AI基盤モデルとは、さまざまなテキストや画像等で学習を行い、多様なタスクに対応する汎用的なAIモデルを指す。基盤モデルを活用することで、企業や官公庁は、AIモデルをゼロから開発する必要がなく、独自の生成AI利活用の仕組みを構築することが可能になる。

日本語学習に基づく汎用的な生成AI基盤モデル開発を主目的として第1期に採択された案件はELYZA、Preferred Elementsの2案件。2019年に東京大学松尾研究室からスピンアウトし、LLM研究開発と社会実装に取り組むELYZAは、MetaのLlamaなどオープンモデルをベースに、日本語の機械学習とDepth Up-Scalingという既存LLMのサイズを拡張する手法を組み合わせ、日本語に強い基盤モデル開発を行った。Preferred Elementsは冒頭で紹介した「PLaMo」開発を手掛けた、プリファードネットワークスのグループ会社。その成果に基づき、2024年12月にリリースされたのが「PLaMo 2.0」である。

また生成AI基盤モデル開発では、テキストや画像、音声、動画を同時に処理するマルチモーダルAI基盤開発も重要テーマの一つである。完全自動運転EVに特化したスタートアップであるTuringは、完全自動運転に向けた運転ドメインを学習した、大規模マルチモーダル基盤モデルの開発に取り組んでいる。同社が開発した700億パラメーター級のマルチモーダル基盤は、2030年を目標に開発が進む完全自動運転車の実現に大きな役割を果たすことが期待される。

同様に、特定領域に特化したドメイン特化型モデルにも注目したい。その一例が、富士通が行ったナレッジグラフの生成・推論に特化した基盤開発である。ハルシネーションの問題から、定型的な業務が少なくないにもかかわらず法曹や医療の領域では生成AI利活用が進んでいない。同社は、さまざまな知識や情報を点と線で表現し、データ同士のつながりを可視化するナレッジグラフの考え方に基づき、法曹や医療が導入しやすいAI基盤開発に取り組んだ。またKotoba Technologies Japanは音声に特化した基盤モデル開発、Sakana AIは今後の生成AI社会実装において大きな役割を果たすことが期待されるAIエージェント向けの基盤モデル開発、ストックマークはビジネスドメインに求められるハルシネーション抑止を目的とした基盤モデル開発に取り組んでいる。

ニーズに応じ多様化が進むドメイン特化型モデル

GENIAC第2期の採択案件は20件。ドメイン特化型モデルはさらに多様化している。アニメなどの動画制作に特化した生成AI基盤の開発はその一つ。Open AIのSoraをはじめ画像・動画生成AIは既に複数登場している。この領域でも日本は出遅れているのが実情だが、その一方で先行する動画生成AIに関しては、特にアニメーションのクオリティの低さを指摘する声も少なくない。こうした中、AIdeaLab、AiHUBはアニメ制作の実務に対応できる精度の動画生成AI基盤の開発に取り組んでいる。また既存の画像・映像生成AIは、例えばCM動画において登場人物の服の色だけを変えようとすると周囲の色まで変わってしまうなど、きめ細かな調整が難しいという課題がある。その解決に向け、データグリッドは、ユーザーの意図に沿った効率的な画像・動画生成モデルの開発に取り組んでいる。よりスムーズな画像・動画生成を可能にするモデル開発は、例えば製造業の検品時のNG例を伝える画像準備の省力化など、幅広い業界の業務への貢献が期待できるだろう。

GENIAC 第2期 採択事業者一覧

創薬に特化した生成AIモデル開発にも注目したい。AIによる新分子開発による創薬は以前から注目されてきたが、これまで期待に応える成果は得られていなかった。その理由の一つは実験を通して得られる分子情報が質的にも量的にも限られる点にあるが、SyntheticGestaltは、分子情報のAIによる補完を目的とした分子構造に特化した生成AIモデル構築を通し、この課題の解決に取り組んでいる。

同様にヒューマノーム研究所は、近年収集精度が飛躍的に向上している遺伝子発現量に着目し、医薬品による生体への影響を予測する新たなモデルを構築。既存薬の転用や新薬の安全性確認の効率化への貢献が期待されている。

また、ビジネスにおけるデータ利活用では、生成AIによる図版やグラフ、テキストや画像といった半構造化・非構造化データの活用が今後の課題になっているが、この解決を図る取り組みも採択されている。リコーが取り組む、企業ドキュメントの効率的な読み取りを可能にする生成AI基盤開発がその一つだ。同社は、複合機開発を通して蓄積した独自の画像認識技術の活用を通し、さらなるデータ利活用というビジネスニーズに対応するマルチモーダル生成AI基盤開発に取り組んでいる。

自動運転の実現を目指すマルチモーダル基盤開発では、第1期でも採択されたTuringに加え、ウーブン・バイ・トヨタの「都市時空間理解に向けたマルチモーダル基盤モデル(City LLM)の開発」も新たに採択されている。

今年8月にスタートした基盤モデル開発第3期では24案件が採択され、2026年2月28日の開発終了に向けて取り組みが進む。第3期ではBIMデータ共有に必要な情報要件(IDS)を自動生成する基盤モデル開発など、ドメイン特化型モデルがさらに多様化している。生成AIを中核にする新たなエコシステムやビジネスの可能性を考える上でも、GENIACに注目する必要がありそうだ。

GENIAC 第3期 採択事業者一覧

前のページへ