IoT・AI
ユーザーの目的達成をサポートする自律型AIエージェントとは?
掲載日:2024/12/03
ガートナージャパンが発表した、2025年に重要なインパクトを持つ10の「戦略的テクノロジのトップ・トレンド」の一つに選ばれたのが「エージェント型AI」だ。今回はAIエージェントについて、従来のAIとの相違点や実用化に向けた動きなどを紹介していく。
AIエージェントは従来の生成AIと何が異なるのか
2022年にChatGPTがリリースされて以降、生成AIの活用が急速に広がり、その精度も進歩を続けている。文章のみならず、画像や音声、動画なども作成する生成AIは、これからのビジネスを大きく変えると言われている。
しかし、これらの生成AIは利用目的にかかわらず、人間が入力したプロンプト内容をもとに動作する「受動的」なAIだ。それに対してAIエージェントは、目的を完遂するために「自律的」に動く。
例として生成AIは、タスク分けされたものに対してプロンプトを入力して実行するが、AIエージェントでは最終的なゴールのみを指示するだけで、AIがタスク分けからゴールまでの工程を自動で生成する。
このAIエージェントの仕組みを応用することで、業務の自動化だけでなく、コストカットやスピードアップにつながる。また人間と異なり、常時稼働が可能な点も業務効率化に貢献できるだろう。
AIエージェントの仕組み
西見公宏著の『その仕事、AIエージェントがやっておきました。』によると、“AIエージェントは「自分が置かれている状況や条件」に適応しながら、自分自身の目標を達成するために動くシステム(P45より引用)”だと定義している。
生成AI同様にAIエージェントの核となっているのが大規模言語モデル(LLM)だ。ゴールまでの推論処理は、大量のデータとディープラーニング(深層学習)によって構築されている。
現在リリースされているAIエージェントの全てが同じではないが、大半は「個性(Profile)」、「記憶(Memory)」、「計画(Planning)」、「行動(Action)」が相互に作用することで動作すると言われる。
個性と記憶が相互作用することで、物事の記憶の優先順位を判断できるようになる。また過去の事例から、次にどう動くべきなのかも計画できる。そしてその計画に基づいた行動から得た結果は個性にフィードバックされ、より行動の精度が高められていく。
AIエージェントを構成するシステム
システムの側面からAIエージェントの仕組みを見ると、環境、センサー、意思決定メカニズム、アクチュエーターの四つで構成されているのが分かる。
ここでの環境とは、対象となる現実世界や仮想的なサイバー空間などの空間や状況のことだ。例えば自動車の市場調査の場面では、自動車の販売数などのデータが環境に当たる。
センサーは、データを収集するための赤外線センサー、マイクロフォンなどを指す。オンライン上でのデータ収集にはAPIなどがセンサーの役割を果たす。
意思決定メカニズムは、ここまでの「環境」と「センサー」の情報をもとに目標を達成するための最適な行動を決定づける中枢部分だ。
アクチュエーターは、ロボットアームなどの機器を動かすほか、デジタル空間での操作など環境に働きかけ実行を担う部分を指す。
AIエージェントの種類
AIエージェントは、データ分析やバーチャルアシスタントだけでなく、自動運転にも利用される。自動運転ではセンサーで周囲の状況を把握し、車間距離が詰まり過ぎないようにスピードを調整。万一歩行者が飛び出してきた場合でも、歩行者を検出してブレーキをかける動作を指示する。
その他、AIエージェントは病気にかかった人の症状を把握して適切な医療機関を紹介するなどの用途にも期待されている。
現在リリースされているAIエージェントには以下のようなものがある。
AutoGPT
AutoGPTは2023年に登場し、AIエージェントブームの火付け役の一つと言われている。ただし実験的な試みという段階のため、最終的なアウトプットの品質保証はされていないが、実際にAutoGPTを活用して自動的にWebサイトをつくるというデモがユーザーによって行われた。
AgentGPT
AgentGPTは、OpenAIのGPT3.5をベースに作られたAIエージェントだ。コーディング経験がない方でも、ライブラリから選択することでコーディングを行うことができる。そのほかにもニーズに合わせたカスタマイズが可能だ。
BabyAGI
BabyAGIは2024年4月にリリースされたばかりの注目のAIエージェントだ。ゴール達成に向け、自律的に考えてタスクを分解し実行するが、その際に短いソースコードでも処理が行われたことで注目を集めた。
AIエージェントはAGIへの進化の過程?
アメリカのBloomberg社が2024年7月に報じた内容によると、OpenAIはAGI(汎用人工知能Artificial General Intelligence)の実現に向けた5段階のロードマップを発表した。
同ロードマップによると、レベル1は対話型AI(Chatbots)、レベル2は推論型AI(Reasoners)、続いてレベル3は自律型AI(Agents)、レベル4はイノベーション型AI(Innovators)、そしてレベル5は組織型AI(Organizations)であるという。
つまり、AIエージェントは、AGIが実現するための3段階目に当たるということになる。AIエージェント自体の精度が向上した先には、人間のような汎用的な知能を持つAIにつながっていく可能性もありそうだ。