Agentic AI(自律的に目標を解釈し、複数ステップのタスクを計画・実行する AI)の議論は 2025 年後半から急速に加速し、2026 年の情シス経営層の最大の論点のひとつになっている。一方で「自社は今どの段階にあるのか」を客観評価する物差しは、各社ベンダーの売り文句ごとに揺れている。
本記事では、GXO が企業の情シス・事業部門のヒアリングから整理した Agentic AI 導入成熟度モデル(Level 0〜5) を提示する。これは GXO 独自の定義 であり、Gartner の AI Maturity Model や Forrester の AI Agent Wave との対応関係も併記する。自社の現在地と、次段階への移行要件を確認いただきたい。
1. 成熟度モデルの前提と 6 段階の全体像
成熟度モデルは「高いほど優れている」という単純な話ではない。業種・規模・リスク許容度 によって、到達すべき段階は異なる。金融・医療のように Level 2〜3 で長く運用するのが合理的なケースもあれば、EC・SaaS のように Level 4〜5 を早期に目指すケースもある。
Level 0〜5 の全体像
| Level | 状態 | 典型的な実装 | 意思決定者 |
|---|---|---|---|
| 未検討 | 検討すら開始していない | 情シスも経営も未着手 | |
| 1 | 試用 | ChatGPT / Copilot の個人利用 | 現場が個別に導入 |
| 2 | 部門限定 | FAQ / 要約 / 議事録 | 情シスまたは業務部門長 |
| 3 | 業務統合 | RAG + 基幹データ連携、Single-Agent | CIO / CDO |
| 4 | マルチエージェント | 複数エージェントの分業、Human in the Loop | CIO / 事業部長 |
| 5 | 自律運用 | エージェント自律、人間は監査のみ | 経営全体 |
各 Level の意思決定コスト
- Level 0 → 1:ほぼ発生しない(個人利用)
- Level 1 → 2:数百万〜数千万円
- Level 2 → 3:数千万〜1 億円
- Level 3 → 4:1 億〜数億円
- Level 4 → 5:数億円〜、ガバナンス再設計必須
2. Level 0〜2:試用から部門限定まで
Level 0:未検討
- 状態:情シスも経営も、Agentic AI を議題に上げていない
- 典型企業:中小企業、規制業種の保守的な企業
- 次段階への移行要件:経営層の関心喚起、情シス担当の情報収集
Level 1:試用
- 状態:個人が ChatGPT / Microsoft Copilot / Gemini を業務外または業務補助で利用
- 典型的な課題:シャドー利用、機密情報の外部送信リスク
- 典型的な壁:社内ポリシー不在、ライセンス管理未整備
- 投資規模:数十万円(個人ライセンス)
- 次段階への移行要件:全社ポリシー策定、法人ライセンス一括契約、利用ガイドライン
Level 2:部門限定
- 状態:特定部門で FAQ、議事録要約、資料作成補助などに限定利用
- 典型的な実装:Microsoft 365 Copilot、ChatGPT Enterprise、Gemini for Workspace
- 典型的な壁:効果測定不在、「便利だが経営効果が見えない」状態
- 投資規模:数百万〜数千万円 / 年
- 次段階への移行要件:KPI 設計、基幹データ連携の要件整理、RAG 基盤の設計
3. Level 3:業務統合(Single-Agent × 基幹データ)
業務統合段階では、AI エージェントが 基幹システムのデータを参照・更新 する領域に入る。ここからは情シスの本格的な設計・ガバナンスが必要になる。
典型的な実装
- 社内 RAG(過去の議事録、契約書、社内規程を参照)
- 見積書の自動ドラフト(CRM データを参照)
- カスタマーサポートの一次対応(FAQ + 過去履歴)
- 財務レポートの下書き生成
典型的な壁
- データ品質:基幹データが散逸しており、エージェントが誤った情報で回答
- 権限統制:誰がどの文書を検索・利用できるか、ABAC / RBAC の設計
- ハルシネーション監視:回答の真正性を検証する仕組み不在
- ROI 測定:時間削減は測れるが、品質改善の測定は難航
投資規模
3,000 万〜1 億円(基幹データ整備 + RAG 構築 + 権限基盤)
次段階への移行要件
- 単一エージェントの運用が 6〜12 ヶ月安定稼働
- 評価データセット、監査ログが整備
- マルチエージェント化の業務設計(どのエージェントに何を任せるか)
4. Level 4:マルチエージェント × Human in the Loop
複数のエージェントが分業・連携し、計画エージェント → 実行エージェント → レビューエージェント のような役割分担が走る段階。ただし最終決裁は必ず人間が行う Human in the Loop(HITL)が前提となる。
典型的な実装
- 営業提案:情報収集エージェント + 提案書作成エージェント + 添削エージェント
- 調達:仕様整理エージェント + 相見積依頼エージェント + 評価エージェント
- IT 運用:障害検知エージェント + 原因分析エージェント + 復旧提案エージェント
- マーケティング:トレンド分析 + コンテンツ生成 + 配信最適化
典型的な壁
- エージェント間の責任分界:どのエージェントのミスが原因かの追跡
- コスト膨張:エージェント数に比例して LLM 呼び出し回数が増加
- 監査の難化:複雑な連携ログの解釈
- 人間の学習コスト:どのタイミングで介入するかの判断
投資規模
1 億〜数億円(エージェントフレームワーク + 統合基盤 + 監査環境)
次段階への移行要件
- マルチエージェント運用が 12 ヶ月以上安定
- 自律実行してもリスクが許容範囲に収まる領域の特定
- 全社ガバナンス体制(AI 監査委員会、倫理規程)の整備
5. Level 5:自律運用(監査のみ)
エージェントが 目標を受け取り、計画・実行・評価・修正 まで自律的に回す段階。人間は異常検知と監査のみに関与する。現時点で本格的に Level 5 に到達している企業は、国内ではごく一部。
典型的な実装(想定)
- 在庫最適化:需要予測 + 発注判断 + 納期調整を自律実行
- 広告運用:予算配分 + クリエイティブ生成 + 配信最適化の連続ループ
- ソフトウェア保守:不具合検知 + 修正提案 + テスト実行 + リリース判定
- コールセンター:一次対応〜解決まで人間介入ゼロ(特定カテゴリ限定)
典型的な壁
- ガバナンスの再設計:経営責任・法的責任の整理
- AI 倫理・透明性:説明責任の担保
- セキュリティ:エージェントが攻撃対象になる
- 社会的受容性:顧客・従業員の心理的受容
投資規模
数億円〜、既存 IT 予算の 10〜30% を恒常配分
次段階は「存在しない」
Level 5 到達後は、さらに高度な段階への移行 ではなく、適用領域の拡張 とリスク管理の深化が課題となる。
6. 業界標準フレームとの対応、業種別分布、段階診断
Gartner / Forrester との対応
本モデルは業界標準フレームとの対応を意識している(各フレームの正式定義は各社の一次情報を参照されたい)。
| GXO Level | 対応する考え方(筆者整理) |
|---|---|
| Level 0〜1 | Gartner「AI 非採用〜試験的採用」段階に対応 |
| Level 2 | Gartner「Generative AI 採用初期」に対応 |
| Level 3 | Forrester「Single Agent」段階に対応 |
| Level 4 | Forrester「Multi-Agent / HITL」段階に対応 |
| Level 5 | Forrester「Autonomous Agent」段階に対応 |
業種別の一般的な段階分布(目安)
- IT / SaaS:Level 3〜4 が中心、先端企業は Level 5 を試験中
- 製造:Level 2〜3 が中心、工場エッジ展開で伸び悩むケース多
- 金融:Level 2〜3 が中心、規制対応で Level 4 への移行に慎重
- 医療:Level 1〜2 が中心、規制・倫理で Level 3 以降は限定的
- 建設:Level 1〜2 が中心、文書の紙比率が RAG 導入の壁
- 小売 / EC:Level 3〜4 が広がりつつある
自社段階の診断設問
以下を情シス責任者で議論することで、自社の現在地が見えてくる。
- 全社で AI 利用ポリシーが文書化されているか
- 基幹データと RAG の連携が 1 件以上稼働しているか
- エージェント間の連携ログを監査できる体制があるか
- AI 倫理委員会または相当する組織が存在するか
- AI 投資の経営計画への組み込みがあるか
- AI による自律実行を許容する業務領域が定義されているか
段階移行の優先順位
多くの企業は Level 2 → Level 3 の移行で止まる。ここを超えるには、経営判断 + 基幹データ整備 + ガバナンス設計 の 3 つを同時に進める必要がある。単一の PoC 追加では壁を越えられないのが実情である。
まとめ
Agentic AI は「最新のモデルを導入すれば進む」ものではなく、基幹データ・ガバナンス・業務設計 の成熟度に律速される。自社が Level 0〜5 のどこにあるか、次段階への移行要件は何かを客観的に把握することが、2026 年の情シス投資判断の出発点となる。
GXO では、自社の Agentic AI 成熟度 無料診断 を受け付けております。貴社の利用状況・基幹データ・ガバナンス体制をヒアリングし、Level 0〜5 の現在地診断と、次段階移行に向けたロードマップをご提案いたします。業種・規模に応じた到達目標の設定から、段階移行の優先施策までをご一緒に整理いたします。
GXO実務追記: レガシー刷新で発注前に確認すべきこと
この記事のテーマは、単なるトレンド紹介ではなく、現行調査、刷新範囲、段階移行、ROI、ベンダー切替リスクを決めるための検討材料です。検索で情報収集している段階でも、発注前に次の観点を整理しておくと、見積もりのブレ、手戻り、ベンダー依存を減らせます。
まず決めるべき3つの論点
| 論点 | 確認する内容 | 未整理のまま進めた場合のリスク |
|---|---|---|
| 目的 | 売上拡大、工数削減、リスク低減、顧客体験改善のどれを優先するか | 成果指標が曖昧になり、PoCや開発が終わっても投資判断できない |
| 範囲 | 対象部署、対象業務、対象データ、対象システムをどこまで含めるか | 見積もりが膨らむ、または重要な連携が後から漏れる |
| 体制 | 自社責任者、現場担当、ベンダー、保守運用者をどう置くか | 要件確認が遅れ、納期遅延や品質低下につながる |
費用・期間・体制の目安
| フェーズ | 期間目安 | 主な成果物 | GXOが見るポイント |
|---|---|---|---|
| 事前診断 | 1〜2週間 | 課題整理、現行確認、投資判断メモ | 目的と範囲が商談前に整理されているか |
| 要件定義 / 設計 | 3〜6週間 | 要件一覧、RFP、概算見積、ロードマップ | 見積比較できる粒度になっているか |
| PoC / MVP | 1〜3ヶ月 | 検証環境、効果測定、リスク評価 | 本番化判断に必要な数値が取れるか |
| 本番導入 | 3〜6ヶ月 | 本番環境、運用設計、教育、改善計画 | 導入後の運用責任と改善サイクルがあるか |
発注前チェックリスト
- [ ] 現行システムの機能、利用部署、データ、外部連携を一覧化したか
- [ ] 保守切れ、属人化、障害頻度、セキュリティリスクを金額換算したか
- [ ] 全面刷新、段階移行、SaaS置換、リホストの比較表を作ったか
- [ ] 移行中に止められない業務と、止めてもよい業務を分けたか
- [ ] 既存ベンダー依存から抜けるためのドキュメント/コード引継ぎ条件を決めたか
- [ ] 稟議で説明する投資回収、リスク低減、保守費削減の根拠を整理したか
参考にすべき一次情報・公的情報
上記の一次情報は、社内稟議やベンダー比較の根拠として使えます。一方で、公開情報だけでは自社の現行システム、業務フロー、データ状態、予算制約までは判断できません。記事で一般論を把握した後は、自社条件に落とした診断が必要です。
GXOに相談するタイミング
次のいずれかに当てはまる場合は、記事を読み進めるだけでなく、早めに相談した方が安全です。
- 見積もり依頼前に、要件やRFPの粒度を整えたい
- 既存ベンダーの提案が妥当か第三者視点で確認したい
- 補助金、AI、セキュリティ、レガシー刷新が絡み、判断軸が複雑になっている
- 社内稟議で費用対効果、リスク、ロードマップを説明する必要がある
- PoCや診断で終わらせず、本番導入と運用改善まで進めたい
Agentic AI 導入成熟度モデル 2026|Level 0-5 の企業段階別評価と段階移行ロードマップを自社条件で診断したい方へ
GXOが、現状整理、RFP/要件定義、費用対効果、ベンダー比較、導入ロードマップまで実務目線で確認します。記事の一般論を、自社の投資判断に使える形へ落とし込みます。
※ 初回相談では営業資料の説明よりも、現状・課題・判断材料の整理を優先します。
関連記事
- AI エージェントが決済・送金まで行う時代へ|Stripe Agentic Commerce + Treasury — Level 4-5 の次段階・決済まで自走する設計
- AI エージェントは企業システムの標準機能へ|Gartner 40% 予測 — 業界全体の標準化フェーズ
- 生成 AI スケール失敗 5 落とし穴|McKinsey 2025 — Level 2 → 3 の壁を越える経営視点