GXO株式会社の稲葉です。
「年1回の脆弱性診断をやっているから大丈夫」
その前提が、いま静かに崩れ始めています。
スタンフォード大学の研究チームは、CTFでも既知CVEの再現でもない、実在の大規模ネットワーク環境で、プロのペンテスター(侵入テストの専門家)10名とAIエージェントを同条件で比較しました。
結果は衝撃的です。新しいAIエージェント枠組み「ARTEMIS」は、10人中9人のプロを上回り、総合2位に入りました。
この研究が示すのは「AIがすごい」という話ではありません。
攻撃の前提が『並列・常時・低コスト』に変わった、という事実です。
1. 何が「現実的」で、何がすごいのか
この比較が強い理由は、舞台が『現場』だったことです。
対象は約8,000ホスト/12サブネットを持つ大学ネットワーク
10名のプロと、複数の既存AIエージェント、新枠組みARTEMISを比較
成果は「提出した脆弱性レポートの妥当性(Valid率)」「重大度・複雑性」などで評価し、順位化
ARTEMISは9件の有効な脆弱性を提出し、Valid率82%で総合2位。さらに「$18/時の構成(別構成は$59/時)」など、コスト面でも比較されました。
参考:Stanford University, Carnegie Mellon University, Gray Swan AI『Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing』
https://arxiv.org/abs/2512.09882

2. AIが勝ちやすい『本当の理由』
論文が示すARTEMISの強みは、ハッキングの魔法ではなく「運用能力」です。
強み①:探索が体系的で、抜け漏れが少ない
ARTEMISは「systematic enumeration(体系的な列挙・調査)」を強みとして挙げられています。
現場のセキュリティ事故の多くは「想定外の穴」ではなく「棚卸し漏れ」から始まります。
強み②:並列で同時進行できる(『人員』が増える)
ARTEMISは怪しい兆候を見つけると、サブエージェントを立ち上げて並列に調査できます。人間は同時に追える仮説に限界があるため、ここが構造的に不利になります。
強み③:忘れない/疲れない/粘る
「気づいたけど後でやろう」が、そのまま放置される。
現場ではよくある話ですが、AIはTODOとログで保持し続け、時間の限り探索を継続できます。
強み④:GUIに依存せず、CLIで突き進める場面がある
論文中では、古い管理インターフェースの事例として、ブラウザが弾く古いHTTPS周りを、CLIで回避して脆弱性に到達した例が紹介されています(※研究文脈での比較事例です)。
3. ただしAIは万能ではない(ここを誤解しない)
この研究は時間制約など現実より短い条件もありますが、それでも「低コストで並列に回せる攻撃が成立する」こと自体が前提転換です。 arXiv
論文は、AIの弱点も明確に書いています。
GUI操作が絡むタスクが苦手(ブラウザ経由の操作など)
偽陽性(false positive)が増えやすい
実験条件として、参加時間が短い等の制約もある(現実のペンテストは1〜2週になることが多い、と言及)
つまり結論は「AIが人間を駆逐」ではありません。
『AIを前提にした攻撃が現実的なコストで成立し始めた』が本質です。
4. 企業が今すぐ見直すべき『セキュリティの前提』
この研究が突きつけるのは、次の前提転換です。
前提転換①:年1回の点検 → 『常時の棚卸し』へ
攻撃側が並列・常時化するなら、防御側も最低限、攻撃面(Attack Surface)を常に把握する必要があります。
前提転換②:「脆弱性」より「設計と運用の破綻」が問題になる
よくあるリスクは、派手なゼロデイよりも——
放置サブドメイン/テスト環境の残骸
更新停止CMS/古い管理画面
認証・権限設計の曖昧さ
ログが残らない・追えない運用
こうした『構造』です。構造が原因なら、部分改修を繰り返すほどコストが膨らみ、最終的に刷新(リニューアル)が合理的になります。
前提転換③:見つける → 優先順位を付けて直す(全部直さない)
重要なのは「全部直す」ではなく、経営インパクト順に直すこと。
AI時代は特に、棚卸しと優先順位付けがないと、対策が永久に終わりません。
5. GXO株式会社として支援できること
GXO株式会社では、AI時代の攻撃前提に合わせて
公開資産・攻撃面の棚卸し(可視化)
リスクの優先順位付け(経営に伝わる形で整理)
『直す』だけで限界がある領域は、セキュリティ前提でのシステムリニューアル(刷新)まで
を一気通貫で支援します。
まとめ
この研究が示したのは「AIすごい」ではなく、
攻撃の生産性が、構造的に上がってしまったという現実です。
だからこそ最初の一手は、最先端の対策導入ではなく——
自社の攻撃面を『棚卸しして、優先順位を付けること』です。

【無料】公開攻撃面(Attack Surface)簡易棚卸しのご相談
AI時代の攻撃は「並列・常時化」しています。
まずは貴社の公開資産・攻撃面を整理し、優先順位を付けるところからご一緒します。
フォーム送信後、1〜2営業日以内に担当よりご連絡します。
いきなり提案・営業ではなく、現状の整理から実施します
NDAが必要な場合も対応可能です
「リニューアル前にセキュリティ要件を固めたい」相談も歓迎
▶ お問い合わせはこちら:https://gxo.co.jp/contact/
この記事についてもっと詳しく知りたい方へ
GXOでは、サイバーセキュリティに関する詳しい資料を無料で提供しています。導入事例や成功事例、具体的な導入手順を詳しく解説しています。




