AI・DX

Vibe Codingの時限爆弾：AI生成コードの脆弱性論争と本番投入前セキュリティチェックリスト

2026年6月25日16分で読める

QUICK CHECK

本文を読みながら、自社で進めるべきか、相談前に何を整理するかを確認できます。

5分で自社の状況を診断する

GXO COLUMN

AI・DX

結論：AI生成コードは「動くか」ではなく「安全に本番に出せるか」で判断する

AIに自然言語で指示し、出てきたコードをそのまま組み込む「Vibe Coding」は開発スピードを大きく押し上げた。一方で、誰もセキュリティ観点でレビューしないまま本番へ出すと、脆弱性が時限爆弾のように残る。

2025年7月にVeracodeが公開した調査では、100を超える大規模言語モデルが生成したコードのうち 45%がOWASP Top 10の脆弱性を含み、セキュリティテストに不合格 だった（※Veracode「2025 GenAI Code Security Report」2025年7月30日）。しかも、モデルが新しく大きくなっても、この失敗率はほとんど改善していない。

つまりAI生成コードの安全性は「より良いモデルを待つ」では解決せず、本番投入の前に人と仕組みでチェックする体制をつくるしかない。

押さえるべき1点：Vibe Codingで問うべきは「このコードは動くか」ではなく「このコードをセキュリティレビューに通せるか」である。

この記事は、開発リーダー・情シス・経営層が、AI生成コードを本番投入する前に確認すべき論点とチェックリストを一次情報で整理する。AI開発・内製で起こりがちな失敗の全体像はバイブコーディングの危機（連載）、セキュリティ事故の類型はセキュリティ失敗図鑑で押さえられる。

FREE DOWNLOAD

中小企業のDX推進「失敗を防ぐ5ステップ」ガイドを無料でお送りします

多くの企業がつまずくポイントを着手順に整理した無料ガイド。相談する前に、自社の現在地と進め方を掴めます。

5ステップガイドを無料でダウンロード

なぜ「速いが危ない」のか：論争されている数字を一次情報で確認する

Vibe Codingをめぐる数字は誇張されて拡散しやすい。ここでは出典が辿れるものだけを扱う。

横にスクロールして確認できます

指摘	内容	出典
約45%が脆弱	100超のLLMが生成したコードの45%がOWASP Top 10脆弱性を含みセキュリティテスト不合格	※Veracode「2025 GenAI Code Security Report」2025年7月
言語差が大きい	Java 72%、C# 45%、JavaScript 43%、Python 38%が失敗	※同上
XSS防御の弱さ	クロスサイトスクリプティング（CWE-80）で86%が防御に失敗	※同上
速度と欠陥の比	AI活用開発者はコミット速度が3〜4倍だが、セキュリティ指摘の発生は約10倍	※Apiiro 2025（CSA研究ノート2026年4月で引用）
改善しない	モデルが大きく新しくなっても、安全なコードを書く能力は横ばい	※Veracode 2025

「45%」は実運用のリポジトリ全体ではなく、特定のコード補完タスクを評価した結果である点に注意は要る。それでも、放置すればAI生成コードは脆弱性が混入しやすい傾向があるという結論は動かない。Javaで72%、最も低いPythonでも38%が失敗しており、「うちはPythonだから大丈夫」とは言えない水準だ。

見落とされがちな第二のリスク：存在しないパッケージとサプライチェーン攻撃

脆弱性はコード本体だけにあるのではない。AIは 実在しないライブラリ名を平然と提案する ことがあり、これを悪用するのが「slopsquatting（スロップスクワッティング）」という新しいサプライチェーン攻撃だ。

仕組みはこうだ。

AIが実在しないパッケージ名をimport文やインストール手順として提案する
同じ間違いが別のプロンプトやモデルでも繰り返し再現される
攻撃者がその「よくハルシネーションされる名前」を先回りしてnpmやPyPIに登録する
開発者がAIの提案どおりインストールすると、悪意あるコードが実行される

学術研究やセキュリティ各社のレポートでは、AI生成コードのパッケージ参照に実在しないものが相当数含まれ、そのハルシネーションが別の実行でも再現性高く繰り返されることが報告されている（※slopsquattingに関する研究および Trend Micro「Slopsquatting: Hallucination in Coding Agents and Vibe Coding」2025年6月）。再現性が高いほど、攻撃者は「次にどの名前が誤提案されるか」を予測して罠を仕掛けやすくなる。

Vibe Codingのリスクは「変なコードが混じる」だけではない。「実在しない依存先を信じてインストールしてしまう」調達側のリスクでもある。

このため本番投入前チェックには、コード本体のレビューに加え、依存パッケージが実在し、信頼できる提供元か を検証する工程が要る。依存関係やコンポーネントの棚卸しは、脆弱性診断で扱う基本項目でもある。

FREE DOWNLOAD

AI導入チェックリスト（PoC 失敗要因 10項目）

情シス部門が PoC 前に押さえるべき失敗要因を10項目に整理した無料チェックリスト。

30分で相談するチェックリストをDL

AI生成コードを業務投入する前のセキュア・プロンプト＆レビュー体制

「AIに任せる」のは生成までで、安全性の担保は人と仕組みの仕事だ。投入前の体制は、おおまかに3層で考える。

第1層：プロンプト段階で前提を与える（セキュア・プロンプト）

生成の入口で、セキュリティ要件を明示する。

入力値のバリデーションとエスケープを必須にする（XSS、SQLインジェクション対策）
認証・認可の判定をクライアント側ではなくサーバ側で行う
秘密情報をコードやログに直書きしない
依存パッケージは実在・著名・メンテ継続中のものに限定し、提案理由を併記させる

ただし、指示しても守られない前提で次の層を置く。モデルは指示しても安全なコードを安定して書くとは限らないからだ。

第2層：自動チェックをパイプラインに組み込む（DevSecOps）

人手レビューの前に、機械でふるいにかける。

SAST（静的解析）で危険なパターンを検出する
SCA（ソフトウェアコンポーネント解析）で依存パッケージの脆弱性と実在性を確認する
シークレットスキャンで鍵やトークンの混入を止める
DAST（動的解析）で稼働中の挙動を検証する

これらをCI/CDに常設し、不合格なら本番に進めない関門にする。仕組み化の設計は、DevSecOpsによるセキュア開発体制の中核論点である。

第3層：人によるレビューと責任の明確化

最後は人が見る。特に次の点はAIに任せきれない。

ビジネスロジックの妥当性（権限の境界、金額・在庫・個人情報の扱い）
「なぜこの実装なのか」を説明できるか（説明責任）
生成コードの著作権・ライセンス上の懸念

AI生成コードの弱点は、書いた本人が「なぜ動くか」を説明できないまま本番に出てしまうことだ。レビューは正しさだけでなく、チームがそのコードを保守・説明できる状態か を確認する場でもある。

本番投入前チェックリスト

AI生成コードを業務システムへ出す前に、次を確認する。1つでも「いいえ」があれば、本番投入は保留する。

横にスクロールして確認できます

区分	確認項目	判定
入力処理	外部入力にバリデーションとエスケープが実装されているか	☐
認証認可	権限判定をサーバ側で行い、画面非表示だけで隠していないか	☐
秘密情報	APIキー・パスワード・トークンがコードやログに直書きされていないか	☐
依存関係	全パッケージが実在し、著名で、メンテされ、脆弱性がないか（SCA済か）	☐
静的解析	SASTで重大・高リスクの指摘が0件か	☐
動的検証	DASTまたは手動テストで主要な攻撃に耐えるか	☐
ログ	不正アクセスや異常を後から追える監査ログが出力されるか	☐
説明責任	担当者が「なぜこの実装か」を説明でき、保守できるか	☐
ライセンス	生成コードや依存物のライセンス・著作権に懸念がないか	☐
復旧	障害・脆弱性発覚時に切り戻せる手順とバックアップがあるか	☐

このチェックはVibe Codingを禁止するためではなく、速さを活かしつつ本番審査に耐える状態に整える ためのものだ。PoCの段階から同じチェックを回せば本番化で手戻りしにくい。PoCがそのまま本番に進められるかは、PoC本番化レディネス診断で確認できる。

よくある質問（FAQ）

Q. Vibe Codingは禁止すべきですか。 A. 禁止ではなく、レビューと自動チェックを前提に運用するのが現実的です。速度の利点は大きく、問題は「無検証で本番に出す」運用にあります。チェック体制を先に整えるのが近道です。

Q. 「AI生成コードの45%が脆弱」は本当ですか。 A. Veracodeが2025年7月に公開した調査で、100超のモデルが生成したコードの45%がOWASP Top 10脆弱性を含み不合格でした（※Veracode 2025 GenAI Code Security Report）。実運用全体ではなく特定タスクの評価値ですが、無視できない水準です。

Q. 新しいモデルを使えば安全になりますか。 A. 同調査は、モデルが大きく新しくなっても安全なコードを書く能力はほぼ横ばいだと指摘しています。モデル更新では解決せず、レビューと自動チェックで担保する前提が必要です。

Q. slopsquattingへの対策は。 A. SCAで依存パッケージの実在性と脆弱性を機械的に確認し、提供元・実績・メンテ状況を人が確認します。AIが提案した名前を鵜呑みにインストールしないことが基本です。

Q. 内製チームだけで体制を組めますか。 A. SAST/SCA/DASTの常設や監査ログ設計は初回の立ち上げに知見が要ります。最初の体制設計を外部と整え、運用は内製に移すと定着しやすいです。