AIチャットボット

AI導入で成果が出ない原因は「データ品質」かもしれない｜AISIガイドブックに学ぶ社内データ整備チェックリスト【2026】

Q: Q1. AIを入れれば、多少データが整っていなくても、賢く処理してくれるのではないでしょうか？

A. 実は逆です。AI は与えられたデータをもとに出力するため、品質の低いデータはそのまま（むしろ影響が大きくなって）出力に表れます。「Garbage In, Garbage Out」は AI 時代でも変わりません。

Q: Q2. データ品質の改善は、どこから手を付ければよいでしょうか？

A. 「AI に使いたいデータ」を最初の対象にするのが現実的です。全社のデータを一気に整えるのではなく、AI チャットボットや分析で使う範囲から、最新性・重複・表記ゆれを点検していきます。

Q: Q3. RAG の精度が低いのですが、モデルを変えれば直りますか？

A. モデルの変更では直らないことが多くあります。参照している社内文書が古い・重複している・画像 PDF になっているなどの場合は、まずデータ側を整えるほうが効果的です。

Q: Q4. データ品質の「6 観点」は、全部やる必要がありますか？

A. 必須ではありません。まずは 最新性・一意性（重複なし）・一貫性（表記の統一）の 3 点から始めると、AI の出力品質が目に見えて変わりやすくなります。

Q: Q5. 画像でスキャンした PDF は、AI で使えないのでしょうか？

A. そのままでは検索・参照の精度が下がります。テキスト化（OCR など）して、AI が読める形にすると精度が上がります。データ整備の「構造化」ステップに当たります。

Q: Q7. 機密情報や個人情報を AI に渡しても大丈夫でしょうか？

A. 渡してよいデータと渡してはいけないデータを区別することが前提です。RAG を組む際は、参照する範囲の権限設計が必要になります。セキュリティ設計とセットで考えておきたい論点です。

Q: Q10. 結局、AI 導入の前に一番やっておくとよいことは何でしょうか？

A. 「AI に使いたいデータを棚卸しし、最新・重複なし・表記統一の状態に整える」ことです。AI モデルの検討より前に、ここに手を付けることが、成果への近道になります。 ---

2026年5月23日24分で読める

QUICK CHECK

本文を読みながら、自社で進めるべきか、相談前に何を整理するかを確認できます。

5分で自社の状況を診断する

GXO COLUMN

AI・機械学習

「高性能な AI を導入したのに、思ったほど成果が出ない」――その原因は、AI モデルではなく社内データにあることが少なくありません。 AI チャットボットを入れたが的外れな回答が多い、RAG（社内文書を検索して答える仕組み）を作ったが古い情報を返す、AI で分析しても精度が出ない――こうした「期待外れ」の多くは、AI に与えているデータの品質が低いことに原因があります。

この課題に正面から取り組んだのが、**AIセーフティ・インスティテュート（AISI）が 2026 年 5 月に公開した「データ品質マネジメントガイドブック（第1.02版）」です（AISI: データ品質マネジメントガイドブック）。AISI は、「データは AI の基盤であり、適切なデータを学習・処理することで適切な出力が得られる。逆に、データが適切でなければ、適切な出力を得ることは難しく、プロセス全体の信頼が損なわれる」**という考え方を示しています。つまり、データ品質こそが「使える AI」の土台だということです。

本記事では、この AISI ガイドブックを一次ソースに、なぜ AI の成否はデータ品質で決まるのか、「データ品質が低い」とは具体的にどういう状態か、データ品質の 6 つの観点、AI 導入前の社内データ整備チェックリスト、データ整備の進め方、FAQ を整理します。AI 導入を検討している方、あるいは「導入したが期待どおりに動かない」と感じている中堅・中小企業の方にとって、最初に手を付けるとよい場所が見えてくるはずです。

なぜAIの成否は「データ品質」で決まるのか
「データ品質が低い」とは具体的にどういう状態か
データ品質の6つの観点
AISIガイドブックに学ぶデータ品質マネジメント
RAG・AIチャットボットが期待どおり動かない理由
AI導入前の社内データ整備チェックリスト
データ整備の進め方：棚卸しから運用まで
国内・国際の文脈：経産省ガイドライン・NIST
よくある質問（FAQ 10問）
参考一次ソース
まとめ
あわせて読みたい

なぜAIの成否は「データ品質」で決まるのか

AI、とくに生成 AI や RAG、機械学習モデルは、与えられたデータをもとに出力を生み出します。料理にたとえるなら、AI モデルは「腕の良い料理人」、データは「食材」です。どれだけ腕が良くても、食材が古かったり傷んでいたりすれば、おいしい料理にはなりません。

AISI のガイドブックは、この関係を明確にしています。**「データは AI の基盤」**であり、適切なデータを学習・処理してこそ、適切な出力が得られます。逆にいえば、データが適切でないまま高性能なモデルを使っても、良い結果は得られず、むしろ AI の出力に対する信頼そのものが損なわれてしまいます。

「入れたデータの質が、出てくる結果の質を決める」

情報処理の世界には 「Garbage In, Garbage Out（質の低いデータからは、質の低い結果しか得られない）」 という古くからの言葉があります。AI 時代になって、この原則はいっそう重要になりました。AI は大量のデータを高速に処理するため、品質の低いデータの影響も大きくなって出力に表れるからです。

「モデルを良くする」前に「データを整える」

AI 導入がうまくいかないとき、多くの企業は「もっと高性能なモデルに変えよう」「プロンプトを工夫しよう」と考えます。けれども、根本の原因がデータ品質にある場合、モデルを変えても解決しません。AISI ガイドブックが示すように、まず データの品質を確保することが、信頼できる AI（trustworthy AI）への近道になります。

AI ASSESSMENT

PoC の前に「そもそも使えるか」を30分で見極めませんか？

対象業務、データ、権限、ログ、運用責任を確認し、PoC前に失敗要因と本番化条件を整理します。

30分壁打ちを予約

「データ品質が低い」とは具体的にどういう状態か

「データ品質が低い」と言われても、ピンと来ないかもしれません。中堅・中小企業の現場でよく見られる「品質の低いデータ」の状態を、具体的に挙げてみます。

古い情報が混ざっている：更新されていない価格表、退職した担当者の連絡先、廃番になった商品の情報
重複している：同じ顧客が複数登録されている、同じ文書が複数バージョン存在する
どれが最新版か分からない：「最終版」「最終版2」「本当の最終版」が並ぶファイル
表記がゆれている：「株式会社GXO」「(株)GXO」「ＧＸＯ」が混在し、同じものと認識されない
欠けている：必須項目が空欄、一部のデータだけ情報が足りない
誤りがある：入力ミス、桁違い、単位の取り違え
どこにあるか分からない：データが各部署のフォルダ・個人 PC・紙に散らばっている
アクセス権限が不明：誰がそのデータを見てよいのか決まっていない

これらの状態のまま AI に学習・参照させると、AI は 古い情報・重複・誤りをそのまま「正しい」として扱い、的外れな回答や誤った分析を生み出してしまいます。「AI が変な答えを返す」の裏には、たいていこうしたデータの問題があります。

データ品質の6つの観点

データ品質は、いくつかの「観点（次元）」で評価できます。データマネジメントの分野で一般的に使われる 6 つの観点を、社内データにあてはめて整理します。

横にスクロールして確認できます

観点	意味	低いとどうなるか
正確性（Accuracy）	データが事実と合っているか	誤った情報をもとに AI が判断する
完全性（Completeness）	必要な情報が欠けていないか	一部しか分からず、判断材料が不足する
一貫性（Consistency）	表記・形式がそろっているか	同じものが別物と認識される（表記ゆれ）
最新性（Timeliness）	情報が最新に保たれているか	古い情報をもとに AI が回答する
一意性（Uniqueness）	重複がないか	同じデータが二重に扱われ、集計がずれる
妥当性（Validity）	決められた形式・範囲に収まっているか	不正な値が紛れ込み、処理が乱れる

中堅・中小企業が、いきなり 6 観点すべてを完璧にする必要はありません。ただ、AI に渡すデータについて 「最新か」「重複していないか」「表記がそろっているか」 の 3 点だけでも点検しておくと、AI の出力品質は大きく変わってきます。

FREE DOWNLOAD

AI導入チェックリスト（PoC 失敗要因 10項目）

情シス部門が PoC 前に押さえるべき失敗要因を10項目に整理した無料チェックリスト。

30分で相談するチェックリストをDL

AISIガイドブックに学ぶデータ品質マネジメント

AISI の「データ品質マネジメントガイドブック」は、副題に **「データとAIの価値を最大化する」**を掲げています。ポイントは、データ品質を 「一度きれいにして終わり」ではなく、継続的にマネジメント（管理）するという考え方にあります。

データ品質は「点」ではなく「プロセス」

データは、業務が動く限り日々増え、変わっていきます。そのため、一度クレンジング（整理・修正）しても、放っておけばまた品質は下がっていきます。AISI ガイドブックは、データ品質を 継続して確保するための考え方を示しています。これは、システムのセキュリティを「作って終わり」ではなく運用し続けるのと同じ発想です。

「目的」に応じた品質を考える

すべてのデータを最高品質にする必要はありません。「そのデータを何に使うのか（目的）」に応じて、必要な品質を見極めることが現実的です。AI チャットボットの回答根拠にするデータは最新性と正確性が重要、分析用のデータは完全性と一貫性が重要、といったように、用途によって重点が変わります。

信頼できるAIの土台としてのデータ品質

AISI は、AI の安全性・信頼性（trustworthy AI）の実現を目的とする組織です。その AISI が「データ品質マネジメント」をガイドブックとしてまとめた意味は、とても大きいといえます。データ品質は、もはや IT 部門だけの細かい話ではなく、AI を安全に・有効に使うための経営課題だということを示しています。

RAG・AIチャットボットが期待どおり動かない理由

中堅・中小企業で AI を導入する代表的な形が、社内文書を AI に検索・参照させて回答する RAG（検索拡張生成）や AI チャットボットです。これらが「期待どおりに動かない」とき、原因の多くはデータ側にあります。

1. 古い文書を参照してしまう

社内に古いマニュアルや旧価格表が残っていると、RAG はそれを「正しい情報」として参照し、古い回答を返してしまいます。最新版の管理ができていないことが原因です。

2. 重複・矛盾する文書がある

同じテーマで複数の文書があり、内容が食い違っていると、AI はどちらを信じればよいか分からず、回答が安定しなくなります。

3. 文書がAIに読める形になっていない

スキャンしただけの PDF（画像）、表が崩れた Excel、構造のない長文――こうした AI が解釈しにくい形式のデータは、検索・参照の精度を下げてしまいます。

4. アクセスしてよい範囲が整理されていない

どの文書を AI に渡してよいのか（機密情報を含まないか）が整理されていないと、安全に RAG を組めません。これは AIエージェント導入前のセキュリティ設計とも直結する論点です。

「AI チャットボットの精度を上げたい」と思ったら、まず参照させる社内データを整える――これが、遠回りに見えて最短の道になることが多いのです。

AI導入前の社内データ整備チェックリスト

AI（とくに RAG・チャットボット）を導入する前に、社内データについて確認しておきたい項目を整理しました。

■ 在処と範囲（どこに何があるか）
□ 1. AIに使いたいデータが「どこにあるか」を把握できているか
□ 2. 各データの「最新版」がどれか分かるようになっているか

■ 品質（使える状態か）
□ 3. 古い情報・廃止された情報が混ざっていないか
□ 4. 重複・矛盾する文書が整理されているか
□ 5. 表記ゆれ（社名・商品名・用語）がそろっているか
□ 6. AIが読める形式か（画像PDFでなくテキスト、崩れていない表）

■ 権限と安全（渡してよいか）
□ 7. AIに渡してよいデータ／渡してはいけないデータが区別されているか
□ 8. 機密情報・個人情報の取り扱い方針が決まっているか

■ 運用（保ち続けられるか）
□ 9. データを最新に保つ更新フロー・担当が決まっているか
□ 10. データ品質を定期的に点検する仕組みがあるか

このチェックで「できていない」が多いほど、AI を入れても期待どおりに動きにくくなります。逆にいえば、ここを整えるだけで AI の成果は大きく変わってきます。

データ整備の進め方：棚卸しから運用まで

データ品質の改善は、次のステップで進めると現実的です。

ステップ1：棚卸し（何があるか把握する）

まず、AI に使いたいデータが どこに・どんな形で・どれだけあるかを洗い出します。各部署のフォルダ・基幹システム・個人 PC・紙――散らばっている実態を可視化します。

ステップ2：クレンジング（整理・修正する）

古い情報の削除、重複の統合、表記ゆれの統一、欠損の補完、誤りの修正を行います。「使う目的」に照らして、必要な品質まで整えるのがポイントです。すべてを完璧にしようとすると終わらないので、優先度をつけて進めます。

ステップ3：構造化（AIが使える形にする）

画像 PDF をテキスト化する、表を整える、文書に見出し・タグをつけるなど、AI が検索・参照しやすい形に整えます。RAG の精度は、この構造化で大きく変わります。

ステップ4：権限・安全の整理

AI に渡してよいデータと、渡してはいけないデータ（機密・個人情報）を区別します。これは AI開発の発注前チェックとも関わってきます。

ステップ5：運用（保ち続ける）

データは放っておくとまた品質が下がっていきます。最新に保つ更新フロー・担当・点検の仕組みを決め、品質を継続してマネジメントしていきます。AISI ガイドブックが強調する「継続性」が、ここに当たります。

国内・国際の文脈：経産省ガイドライン・NIST

データ品質と AI の関係は、国内外のガイドラインでも重視されています。

経済産業省・総務省「AI事業者ガイドライン」

国内では、総務省・経済産業省の 「AI 事業者ガイドライン」 が、AI の開発・提供・利用にあたって、安全性・公平性・透明性などの原則を示しています（経済産業省: AI事業者ガイドライン）。適切なデータの取り扱いは、これらの原則を支える土台になります。

NIST「AI Risk Management Framework」

米 NIST の 「AI Risk Management Framework（AI RMF）」 も、AI のリスク管理において、データの質・代表性・バイアスの管理を重要な要素として扱っています（NIST AI RMF）。

データ品質は「AI活用の前提条件」へ

AISI ガイドブック、経産省ガイドライン、NIST AI RMF――いずれも、質の高いデータが、信頼できる AI の前提であることを共通して示しています。AI 投資の効果を出すには、モデル選びと同じくらい、データ整備への投資が大切です。

実務判断のポイント

この記事は、経営者、DX責任者、情シス、業務責任者向けです。現状棚卸し、業務改善、AI/DXロードマップ、実装優先順位を自社で進めるか、外部の専門家と整理するかを判断する材料として使えます。

GXOが重視するのは、話題性の高さよりも「自社の業務、データ、権限、予算、運用責任にどう影響するか」です。AI導入で成果が出ない原因は「データ品質」かもしれない｜AISIガイドブックに学ぶ社内データ整備チェックリスト【2026】に関する検討では、担当者だけで判断を閉じず、経営、現場、情シス、外部パートナーの役割を早い段階で分けることが重要です。

放置した場合と整備した場合の違い

横にスクロールして確認できます

観点	放置した場合	整備した場合
業務影響	属人的な判断が増え、対応の優先順位がぶれやすい	影響範囲、期限、責任者を決めて進められる
投資判断	ツール導入や外注費だけが先行し、効果測定が曖昧になる	売上、工数削減、リスク低減の指標にひも付けられる
現場運用	例外処理や承認フローが残り、定着しにくい	権限、ログ、教育、改善サイクルまで設計できる
経営報告	問題が発生してから説明資料を作ることになる	月次で状況、課題、次の打ち手を説明できる

導入・改善前のチェックリスト

対象業務、対象部門、対象データを明文化しているか
現在の課題を、売上機会、原価、工数、リスクのいずれかに分解しているか
既存システム、SaaS、Excel、手作業の依存関係を棚卸ししているか
例外処理、承認、差し戻し、監査証跡まで確認しているか
社内で判断できる範囲と外部支援が必要な範囲を分けているか
初期費用だけでなく、保守、運用、教育、改善費用を見積もっているか
成功指標を、問い合わせ数、商談数、削減時間、停止リスクなどで定義しているか
実装後の責任者、更新頻度、レビュー会議の持ち方を決めているか
セキュリティ、法務、個人情報、契約条件の確認ポイントを洗い出しているか
既存の問い合わせ、商談、障害、運用ログから優先順位を決めているか
経営判断に必要な資料を1枚で説明できる状態にしているか
次の90日で検証する範囲と、やらない範囲を明確にしているか

GXOの見解

DXは流行ツールの導入ではなく、現場業務、データ、権限、KPI、投資判断をつなぐ実装計画である。

GXOは最初から大規模刷新するより、棚卸し、優先順位付け、小さな実装、効果測定を繰り返すべきだと見る。

GXOは、DX成熟度診断、業務棚卸し、ロードマップ、AI/システム実装まで支援します。記事のテーマを単なる情報収集で終わらせず、相談、診断、要件定義、実装、運用改善に接続することで、DX診断、要件定義、システム開発、AI活用支援へ接続。さらに、短期診断から段階実装に進め、継続支援へ展開。

実行までの進め方

現在の業務、データ、ツール、担当者を棚卸しする
売上拡大、工数削減、リスク低減のどれに効くテーマかを決める
初期対応、90日以内の改善、半年以上の投資を分ける
必要な社内体制、外部支援、予算、セキュリティ確認を整理する
小さく検証し、効果測定後に本番化や横展開を判断する

よくある質問（FAQ 10問）

Q1. AIを入れれば、多少データが整っていなくても、賢く処理してくれるのではないでしょうか？

A. 実は逆です。AI は与えられたデータをもとに出力するため、品質の低いデータはそのまま（むしろ影響が大きくなって）出力に表れます。「Garbage In, Garbage Out」は AI 時代でも変わりません。

Q2. データ品質の改善は、どこから手を付ければよいでしょうか？

A. 「AI に使いたいデータ」を最初の対象にするのが現実的です。全社のデータを一気に整えるのではなく、AI チャットボットや分析で使う範囲から、最新性・重複・表記ゆれを点検していきます。

Q3. RAG の精度が低いのですが、モデルを変えれば直りますか？

A. モデルの変更では直らないことが多くあります。参照している社内文書が古い・重複している・画像 PDF になっているなどの場合は、まずデータ側を整えるほうが効果的です。

Q4. データ品質の「6 観点」は、全部やる必要がありますか？

A. 必須ではありません。まずは **最新性・一意性（重複なし）・一貫性（表記の統一）**の 3 点から始めると、AI の出力品質が目に見えて変わりやすくなります。

Q5. 画像でスキャンした PDF は、AI で使えないのでしょうか？

A. そのままでは検索・参照の精度が下がります。テキスト化（OCR など）して、AI が読める形にすると精度が上がります。データ整備の「構造化」ステップに当たります。

Q6. データ整備は、一度やれば終わりでしょうか？

A. 終わりではありません。データは業務とともに増え・変わるため、放っておけば品質はまた下がっていきます。AISI ガイドブックも 継続的なマネジメントを強調しています。更新フローと点検の仕組みを持っておくことが大切です。

Q7. 機密情報や個人情報を AI に渡しても大丈夫でしょうか？

A. 渡してよいデータと渡してはいけないデータを区別することが前提です。RAG を組む際は、参照する範囲の権限設計が必要になります。セキュリティ設計とセットで考えておきたい論点です。

Q8. 中小企業でも、専門の人がいないとデータ品質管理はできないのでしょうか？

A. 専門部署がなくても始められます。まずは「AI に使うデータ」に絞って、最新版の管理・重複の整理・表記の統一から進めます。外部のパートナーに伴走してもらうのも現実的です。

Q9. AISI のガイドブックは、中小企業にも役立ちますか？

A. 役立ちます。データ品質の考え方は規模を問わず通用します。「データは AI の基盤」「目的に応じた品質」「継続的なマネジメント」という原則は、中小企業の AI 活用にもそのまま当てはまります。

Q10. 結局、AI 導入の前に一番やっておくとよいことは何でしょうか？

A. **「AI に使いたいデータを棚卸しし、最新・重複なし・表記統一の状態に整える」**ことです。AI モデルの検討より前に、ここに手を付けることが、成果への近道になります。

参考一次ソース

まとめ

AI で成果が出ない原因は、モデルではなくデータ品質にあることが少なくありません。AI は「料理人」、データは「食材」です
AISI は 2026 年 5 月に **「データ品質マネジメントガイドブック（第1.02版）」**を公開しました。「データは AI の基盤」であり、データが適切でないと適切な出力は得られないと示しています
「データ品質が低い」とは、古い・重複・最新版不明・表記ゆれ・欠損・誤り・所在不明・権限不明といった具体的な状態を指します
データ品質は 正確性・完全性・一貫性・最新性・一意性・妥当性の 6 観点で評価できます。まずは最新性・一意性・一貫性の 3 点から始めましょう
RAG・AI チャットボットが期待どおり動かない原因の多くは、参照する社内データの品質にあります
AI 導入前の社内データ整備チェックリスト 10 項目で、在処・品質・権限・運用を確認しましょう
データ整備は 棚卸し → クレンジング → 構造化 → 権限整理 → 運用のステップで、継続してマネジメントしていきます