RAGは、社内の文書を横断して検索し、その内容をもとに回答を作る仕組みである。便利さの源は「散らばった文書をまとめて引ける」ことにあるが、その便利さは裏返しでもある。誰が・どの文書を検索・閲覧できるかを決めないまま全文書を取り込むと、本来は一部の人しか見られない情報まで、誰の質問にも混ざって出てくる。
本記事は、RAGを導入・連携する前に整理しておきたい「検索範囲と閲覧権限」の分け方を、発注者の視点でまとめる。読者として想定しているのは、中小企業の経営者、DX担当、情シス担当、事業責任者である。権限設計というと難しく聞こえるが、発注者として「どの文書を、誰まで見てよいのか」を整理できれば十分である。RAGの全体像は社内文書のRAG検索を導入する前に知っておくことでも扱っている。
結論:見せてよい範囲を文書側で決め、検索と回答の両方で絞る
RAGの権限設計の基本は、「全社員が全文書を引ける状態を作らない」ことである。便利だからと全文書を一つの検索対象にまとめると、閲覧権限の境界が消えてしまう。GXOがRAGの権限設計で重視するのは、次の3点である。
- 文書ごとに「誰まで見てよいか」を定め、その境界を検索の対象範囲に反映する
- 検索インデックスの段階と、回答を作る段階の両方でフィルタをかける
- 人事・給与・契約・経営情報など、見せてはいけない文書はそもそも分離する
権限を広げるのは後からでもできる。最初から全文書を混ぜるより、見せてよい範囲を限定して始めるほうが、リスクを抑えられる。
なぜ検索範囲と閲覧権限が問題になるのか
RAGは、質問に近い文書を探し出し、その中身を回答に引用する。つまり、検索の対象になっている文書は、原理的に回答へ出てくる可能性がある。検索範囲と閲覧権限を設計しないと、次のような問題につながる。
- 一部の人しか見られない情報が、誰の質問にも回答として混ざる
- 質問者本人は閲覧権限のない文書の内容を、回答経由で知ってしまう
- どの文書が検索対象に入っているのか曖昧で、漏れたときに範囲を特定できない
人が文書を探すときは、そもそも見られないフォルダには入れない。だがRAGは、取り込んだ文書を一律に検索対象にしてしまうと、こうした「入れないはずの場所」の中身まで引いてくる。検索範囲と閲覧権限は、RAGを安全に運用するための土台である。閲覧履歴の記録や機密情報の扱いはAIエージェント導入前チェックリスト|セキュリティとプライバシーも参考になる。
全文書を一つの検索対象にしない
権限設計の第一歩は、「すべての文書を一つの大きな検索対象に混ぜない」ことである。文書には、見せてよい範囲が異なるものが混在している。
| 文書の例 | 見せてよい範囲 | RAGでの扱い |
|---|---|---|
| 製品マニュアル・業務手順 | 全社員 | 共通の検索対象にしてよい |
| 部署内の議事録・案件資料 | 当該部署・関係者 | 部署や案件の境界で絞る |
| 人事・給与・評価の情報 | 人事・経営の一部 | 別扱いにし、原則分離する |
| 契約・取引条件・経営計画 | 経営・担当の一部 | 別扱いにし、原則分離する |
共通で見てよい文書と、限られた人だけが見てよい文書を、最初から分けて考える。全部を一つにまとめてしまうと、後から境界を引き直すのは難しい。発注前に「どの文書群を、どの範囲に見せるのか」を整理しておきたい。
部署・役職・案件で境界を引く
閲覧権限は「文書を見てよいか」を決めるが、その判断の単位はいくつかある。社内のすでにある区分に合わせると、運用しやすい。
- 部署別:自部署の文書のみ検索・閲覧できるようにする
- 役職別:管理職や経営層だけが見てよい文書を、役職で区切る
- 案件・プロジェクト別:関わる案件の範囲で検索対象を区切る
- 文書種別:人事・契約など特に機微な種別は、別の扱いにする
これらの境界は、すでに社内のファイルサーバーやグループウェアで設定されているアクセス権と整合させると無理がない。RAGだけが特別に広い範囲を検索できる状態は避けたい。既存のアクセス権をそのまま反映するのか、RAG用に改めて整理するのかは、発注前に決めておきたい論点である。境界を引く単位が社内のどの区分と対応するかも、あわせて確認しておきたい。
インデックス段階のフィルタと回答段階のフィルタを分ける
RAGの権限制御には、かける場所が二つある。どちらか一方だけでは不十分で、組み合わせて考える必要がある。
| フィルタの場所 | 何をするか | 効きどころ |
|---|---|---|
| 検索インデックス段階 | 質問者が見てよい文書だけを検索対象に絞る | 見えない文書を最初から候補に入れない |
| 回答生成段階 | 引用してよい内容かを最終確認する | 候補に紛れた機密の出力を止める |
検索インデックス段階のフィルタは、質問者の権限に応じて検索対象そのものを絞る。見られない文書は候補に入らないので、回答に混ざる入口を塞げる。これがRAGの権限制御の本筋である。
回答生成段階のフィルタは、候補まで進んだ内容を最終的に確認する役割を持つ。インデックス段階で取りこぼしがあったときの歯止めになる。ただし、回答段階だけに頼ると、見せてはいけない文書が一度は候補に入ってしまう。原則は「見られない文書はそもそも検索させない」であり、回答段階のフィルタはあくまで補助だと整理しておきたい。この二つを分けて考えられているかは、発注前に確認しておきたい点である。
機密文書はそもそも分離する
人事・給与・契約・経営情報のように、見せる相手が極めて限られる文書は、共通のRAGに混ぜないのが安全である。フィルタで絞るより、検索対象から外しておくほうが、取りこぼしのリスクが小さい。
- 共通のRAGから外す:全社員向けのRAGには、機密文書を取り込まない。
- 必要なら別建てにする:人事や経営の限られた用途には、対象を絞った別のRAGを用意する。
- 取り込む前に確認する:文書を検索対象に加えるとき、見せてよい範囲を必ず確認する工程を設ける。
機密文書を一度共通のRAGに取り込むと、フィルタの設定漏れ一つで漏れにつながる。「混ぜてから絞る」より「最初から分ける」ほうが、設計も運用も単純になる。どの文書を共通のRAGに入れ、どれを分離するかの線引きは、発注前に整理しておきたい。LLM側の接続をどう設計するかは社内向けLLMゲートウェイの導入と運用コストでも触れている。
RAG権限設計でよくある失敗
権限設計では、次のような失敗が起きやすい。いずれも、発注前に方針を決めておけば避けられる。
- とりあえず全文書を取り込む:早く動かすために全部を一つの検索対象にし、境界を後回しにした結果、機密が混ざる。
- インデックスを絞らず回答段階だけで止める:見られない文書が候補に入り、フィルタの漏れがそのまま漏えいになる。
- 既存のアクセス権を確認しない:ファイルサーバーの権限と食い違い、本来見られない文書まで検索対象に入る。
- 異動・退職への対応を決めていない:担当が変わっても検索範囲が見直されず、不要なアクセスが残る。
権限は「一度設定して終わり」ではなく、文書が増えたり担当が変わったりするたびに見直すものである。見直しの担当と頻度も、発注前に想定しておきたい。
導入前チェックリスト
- 共通で見てよい文書と、限られた人だけが見てよい文書を分けたか
- 部署・役職・案件などの境界で、検索範囲を絞る方針を決めたか
- 人事・給与・契約・経営情報を、共通のRAGから分離する方針を決めたか
- 検索インデックス段階で、質問者の権限に応じて対象を絞れるか確認したか
- 回答生成段階のフィルタを、補助として位置づけているか
- 既存のファイルサーバー・グループウェアのアクセス権と整合させる方針を決めたか
- 文書を検索対象に加えるとき、見せてよい範囲を確認する工程を設けたか
- 担当者の異動・退職時に、検索範囲を見直す運用を決めたか
開発会社に確認する質問
| 質問 | 確認したいこと |
|---|---|
| 質問者の権限に応じて検索対象を絞れますか | インデックス段階のフィルタ |
| 部署・役職・案件単位で閲覧範囲を区切れますか | 境界の設計 |
| 既存のアクセス権と整合させられますか | 既存アクセス制御との連携 |
| 人事・契約など特定の文書を分離できますか | 機密文書の分離 |
| 回答に引用された出典を確認できますか | 出力の追跡 |
| 検索範囲を後から見直せる作りですか | 段階的な見直し |
「全文書を一括で取り込めばすぐ使えます」という説明には注意したい。誰が・どの文書を引けるかを絞れるかが、安全な運用の分かれ目になる。
相談前に整理しておくとよい情報
- RAGで検索させたい文書と、その置き場所
- それぞれの文書が、誰まで見てよい情報か(部署・役職の範囲)
- 人事・給与・契約・経営情報など、特に機微な文書が含まれるか
- ファイルサーバーやグループウェアで、すでに設定されているアクセス権
- 文書や権限を管理する社内の担当者がいるか
これらが整理されていなくても相談は可能である。検索させたい文書と、それを「誰が見てよいか」が見えていれば、検索範囲と閲覧権限の境界を一緒に設計できる。
関連記事
よくある質問
Q1. 全社員が全文書を引ける状態は、なぜ危険なのですか
検索対象に入っている文書は、原理的に回答へ出てくる可能性があるからである。全文書を混ぜると、人事や契約など本来は一部の人しか見られない情報が、誰の質問にも回答として混ざりうる。見せてよい範囲を文書側で決め、その範囲だけを検索させるのが安全である。
Q2. インデックス段階と回答段階のフィルタは、どちらか一方では足りませんか
回答段階だけに頼ると、見せてはいけない文書が一度は検索候補に入ってしまう。原則は「見られない文書はそもそも検索させない」インデックス段階の絞り込みであり、回答段階はその漏れを止める補助である。両方を組み合わせるのが現実的である。
Q3. 既存のファイルサーバーの権限を、そのままRAGに使えますか
使える場合も多いが、RAGは取り込んだ文書を横断して引く特性があるため、そのまま流用してよいかは確認が必要である。既存のアクセス権を土台にしつつ、RAGの検索範囲として改めて整理するのが現実的である。
RAGの検索範囲と閲覧権限の設計を一緒に整理しませんか
GXOでは、RAGの検索対象と閲覧権限の分離、部署・役職・案件別の境界設計、機密文書の扱いを、発注前に整理するご支援をしています。
※ 初回相談では、営業資料の説明よりも現状整理とリスク確認を優先します。
