「PoC で月 50 万円だった Datadog が、本番展開後に月 400 万円を超えた」――2026 年、中堅企業(従業員 300-3,000 名・ホスト数 50-300 規模)の情シス責任者から最も多く聞く悲鳴である。 SaaS 型オブザーバビリティの月額は APM のホスト単価で語られることが多いが、実際の請求総額を支配するのは Indexed Logs(取込・保管・分析)と Custom Metrics(カスタム指標数) の従量課金部分である。本記事は Datadog / New Relic / Splunk Observability Cloud の 3 製品を、中堅企業の現実的なホスト規模・年額帯で比較し、コスト削減の実装レバーを整理する。価格と機能は執筆時点(2026 年 4 月)の各社公式公開情報に基づく目安であり、契約時は最新の公式プランと営業見積りを必ず確認されたい。
目次
- 中堅企業のオブザーバビリティ年額帯(500-3,000 万円)の構造
- Datadog / New Relic / Splunk Observability の課金構造比較
- 見落としやすい 5 大隠れコスト
- Reserved Plan / Annual Commit / 商談ディスカウントの実態
- 規模別の典型構成と年額レンジ
- コスト削減 8 レバー
- 選定の判断軸(Gartner Magic Quadrant 2024 視点も含む)
- よくある質問(FAQ)
- 関連記事
中堅企業のオブザーバビリティ年額帯(500-3,000 万円)の構造
中堅企業のオブザーバビリティ年額は、SaaS 型 3 製品でほぼ同じ構造を持つ。価格は変動するが、配分の比率は安定して観測される。
| コスト要素 | 年額に占める比率(中堅企業中央値) | 課金単位の代表例 |
|---|---|---|
| インフラ監視(ホスト / コンテナ) | 20-30% | ホスト月額単価 × 台数 |
| APM(アプリケーション性能監視) | 15-25% | ホスト月額 + サービス数 |
| ログ取込(Indexed Logs) | 25-40% | GB 単位の取込量 + 保管月数 |
| Custom Metrics | 10-20% | カスタム指標の系列数 |
| RUM / Synthetic / Session Replay | 5-15% | セッション数・チェック数 |
| その他(CI Visibility / Security 等) | 5-10% | 機能別追加 |
ホスト数 50-300 規模の現実的な年額レンジ
- ホスト 50 台 / アプリ 10 サービス:年額 500-1,000 万円
- ホスト 100 台 / アプリ 20 サービス:年額 1,000-1,800 万円
- ホスト 200 台 / アプリ 40 サービス:年額 1,800-3,000 万円
- ホスト 300 台 / アプリ 60 サービス + RUM:年額 3,000-5,000 万円超
同じホスト数でもログ取込量と Custom Metrics 数で 2-3 倍違う。年額レンジ幅が広いのはこの 2 軸の差である。
Datadog / New Relic / Splunk Observability の課金構造比較
3 製品の課金モデルは設計思想が大きく異なる。
| 観点 | Datadog | New Relic | Splunk Observability Cloud |
|---|---|---|---|
| 基本課金 | 機能別 SKU(Infrastructure / APM / Logs / RUM 等を個別購入) | 利用ベース(取込 GB + ユーザー数の組合せ) | 機能別 SKU(IM / APM / Log Observer / RUM 等) |
| ホスト単価 | Pro / Enterprise 等プラン別、月額固定 | ユーザー数(Full / Core / Basic)課金が主軸 | ホスト単価 + Custom Metrics 課金 |
| ログ課金 | Indexed Logs(GB + 保管月数)+ Live Tail | データ取込 GB(保管込み)+ クエリ実行 | Log Observer Connect(Splunk Cloud と連携可) |
| Custom Metrics | 100 系列 / ホストまで標準、超過従量 | カスタム属性課金は緩め | Custom Metrics 数で別課金 |
| 国内データセンター | あり(執筆時点で東京) | あり | グローバル + 国内連携可 |
| 強み | UI 完成度・統合数(700+)・LLMOps / CI Visibility 拡張 | 利用ベース課金で予測しやすい / All-in-One | OpenTelemetry ネイティブ志向 / Splunk Enterprise 連携 |
| 弱み | 機能別 SKU で総額が膨れやすい / Custom Metrics 課金が分かりにくい | 大規模時の単価が高くなりやすい | UI 学習コスト / 中堅規模での過剰機能 |
Datadog の「機能別 SKU」が膨れる理由
Datadog は Infrastructure / APM / Logs / RUM / Synthetic / CI Visibility / Cloud SIEM など 20+ の機能別 SKU を個別購入する。1 機能追加で月額 5-15% 増加が容易に発生する。「全部入り」を望むと年額が当初想定の 1.5-2 倍になりやすい。
New Relic の「利用ベース」が向くケース
New Relic は 2020 年に利用ベース課金(取込 GB + ユーザー数)に転換しており、「使った分だけ・人数で課金」 で予測しやすい。ただしユーザー数(Full Platform User)の単価が高く、SRE チーム 10 名以上だと総額が跳ねる。Core / Basic ユーザーの併用設計が必須。
Splunk Observability の「Splunk Enterprise 連携」優位
既に Splunk Enterprise(オンプレ / Cloud)を全社で使っている企業は、Log Observer Connect で 既存ログ基盤との二重課金回避 が可能。逆に Splunk 未導入企業が Observability 単独で導入するケースは中堅規模では少数派。
見落としやすい 5 大隠れコスト
予算超過の原因はほぼ毎回この 5 つに集約される。
1. Indexed Logs の保管月数
「30 日保管」と「13 ヶ月保管」では 月額単価が 2-4 倍違う。コンプライアンス要件で 1 年保管が必要なログ(監査 / 取引 / セキュリティ)と、30 日で十分なログ(アプリデバッグ / アクセスログ)を 取込時に分離 すること。Datadog Flex Logs / New Relic Data Plus / Splunk Cloud Archive など、低単価アーカイブ層を活用する。
2. Custom Metrics の系列爆発
Custom Metrics は 「メトリクス名 × タグ組合せ」 で系列数がカウントされる。`env=prod / region=tokyo / service=checkout / version=v1.2.3` のような高 cardinality タグを付けると、1 メトリクスで 10,000 系列を超える事故が起きる。Cardinality 監査ダッシュボード を月次で運用し、不要タグを削除することが必須。
3. APM トレース のサンプリング設計不在
全トランザクションをトレース送信すると、本番ピーク時に 1 日 100GB を超える。Head-based sampling(取込前 1-10%) または Tail-based sampling(エラー / 遅延のみ全送信) を必ず設計する。サンプリングなしの導入は予算事故の典型パターンである。
4. RUM / Session Replay の月間セッション課金
Session Replay は便利だが 1 セッション 0.001-0.01 USD 程度 で課金される。月間 1,000 万セッションだと 1-10 万 USD(150 万-1,500 万円)に達する。サンプリング率(1-10%)+ エラーセッション全録 の組合せが標準。
5. Synthetic Monitoring のチェック頻度
Synthetic は 1 分間隔で全 URL を回すと ワールドワイド 30 ロケーション × 50 URL × 60 回 / 時間 = 月 6,500 万チェック に達する。SLO に必要な最低頻度(5-15 分)と地理ロケーション数(東京 + アジア 1-2 + 主要拠点)に絞ることで 60-80% 削減できる。
Reserved Plan / Annual Commit / 商談ディスカウントの実態
3 製品ともに年間契約・複数年契約・コミット消費型契約で割引が用意される。中堅企業の調達担当者が知っておくべき実態を整理する。
Annual Commit の標準割引率
- 1 年契約 vs 月次:10-20% 割引
- 2-3 年契約:20-35% 割引
- 使い切り型コミット(Datadog Usage Commit / New Relic Annual Pool):取込 GB / ホスト数を年額で前払い、月次変動を吸収
商談ディスカウントが効くタイミング
- Q4(各社 12 月決算 or 1 月):営業ノルマ達成のため割引余地が広がる
- 競合切替提案:他社 2 製品の見積りを並行取得すると 15-30% 引き出せる
- 複数機能パッケージ:APM + Logs + RUM をまとめると単品合算より 10-25% 安い
注意:割引と引き換えの「使い切り強制」
Annual Commit は 未使用分が消えるか持ち越せないか が契約条項で決まる。事業縮小フェーズで使い切れず損失計上した中堅企業の事例も多い。初年度は前年実績の 80% でコミット → 翌年実績で再契約 が安全な導入パターン。
規模別の典型構成と年額レンジ
中堅企業の代表 3 規模別に、現実的な構成と年額を提示する。
規模 A:ホスト 50 台 / アプリ 10 サービス(年額 500-1,000 万円)
- Datadog Pro Infrastructure + APM Pro + Logs 50GB / 月
- Custom Metrics 100 系列 / ホスト枠内
- Synthetic 5 URL × 5 分間隔
- RUM なし(または無料枠)
規模 B:ホスト 100 台 / アプリ 20 サービス(年額 1,000-1,800 万円)
- Datadog Enterprise Infrastructure + APM Enterprise + Logs 200GB / 月
- Custom Metrics 200 系列 / ホスト
- Synthetic 20 URL × 5 分間隔 × 3 ロケーション
- RUM 月 100 万セッション(サンプリング 10%)
規模 C:ホスト 200-300 台 / アプリ 40-60 サービス(年額 1,800-3,500 万円)
- 機能別フル構成
- Logs 500GB-1TB / 月(Flex Logs 併用)
- Custom Metrics 500-1,000 系列 / ホスト
- Synthetic 50 URL × 1-5 分間隔 × 5 ロケーション
- RUM + Session Replay(10% サンプリング)
- CI Visibility(CI/CD 統合)追加検討
製品選定の規模別傾向
- 規模 A:New Relic 利用ベースが予測しやすい
- 規模 B:Datadog の機能完成度が活きるが、Custom Metrics 監査必須
- 規模 C:3 製品どれも候補。既存 Splunk Enterprise があれば Splunk Observability 一択検討
コスト削減 8 レバー
実装可能な削減レバーを優先順位順に提示する。中堅企業の現場で 年額 30-50% 削減 が現実的に到達できる。
レバー 1:ログ階層分離(30-50% 削減効果)
監査 / セキュリティ / アプリ / インフラの 4 階層に分離し、保管期間と分析頻度で SKU を変える。
レバー 2:Custom Metrics Cardinality 監査(10-30% 削減)
月次で系列数 Top 100 を監査し、不要タグ(特にユーザー ID / セッション ID / リクエスト ID)を削除。
レバー 3:APM トレース Tail-based Sampling(15-25% 削減)
OpenTelemetry Collector で Tail-based Sampling を実装し、エラー / 遅延セッションのみ全送信。
レバー 4:Synthetic ロケーション削減(5-15% 削減)
ワールドワイド 30 ロケーションを必要 3-5 に絞る。
レバー 5:RUM サンプリング率設定(10-30% 削減)
100% 取得を 10% に下げる + エラーセッションは全録。
レバー 6:未使用ホストの自動 Decommission(5-15% 削減)
オートスケールで停止したホストが課金され続ける事故が頻発。タグベース自動 Decommission ルールを設定。
レバー 7:開発 / ステージング環境の SKU ダウングレード(10-20% 削減)
本番は Enterprise、ステージング / 開発は Pro / Free 枠に分離。
レバー 8:Annual Commit 適切設定(10-25% 削減)
前年実績の 80% でコミット → 超過は従量。100% コミットは事業縮小リスクで避ける。
選定の判断軸(Gartner Magic Quadrant 2024 視点も含む)
Gartner Magic Quadrant for Observability Platforms(2024 年版)では Datadog / New Relic / Splunk が共に Leaders Quadrant に位置する。中堅企業の選定では以下 6 軸で評価する。
| 判断軸 | 重み | Datadog | New Relic | Splunk Observability |
|---|---|---|---|---|
| 立ち上げ速度 | 20% | A(最速 1-2 週間) | A | B(既存 Splunk 連携前提なら A) |
| 機能完成度 | 15% | A | B+ | B+ |
| 国内データセンター | 15% | A(東京) | A | A |
| ベンダーロックイン | 10% | C(独自 API 多い) | B | B |
| OpenTelemetry 対応 | 15% | B+ | A | A |
| 中堅規模での総額 | 25% | C-B(最適化前提で B) | B-A | B |
規模別の典型解
- 従業員 300-1,000 名 × LangChain / Modern stack 重視 → Datadog(最短立ち上げ)
- 従業員 1,000-3,000 名 × ユーザー数固定 × 予測安定重視 → New Relic
- 従業員 1,000-3,000 名 × 既存 Splunk Enterprise 全社利用 → Splunk Observability
- データ主権・OSS 志向 × SRE チーム充実 → 内製 OpenTelemetry + Grafana スタック(別記事で解説)
よくある質問(FAQ)
Q1. 中堅企業で年額 1,000 万円超は妥当か
A. 障害時の機会損失コスト(年商 100 億企業で 1 時間ダウン = 数百万円)を考慮すれば 1,000 万円は妥当範囲。ただし 「予算超過 vs 障害損失」を CFO が定量比較できる ROI 資料 を作らないと予算承認が通らない時代に入っている。
Q2. Custom Metrics 系列爆発を事前に防ぐ方法は
A. 開発標準として 「タグ承認リスト」 を策定し、`user_id` / `session_id` / `request_id` などの高 cardinality タグを禁止リスト化する。CI でメトリクス送信コードを Lint チェックする企業もある。
Q3. Annual Commit 未使用分は本当に消えるか
A. 製品 / プランによる。Datadog の Usage Commit は当年内消費が原則、繰越交渉は営業との個別合意。New Relic Annual Pool も同様。契約書の「未使用分の取扱い」条項を必ず印字確認。
Q4. オンプレ移行で SaaS コスト削減は本当に可能か
A. 内製 OpenTelemetry + Grafana で 50-70% 削減事例があるが、SRE 3-10 名のチーム維持コスト + ハードウェア + 運用工数 を含めた TCO で再計算すると、ホスト 100 台未満では SaaS の方が安いケースが多い。詳細は別記事「OpenTelemetry 内製基盤」参照。
Q5. 3 製品同時 PoC は現実的か
A. 推奨。各社 30 日 Free Trial で同じワークロードを流し、(1) 取込量実測、(2) Custom Metrics 系列数実測、(3) UI 学習コスト実測 を社内チームで採点する。商談ディスカウント引き出しの根拠資料にもなる。
Q6. 監視の SaaS 単一ベンダー集約はリスクか
A. リスク。観測層がダウンしたら障害対応自体が止まる。Synthetic / 外形監視だけ第 2 ベンダー(UptimeRobot / Pingdom 等)で冗長化することが推奨される。
Q7. ログとメトリクスを別ベンダーに分けるのは現実的か
A. 中堅規模では非推奨。トレース → ログ → メトリクスを横断検索できないと MTTR(平均修復時間)が 2-3 倍に伸びる。横断統合は SaaS 単一ベンダーの最大価値の一つ。
Q8. Splunk Observability は単独導入の選択肢になるか
A. 中堅企業の単独導入は少数派。Splunk Enterprise を既に全社利用 + Observability 拡張 が典型導入パターン。単独なら Datadog / New Relic 比較で機能差が小さく、UI 学習コストで他 2 社が優位。
追加の一次情報・確認観点
この記事の内容を社内で検討する場合は、一般論だけで判断せず、次の一次情報と自社データを照合してください。特に、稟議・RFP・ベンダー選定では「何を実装するか」よりも「どのリスクをどの水準まで下げるか」を先に決めると、見積もり比較のブレを抑えられます。
| 確認領域 | 参照先 | 自社で確認すること |
|---|---|---|
| 脆弱性・注意喚起 | IPA 情報セキュリティ | 対象製品、影響範囲、更新手順、社内展開状況を確認する |
| インシデント対応 | JPCERT/CC | 初動、封じ込め、復旧、対外連絡の役割分担を確認する |
| 管理策 | NIST Cybersecurity Framework | 識別、防御、検知、対応、復旧のどこが弱いかを確認する |
| DX推進 | IPA デジタル基盤センター | DX推進指標、IT人材、デジタル基盤の観点で現状を確認する |
| 個人情報 | 個人情報保護委員会 | 個人情報・委託先管理・利用目的・安全管理措置を確認する |
稟議・RFPで使う数値設計
投資判断では、導入前後で測れる指標を3から5個に絞ります。下表のように、現状値・目標値・測定方法・責任者をセットにしておくと、PoC後に本番化するかどうかを判断しやすくなります。
| 指標 | 現状確認 | 目標の置き方 | 失敗しやすい例 |
|---|---|---|---|
| 対象業務数 | 現状の対象業務を棚卸し | 初期は1から3業務に限定 | 対象を広げすぎて要件が固まらない |
| 月間処理件数 | 件数、担当者、例外率を確認 | 上位20%の高頻度業務から改善 | 件数が少ない業務を先に自動化する |
| 例外対応率 | 手戻り、確認待ち、属人判断を計測 | 例外の分類と承認ルールを定義 | 例外をAIやシステムだけで吸収しようとする |
| 復旧目標時間 | RTO/RPOを業務別に確認 | 重要業務から優先順位を設定 | 全システム同一水準で考える |
| 検知から初動までの時間 | ログ、通知、責任者を確認 | 初動30分以内など明確化 | 通知だけあり対応者が決まっていない |
よくある失敗と回避策
| 失敗パターン | 起きる理由 | 回避策 |
|---|---|---|
| 目的が曖昧なままツール選定に入る | 比較軸が価格や機能数に寄る | 経営課題、業務課題、測定KPIを先に固定する |
| 現場確認が不足する | 例外処理や非公式運用が見落とされる | 担当者ヒアリングと実データ確認を必ず行う |
| 運用責任者が決まっていない | 導入後の改善が止まる | 業務側とIT側の責任分界をRACIで定義する |
| バックアップが復旧できない | 取得だけで復元テストをしていない | 四半期ごとに復旧訓練を実施する |
GXOに相談する前に整理しておく情報
初回相談では、次の情報があると診断と提案の精度が上がります。すべて揃っていなくても問題ありませんが、分かる範囲で用意しておくと、概算費用・期間・体制の見立てを早く出せます。
- 対象業務の現行フロー、利用中システム、Excel・紙・チャット運用の一覧
- 月間件数、担当人数、手戻り件数、確認待ち時間などの概算
- 個人情報、機密情報、外部委託、権限管理に関する制約
- 希望開始時期、予算レンジ、社内承認者、決裁までの流れ
- 直近の障害・インシデント履歴、バックアップ方式、EDR/MDR/SOCの導入状況
GXOでは、現状整理、要件定義、RFP作成、ベンダー比較、PoC設計、本番移行計画まで一気通貫で支援できます。記事の内容を自社に当てはめたい場合は、まずは現在の課題と制約を共有してください。
関連記事
- Datadog vs New Relic vs Prometheus 中堅企業 監視 比較 2026|価格・APM・ログ・運用負荷 6 軸スコア
- システム監視・可観測性ガイド|Datadog・New Relic・Grafanaの比較と導入方法
- AI エージェント本番運用ガイド 2026|LangSmith / Langfuse 評価ループの組み方と中堅エンタープライズの実装パターン
- SIEM ログ監視の実装と運用コスト 2026
参考資料
- Datadog 公式 Pricing(https://www.datadoghq.com/pricing/)
- New Relic 公式 Pricing(https://newrelic.com/pricing)
- Splunk Observability Cloud 公式(https://www.splunk.com/en_us/products/observability.html)
- Gartner Magic Quadrant for Observability Platforms 2024
- OpenTelemetry 公式(https://opentelemetry.io/)
- Datadog "Best practices for managing your spend" 各社公開ドキュメント
中堅企業のオブザーバビリティ コスト最適化のご相談
GXO は中堅企業(従業員 300-3,000 名・ホスト数 50-300 規模)向けに、Datadog / New Relic / Splunk Observability の選定支援、Custom Metrics 監査、ログ階層分離設計、Annual Commit 戦略策定、年額 30-50% 削減プランの実装まで一貫支援します。既存契約の総額見直し、3 製品 PoC 並行実施、商談ディスカウント引き出し支援にも対応可能です。