「PoC で月 50 万円だった Datadog が、本番展開後に月 400 万円を超えた」――2026 年、中堅企業(従業員 300-3,000 名・ホスト数 50-300 規模)の情シス責任者から最も多く聞く悲鳴である。 SaaS 型オブザーバビリティの月額は APM のホスト単価で語られることが多いが、実際の請求総額を支配するのは Indexed Logs(取込・保管・分析)と Custom Metrics(カスタム指標数) の従量課金部分である。本記事は Datadog / New Relic / Splunk Observability Cloud の 3 製品を、中堅企業の現実的なホスト規模・年額帯で比較し、コスト削減の実装レバーを整理する。価格と機能は執筆時点(2026 年 4 月)の各社公式公開情報に基づく目安であり、契約時は最新の公式プランと営業見積りを必ず確認されたい。


目次

  1. 中堅企業のオブザーバビリティ年額帯(500-3,000 万円)の構造
  2. Datadog / New Relic / Splunk Observability の課金構造比較
  3. 見落としやすい 5 大隠れコスト
  4. Reserved Plan / Annual Commit / 商談ディスカウントの実態
  5. 規模別の典型構成と年額レンジ
  6. コスト削減 8 レバー
  7. 選定の判断軸(Gartner Magic Quadrant 2024 視点も含む)
  8. よくある質問(FAQ)
  9. 関連記事

中堅企業のオブザーバビリティ年額帯(500-3,000 万円)の構造

中堅企業のオブザーバビリティ年額は、SaaS 型 3 製品でほぼ同じ構造を持つ。価格は変動するが、配分の比率は安定して観測される。

コスト要素年額に占める比率(中堅企業中央値)課金単位の代表例
インフラ監視(ホスト / コンテナ)20-30%ホスト月額単価 × 台数
APM(アプリケーション性能監視)15-25%ホスト月額 + サービス数
ログ取込(Indexed Logs)25-40%GB 単位の取込量 + 保管月数
Custom Metrics10-20%カスタム指標の系列数
RUM / Synthetic / Session Replay5-15%セッション数・チェック数
その他(CI Visibility / Security 等)5-10%機能別追加
「ホスト単価 × 台数」だけで年額を見積もるとほぼ確実に予算が崩れる。実務では Indexed Logs と Custom Metrics の合算が APM 本体を上回る企業が過半である。Datadog 公式ブログ("Datadog pricing best practices", 2023-2024 各社事例で繰り返し公表)でも本人たちが「ログとカスタムメトリクスは想定の 2-3 倍に膨らみやすい」と注意喚起している。

ホスト数 50-300 規模の現実的な年額レンジ

  • ホスト 50 台 / アプリ 10 サービス:年額 500-1,000 万円
  • ホスト 100 台 / アプリ 20 サービス:年額 1,000-1,800 万円
  • ホスト 200 台 / アプリ 40 サービス:年額 1,800-3,000 万円
  • ホスト 300 台 / アプリ 60 サービス + RUM:年額 3,000-5,000 万円超

同じホスト数でもログ取込量と Custom Metrics 数で 2-3 倍違う。年額レンジ幅が広いのはこの 2 軸の差である。


Datadog / New Relic / Splunk Observability の課金構造比較

3 製品の課金モデルは設計思想が大きく異なる。

観点DatadogNew RelicSplunk Observability Cloud
基本課金機能別 SKU(Infrastructure / APM / Logs / RUM 等を個別購入)利用ベース(取込 GB + ユーザー数の組合せ)機能別 SKU(IM / APM / Log Observer / RUM 等)
ホスト単価Pro / Enterprise 等プラン別、月額固定ユーザー数(Full / Core / Basic)課金が主軸ホスト単価 + Custom Metrics 課金
ログ課金Indexed Logs(GB + 保管月数)+ Live Tailデータ取込 GB(保管込み)+ クエリ実行Log Observer Connect(Splunk Cloud と連携可)
Custom Metrics100 系列 / ホストまで標準、超過従量カスタム属性課金は緩めCustom Metrics 数で別課金
国内データセンターあり(執筆時点で東京)ありグローバル + 国内連携可
強みUI 完成度・統合数(700+)・LLMOps / CI Visibility 拡張利用ベース課金で予測しやすい / All-in-OneOpenTelemetry ネイティブ志向 / Splunk Enterprise 連携
弱み機能別 SKU で総額が膨れやすい / Custom Metrics 課金が分かりにくい大規模時の単価が高くなりやすいUI 学習コスト / 中堅規模での過剰機能

Datadog の「機能別 SKU」が膨れる理由

Datadog は Infrastructure / APM / Logs / RUM / Synthetic / CI Visibility / Cloud SIEM など 20+ の機能別 SKU を個別購入する。1 機能追加で月額 5-15% 増加が容易に発生する。「全部入り」を望むと年額が当初想定の 1.5-2 倍になりやすい。

New Relic の「利用ベース」が向くケース

New Relic は 2020 年に利用ベース課金(取込 GB + ユーザー数)に転換しており、「使った分だけ・人数で課金」 で予測しやすい。ただしユーザー数(Full Platform User)の単価が高く、SRE チーム 10 名以上だと総額が跳ねる。Core / Basic ユーザーの併用設計が必須。

Splunk Observability の「Splunk Enterprise 連携」優位

既に Splunk Enterprise(オンプレ / Cloud)を全社で使っている企業は、Log Observer Connect で 既存ログ基盤との二重課金回避 が可能。逆に Splunk 未導入企業が Observability 単独で導入するケースは中堅規模では少数派。


見落としやすい 5 大隠れコスト

予算超過の原因はほぼ毎回この 5 つに集約される。

1. Indexed Logs の保管月数

「30 日保管」と「13 ヶ月保管」では 月額単価が 2-4 倍違う。コンプライアンス要件で 1 年保管が必要なログ(監査 / 取引 / セキュリティ)と、30 日で十分なログ(アプリデバッグ / アクセスログ)を 取込時に分離 すること。Datadog Flex Logs / New Relic Data Plus / Splunk Cloud Archive など、低単価アーカイブ層を活用する。

2. Custom Metrics の系列爆発

Custom Metrics は 「メトリクス名 × タグ組合せ」 で系列数がカウントされる。`env=prod / region=tokyo / service=checkout / version=v1.2.3` のような高 cardinality タグを付けると、1 メトリクスで 10,000 系列を超える事故が起きる。Cardinality 監査ダッシュボード を月次で運用し、不要タグを削除することが必須。

3. APM トレース のサンプリング設計不在

全トランザクションをトレース送信すると、本番ピーク時に 1 日 100GB を超える。Head-based sampling(取込前 1-10%) または Tail-based sampling(エラー / 遅延のみ全送信) を必ず設計する。サンプリングなしの導入は予算事故の典型パターンである。

4. RUM / Session Replay の月間セッション課金

Session Replay は便利だが 1 セッション 0.001-0.01 USD 程度 で課金される。月間 1,000 万セッションだと 1-10 万 USD(150 万-1,500 万円)に達する。サンプリング率(1-10%)+ エラーセッション全録 の組合せが標準。

5. Synthetic Monitoring のチェック頻度

Synthetic は 1 分間隔で全 URL を回すと ワールドワイド 30 ロケーション × 50 URL × 60 回 / 時間 = 月 6,500 万チェック に達する。SLO に必要な最低頻度(5-15 分)と地理ロケーション数(東京 + アジア 1-2 + 主要拠点)に絞ることで 60-80% 削減できる。


Reserved Plan / Annual Commit / 商談ディスカウントの実態

3 製品ともに年間契約・複数年契約・コミット消費型契約で割引が用意される。中堅企業の調達担当者が知っておくべき実態を整理する。

Annual Commit の標準割引率

  • 1 年契約 vs 月次:10-20% 割引
  • 2-3 年契約:20-35% 割引
  • 使い切り型コミット(Datadog Usage Commit / New Relic Annual Pool):取込 GB / ホスト数を年額で前払い、月次変動を吸収

商談ディスカウントが効くタイミング

  • Q4(各社 12 月決算 or 1 月):営業ノルマ達成のため割引余地が広がる
  • 競合切替提案:他社 2 製品の見積りを並行取得すると 15-30% 引き出せる
  • 複数機能パッケージ:APM + Logs + RUM をまとめると単品合算より 10-25% 安い

注意:割引と引き換えの「使い切り強制」

Annual Commit は 未使用分が消えるか持ち越せないか が契約条項で決まる。事業縮小フェーズで使い切れず損失計上した中堅企業の事例も多い。初年度は前年実績の 80% でコミット → 翌年実績で再契約 が安全な導入パターン。


規模別の典型構成と年額レンジ

中堅企業の代表 3 規模別に、現実的な構成と年額を提示する。

規模 A:ホスト 50 台 / アプリ 10 サービス(年額 500-1,000 万円)

  • Datadog Pro Infrastructure + APM Pro + Logs 50GB / 月
  • Custom Metrics 100 系列 / ホスト枠内
  • Synthetic 5 URL × 5 分間隔
  • RUM なし(または無料枠)

規模 B:ホスト 100 台 / アプリ 20 サービス(年額 1,000-1,800 万円)

  • Datadog Enterprise Infrastructure + APM Enterprise + Logs 200GB / 月
  • Custom Metrics 200 系列 / ホスト
  • Synthetic 20 URL × 5 分間隔 × 3 ロケーション
  • RUM 月 100 万セッション(サンプリング 10%)

規模 C:ホスト 200-300 台 / アプリ 40-60 サービス(年額 1,800-3,500 万円)

  • 機能別フル構成
  • Logs 500GB-1TB / 月(Flex Logs 併用)
  • Custom Metrics 500-1,000 系列 / ホスト
  • Synthetic 50 URL × 1-5 分間隔 × 5 ロケーション
  • RUM + Session Replay(10% サンプリング)
  • CI Visibility(CI/CD 統合)追加検討

製品選定の規模別傾向

  • 規模 A:New Relic 利用ベースが予測しやすい
  • 規模 B:Datadog の機能完成度が活きるが、Custom Metrics 監査必須
  • 規模 C:3 製品どれも候補。既存 Splunk Enterprise があれば Splunk Observability 一択検討

コスト削減 8 レバー

実装可能な削減レバーを優先順位順に提示する。中堅企業の現場で 年額 30-50% 削減 が現実的に到達できる。

レバー 1:ログ階層分離(30-50% 削減効果)

監査 / セキュリティ / アプリ / インフラの 4 階層に分離し、保管期間と分析頻度で SKU を変える。

レバー 2:Custom Metrics Cardinality 監査(10-30% 削減)

月次で系列数 Top 100 を監査し、不要タグ(特にユーザー ID / セッション ID / リクエスト ID)を削除。

レバー 3:APM トレース Tail-based Sampling(15-25% 削減)

OpenTelemetry Collector で Tail-based Sampling を実装し、エラー / 遅延セッションのみ全送信。

レバー 4:Synthetic ロケーション削減(5-15% 削減)

ワールドワイド 30 ロケーションを必要 3-5 に絞る。

レバー 5:RUM サンプリング率設定(10-30% 削減)

100% 取得を 10% に下げる + エラーセッションは全録。

レバー 6:未使用ホストの自動 Decommission(5-15% 削減)

オートスケールで停止したホストが課金され続ける事故が頻発。タグベース自動 Decommission ルールを設定。

レバー 7:開発 / ステージング環境の SKU ダウングレード(10-20% 削減)

本番は Enterprise、ステージング / 開発は Pro / Free 枠に分離。

レバー 8:Annual Commit 適切設定(10-25% 削減)

前年実績の 80% でコミット → 超過は従量。100% コミットは事業縮小リスクで避ける。


選定の判断軸(Gartner Magic Quadrant 2024 視点も含む)

Gartner Magic Quadrant for Observability Platforms(2024 年版)では Datadog / New Relic / Splunk が共に Leaders Quadrant に位置する。中堅企業の選定では以下 6 軸で評価する。

判断軸重みDatadogNew RelicSplunk Observability
立ち上げ速度20%A(最速 1-2 週間)AB(既存 Splunk 連携前提なら A)
機能完成度15%AB+B+
国内データセンター15%A(東京)AA
ベンダーロックイン10%C(独自 API 多い)BB
OpenTelemetry 対応15%B+AA
中堅規模での総額25%C-B(最適化前提で B)B-AB

規模別の典型解

  • 従業員 300-1,000 名 × LangChain / Modern stack 重視 → Datadog(最短立ち上げ)
  • 従業員 1,000-3,000 名 × ユーザー数固定 × 予測安定重視 → New Relic
  • 従業員 1,000-3,000 名 × 既存 Splunk Enterprise 全社利用 → Splunk Observability
  • データ主権・OSS 志向 × SRE チーム充実 → 内製 OpenTelemetry + Grafana スタック(別記事で解説)

よくある質問(FAQ)

Q1. 中堅企業で年額 1,000 万円超は妥当か

A. 障害時の機会損失コスト(年商 100 億企業で 1 時間ダウン = 数百万円)を考慮すれば 1,000 万円は妥当範囲。ただし 「予算超過 vs 障害損失」を CFO が定量比較できる ROI 資料 を作らないと予算承認が通らない時代に入っている。

Q2. Custom Metrics 系列爆発を事前に防ぐ方法は

A. 開発標準として 「タグ承認リスト」 を策定し、`user_id` / `session_id` / `request_id` などの高 cardinality タグを禁止リスト化する。CI でメトリクス送信コードを Lint チェックする企業もある。

Q3. Annual Commit 未使用分は本当に消えるか

A. 製品 / プランによる。Datadog の Usage Commit は当年内消費が原則、繰越交渉は営業との個別合意。New Relic Annual Pool も同様。契約書の「未使用分の取扱い」条項を必ず印字確認

Q4. オンプレ移行で SaaS コスト削減は本当に可能か

A. 内製 OpenTelemetry + Grafana で 50-70% 削減事例があるが、SRE 3-10 名のチーム維持コスト + ハードウェア + 運用工数 を含めた TCO で再計算すると、ホスト 100 台未満では SaaS の方が安いケースが多い。詳細は別記事「OpenTelemetry 内製基盤」参照。

Q5. 3 製品同時 PoC は現実的か

A. 推奨。各社 30 日 Free Trial で同じワークロードを流し、(1) 取込量実測、(2) Custom Metrics 系列数実測、(3) UI 学習コスト実測 を社内チームで採点する。商談ディスカウント引き出しの根拠資料にもなる。

Q6. 監視の SaaS 単一ベンダー集約はリスクか

A. リスク。観測層がダウンしたら障害対応自体が止まる。Synthetic / 外形監視だけ第 2 ベンダー(UptimeRobot / Pingdom 等)で冗長化することが推奨される。

Q7. ログとメトリクスを別ベンダーに分けるのは現実的か

A. 中堅規模では非推奨。トレース → ログ → メトリクスを横断検索できないと MTTR(平均修復時間)が 2-3 倍に伸びる。横断統合は SaaS 単一ベンダーの最大価値の一つ。

Q8. Splunk Observability は単独導入の選択肢になるか

A. 中堅企業の単独導入は少数派。Splunk Enterprise を既に全社利用 + Observability 拡張 が典型導入パターン。単独なら Datadog / New Relic 比較で機能差が小さく、UI 学習コストで他 2 社が優位。


追加の一次情報・確認観点

この記事の内容を社内で検討する場合は、一般論だけで判断せず、次の一次情報と自社データを照合してください。特に、稟議・RFP・ベンダー選定では「何を実装するか」よりも「どのリスクをどの水準まで下げるか」を先に決めると、見積もり比較のブレを抑えられます。

確認領域参照先自社で確認すること
脆弱性・注意喚起IPA 情報セキュリティ対象製品、影響範囲、更新手順、社内展開状況を確認する
インシデント対応JPCERT/CC初動、封じ込め、復旧、対外連絡の役割分担を確認する
管理策NIST Cybersecurity Framework識別、防御、検知、対応、復旧のどこが弱いかを確認する
DX推進IPA デジタル基盤センターDX推進指標、IT人材、デジタル基盤の観点で現状を確認する
個人情報個人情報保護委員会個人情報・委託先管理・利用目的・安全管理措置を確認する

稟議・RFPで使う数値設計

投資判断では、導入前後で測れる指標を3から5個に絞ります。下表のように、現状値・目標値・測定方法・責任者をセットにしておくと、PoC後に本番化するかどうかを判断しやすくなります。

指標現状確認目標の置き方失敗しやすい例
対象業務数現状の対象業務を棚卸し初期は1から3業務に限定対象を広げすぎて要件が固まらない
月間処理件数件数、担当者、例外率を確認上位20%の高頻度業務から改善件数が少ない業務を先に自動化する
例外対応率手戻り、確認待ち、属人判断を計測例外の分類と承認ルールを定義例外をAIやシステムだけで吸収しようとする
復旧目標時間RTO/RPOを業務別に確認重要業務から優先順位を設定全システム同一水準で考える
検知から初動までの時間ログ、通知、責任者を確認初動30分以内など明確化通知だけあり対応者が決まっていない

よくある失敗と回避策

失敗パターン起きる理由回避策
目的が曖昧なままツール選定に入る比較軸が価格や機能数に寄る経営課題、業務課題、測定KPIを先に固定する
現場確認が不足する例外処理や非公式運用が見落とされる担当者ヒアリングと実データ確認を必ず行う
運用責任者が決まっていない導入後の改善が止まる業務側とIT側の責任分界をRACIで定義する
バックアップが復旧できない取得だけで復元テストをしていない四半期ごとに復旧訓練を実施する

GXOに相談する前に整理しておく情報

初回相談では、次の情報があると診断と提案の精度が上がります。すべて揃っていなくても問題ありませんが、分かる範囲で用意しておくと、概算費用・期間・体制の見立てを早く出せます。

  • 対象業務の現行フロー、利用中システム、Excel・紙・チャット運用の一覧
  • 月間件数、担当人数、手戻り件数、確認待ち時間などの概算
  • 個人情報、機密情報、外部委託、権限管理に関する制約
  • 希望開始時期、予算レンジ、社内承認者、決裁までの流れ
  • 直近の障害・インシデント履歴、バックアップ方式、EDR/MDR/SOCの導入状況

GXOでは、現状整理、要件定義、RFP作成、ベンダー比較、PoC設計、本番移行計画まで一気通貫で支援できます。記事の内容を自社に当てはめたい場合は、まずは現在の課題と制約を共有してください。

関連記事


参考資料

  • Datadog 公式 Pricing(https://www.datadoghq.com/pricing/)
  • New Relic 公式 Pricing(https://newrelic.com/pricing)
  • Splunk Observability Cloud 公式(https://www.splunk.com/en_us/products/observability.html)
  • Gartner Magic Quadrant for Observability Platforms 2024
  • OpenTelemetry 公式(https://opentelemetry.io/)
  • Datadog "Best practices for managing your spend" 各社公開ドキュメント

中堅企業のオブザーバビリティ コスト最適化のご相談

GXO は中堅企業(従業員 300-3,000 名・ホスト数 50-300 規模)向けに、Datadog / New Relic / Splunk Observability の選定支援、Custom Metrics 監査、ログ階層分離設計、Annual Commit 戦略策定、年額 30-50% 削減プランの実装まで一貫支援します。既存契約の総額見直し、3 製品 PoC 並行実施、商談ディスカウント引き出し支援にも対応可能です。

オブザーバビリティ コスト最適化のご相談はこちら