結論を 30 秒で。 「100 万トークンあたり ○ ドル」では実コストが見えません。本記事は 2026 年 Q2 時点の主要 5 モデル(GPT-4o / GPT-4.1 / Claude Sonnet 4.6 / Claude Haiku 4.5 / Gemini 2.5 Pro)の API 料金を 円月額に換算し、社内チャット / 文書作成 / 議事録要約 / RAG の 4 業務別に 月 1,000 リクエストの実コスト と最適モデルを早見表化しました。中堅・中小企業の業務別選定基準も網羅しています。

目次

  1. 2026年版 主要API料金一覧
  2. トークンとは何か――料金計算の基礎知識
  3. 用途別コスト試算(月1,000リクエスト)
  4. 中小企業の業務別・最適API選定ガイド
  5. コスト最適化の実践テクニック
  6. 導入前に確認すべき3つのポイント

2026年版 主要API料金一覧

以下は、2026年4月時点の主要LLM APIの料金表です。1ドル=155円で換算しています(2026年3月末時点の為替レート参考値)。

モデル提供元入力($/100万トークン)出力($/100万トークン)入力(円/100万トークン)出力(円/100万トークン)
GPT-4oOpenAI$2.50$10.00約388円約1,550円
GPT-4.1OpenAI$2.00$8.00約310円約1,240円
Claude Sonnet 4.6Anthropic$3.00$15.00約465円約2,325円
Claude Haiku 4.5Anthropic$0.80$4.00約124円約620円
Gemini 2.5 ProGoogle$1.25$10.00約194円約1,550円

※ 各社公式料金ページ(2026年4月確認)に基づきます。為替変動により円建て金額は変わります。キャッシュ利用やバッチAPIによる割引は含みません。

ポイント:入力単価と出力単価は大きく異なります。出力(AIが生成するテキスト)は入力の3〜5倍の単価が設定されています。実際のコスト試算では出力トークン数が支配的になるため、出力単価を重視して比較するとよいでしょう。

セクションまとめ:GPT-4.1が入出力ともに最安です。Claude Sonnet 4.6は出力品質が高いぶん単価も高めです。Gemini 2.5 Proは入力が安く、大量の文書を読み込む用途に有利です。


トークンとは何か――料金計算の基礎知識

API料金を理解するには「トークン」の概念を押さえる必要があります。トークンとは、AIがテキストを処理する際の最小単位です。

日本語のトークン数の目安

  • 日本語1文字 = 約1〜3トークン(漢字は2〜3トークン、ひらがなは1〜2トークン)
  • 日本語1,000文字 = 約1,500〜2,000トークン
  • A4用紙1枚(約1,500文字) = 約2,000〜3,000トークン

英語に比べて日本語はトークン効率が悪いです。同じ内容でも日本語は英語の1.5〜2倍のトークンを消費します。これは日本語でAPI利用する際のコスト増要因として覚えておくとよいでしょう。

1回のリクエストにかかるトークン数の目安

用途入力トークン出力トークン合計
短い質問応答500300800
メール文案作成8001,0001,800
議事録要約(A4 3枚)8,0002,00010,000
長文レポート生成3,0005,0008,000
問い合わせ対応(RAG付き)5,0001,5006,500

セクションまとめ:日本語は英語の約1.5〜2倍のトークンを消費します。コスト試算では「出力トークン数 x 出力単価」が支配的です。事前にユースケースごとのトークン数を見積もることが重要です。


用途別コスト試算(月1,000リクエスト)

実際に中小企業が月1,000リクエスト(1日あたり約33回)利用した場合の月額コストを試算します。

ケース1:社内チャットボット(短い質問応答)

1リクエストあたり:入力500トークン+出力300トークン

モデル月額コスト(円)特徴
GPT-4o約660円バランス型。応答速度が速い
GPT-4.1約530円最安クラス。コーディング性能も高い
Claude Sonnet 4.6約930円日本語の自然さに優位性
Claude Haiku 4.5約250円圧倒的に安い。軽量タスク向け
Gemini 2.5 Pro約400円コスパ良好。Google連携に強み

ケース2:メール・文書作成支援

1リクエストあたり:入力800トークン+出力1,000トークン

モデル月額コスト(円)特徴
GPT-4o約1,860円安定した文章品質
GPT-4.1約1,490円最安。指示追従性が高い
Claude Sonnet 4.6約2,680円日本語ビジネス文書の品質が高い
Claude Haiku 4.5約770円定型メール作成なら十分な品質
Gemini 2.5 Pro約1,700円長文出力に安定

ケース3:議事録要約・レポート生成

1リクエストあたり:入力8,000トークン+出力2,000トークン

モデル月額コスト(円)特徴
GPT-4o約4,200円要約精度が高い
GPT-4.1約3,360円最安。長文入力にも安定
Claude Sonnet 4.6約5,840円200Kコンテキストで長文に強い
Claude Haiku 4.5約2,230円要約タスクでは高コスパ
Gemini 2.5 Pro約4,650円100万トークンの入力に対応

ケース4:問い合わせ対応システム(RAG連携)

1リクエストあたり:入力5,000トークン+出力1,500トークン

モデル月額コスト(円)特徴
GPT-4o約3,270円Function Calling対応が充実
GPT-4.1約2,620円最安。ツール利用の精度も向上
Claude Sonnet 4.6約5,820円指示追従性・安全性が高い
Claude Haiku 4.5約1,430円簡易な問い合わせなら十分
Gemini 2.5 Pro約3,330円Googleサービスとの親和性

セクションまとめ:月1,000リクエスト程度であれば、どのモデルでも月額1万円以下に収まります。コスト最優先ならClaude Haiku 4.5かGPT-4.1、品質重視ならClaude Sonnet 4.6かGPT-4oがおすすめです。


中小企業の業務別・最適API選定ガイド

「結局どれを選べばいいのか」を業務タイプ別に整理します。

社内ヘルプデスク・FAQ対応

推奨:Claude Haiku 4.5 または GPT-4.1

理由:応答速度が重要で、出力は短文が中心です。高い推論能力は不要なため、軽量・低価格モデルで十分です。月1万件の問い合わせでも月額3,000〜5,000円程度に収まります。

ビジネス文書・メール作成

推奨:Claude Sonnet 4.6 または GPT-4o

理由:日本語の敬語・ビジネス慣習を踏まえた文章品質が求められます。Claude Sonnet 4.6は日本語の自然さに定評があります。GPT-4oは応答速度とのバランスが良好です。月額は2,000〜3,000円程度です。

大量文書の要約・分析

推奨:Gemini 2.5 Pro

理由:入力トークンの単価が最安で、コンテキストウィンドウが100万トークンと圧倒的に広いです。契約書の一括分析、マニュアル全文の要約など、大量のテキストを入力する用途で最もコストパフォーマンスが高くなります。

コード生成・システム開発支援

推奨:GPT-4.1 または Claude Sonnet 4.6

理由:GPT-4.1はコーディングベンチマークで高い性能を示しており、単価も安いです。Claude Sonnet 4.6はコードの正確性と長いコンテキスト理解に優れています。開発チームの利用頻度が高い場合はGPT-4.1のコスト優位性が効いてきます。

顧客対応チャットボット(外部公開)

推奨:Claude Sonnet 4.6 または GPT-4o

理由:顧客接点であるため、回答品質と安全性(ハルシネーションの抑制)が最優先です。Claude Sonnet 4.6は安全性評価で業界トップクラスです。GPT-4oはモデレーション機能との連携が容易です。

選定判断フローチャート

  1. 月間予算1万円以下で抑えたい → Claude Haiku 4.5
  2. 日本語の文章品質が最優先 → Claude Sonnet 4.6
  3. 大量文書の入力が中心 → Gemini 2.5 Pro
  4. コーディング用途が多い → GPT-4.1
  5. 汎用的に使いたい → GPT-4o

セクションまとめ:万能なモデルは存在しません。業務タイプごとに最適なモデルは異なります。複数モデルを用途別に使い分けるのが最もコスパの高い運用です。


コスト最適化の実践テクニック

APIコストを抑えるための実践的なテクニックを5つ紹介します。

1. モデルの使い分け(ルーティング)

すべてのリクエストを高性能モデルに送る必要はありません。簡単な質問にはHaikuクラスの軽量モデル、複雑な分析にはSonnetクラスの高性能モデルを自動で振り分ける仕組みを導入すると、平均コストを40〜60%削減できます。

2. プロンプトの最適化

冗長なプロンプトはトークンを浪費します。「以下の文章を要約してください。要約は300文字以内で、箇条書きにしてください」のように、指示を明確かつ簡潔にするだけで入力トークンを20〜30%削減できるケースがあります。

3. キャッシュの活用

同一の質問に対しては、APIを呼び出さずにキャッシュから回答を返します。FAQ対応のように同じ質問が繰り返されるユースケースでは、キャッシュ導入でAPI呼び出し回数を50〜70%削減できます。AnthropicとOpenAIはともにプロンプトキャッシュ機能を提供しており、キャッシュヒット時は入力コストが最大90%割引になります。

4. バッチAPIの利用

リアルタイム応答が不要な処理(夜間の一括文書変換、定期レポート生成など)は、バッチAPIを使うことで通常料金の50%割引で処理できます。OpenAI、Anthropicともにバッチ処理用のAPIを提供しています。

5. 出力トークンの制限

APIリクエスト時にmax_tokensパラメータを設定し、不要に長い出力を防ぎます。たとえば要約タスクではmax_tokensを500に設定するだけで、出力コストの暴走を防げます。

セクションまとめ:モデルの使い分け・キャッシュ・バッチAPIの3つを組み合わせれば、API費用を50〜70%削減できます。導入初期から最適化設計を組み込むことが重要です。


導入前に確認すべき3つのポイント

1. 従量課金の上限設定

APIは従量課金であるため、設定ミスや予期しない大量リクエストで請求額が跳ね上がるリスクがあります。OpenAI・Anthropic・Googleいずれも月額上限(Usage Limit)を設定できるので、導入初日に必ず設定しましょう。テスト段階では月額1万円程度の上限から始めるのが安全です。

2. データの取り扱いポリシー

API経由で送信したデータがモデルの学習に使用されるかどうかは、各社のポリシーによって異なります。2026年4月時点では、OpenAI API・Anthropic API・Google Cloud AI APIのいずれも、API経由のデータをモデル学習に使用しないことを明示しています。ただしポリシーは変更される可能性があるため、契約時に最新のデータ利用規約を確認しましょう。

3. レイテンシ(応答速度)の確認

リアルタイム対応が必要な顧客向けチャットボットでは、API応答速度が体感品質に直結します。軽量モデル(Haiku、GPT-4.1 mini等)は応答開始まで0.3〜0.5秒、高性能モデル(Sonnet 4.6、GPT-4o)は0.5〜1.5秒が目安です。日本からのアクセスではリージョン選択も応答速度に影響するため、PoC段階で実測しておくことをおすすめします。

セクションまとめ:従量課金の上限設定、データポリシーの確認、レイテンシの実測。この3つを導入前に押さえておけば、運用開始後のトラブルを大幅に減らせます。


まとめ

2026年のLLM API市場は、各社の値下げ競争により中小企業にとって現実的な価格帯になりました。月1,000リクエスト程度の利用であれば、どのモデルでも月額数千円に収まります。

最適な選択はユースケースによって異なります。コスト最優先ならClaude Haiku 4.5かGPT-4.1、日本語品質重視ならClaude Sonnet 4.6、大量文書処理ならGemini 2.5 Pro。そして最もコスパが高い運用は、用途別に複数モデルを使い分けることです。

判断軸推奨モデル月額目安(1,000リクエスト)
コスト最優先Claude Haiku 4.5250〜2,200円
汎用バランスGPT-4o / GPT-4.1530〜3,400円
日本語品質重視Claude Sonnet 4.6930〜5,800円
大量文書入力Gemini 2.5 Pro400〜4,700円

まずは月額上限1万円でテスト環境を構築し、自社の業務で実際にトークン消費量を測定するところから始めてみてください。数字が見えれば、稟議書に書くべきROIも自然と導き出せます。


この記事を読んだ方に人気の資料(無料 DL)

実務で使えるチェックリスト・テンプレート・ガイドブックを無料でダウンロードいただけます。

特にダウンロード数が多い資料 TOP 3

貴社の AI 導入可否を自己診断できる 20 項目チェックリスト(PDF 15P) 実績報告書・事業計画書・効果報告書の Excel / Word テンプレート(計 12 ファイル) 段階的な DX 内製化の実施手順、必要スキル、採用戦略(PDF 32P)

その他の人気資料

  • RFP(提案依頼書)テンプレート(システム開発会社選定用)
  • 稟議書テンプレート(DX 投資承認用、役員向け)
  • 補助金採択後 PMO チェックリスト(税理士法人・行政書士向け)
  • セキュリティ運用チェックリスト(中堅企業向け 30 項目)

資料一覧を見る →

メールアドレスのみで DL 可能、営業メールは送りません。

AI 導入を検討中の方向け:

  • AI 導入アセスメント 20 項目
  • AI 内製化ロードマップ
  • 生成 AI 社内規程テンプレート(10 条文、コピペ可)

AI開発の無料相談

「自社の業務にどのAPIが最適か分からない」「API連携の開発を依頼したい」――GXOでは、API選定からシステム開発・運用まで一貫して支援しています。まずは無料相談で、貴社の業務に合ったAI活用プランをご提案します。

無料相談はこちら

※ 営業電話はしません | オンライン対応可 | 相談だけでもOK


30分のオンライン診断で、貴社のPhase 1 PoC試算をお渡しします

貴社の業種・業務シナリオ(チャットボット/文書作成/議事録要約/RAG問い合わせ)に合わせて、GPT-4.x/Claude 4.x/Gemini 3の最適モデル選定とPhase 1 PoCの想定投資額・月額ランニングを試算します。

  • 貴社の業務規模・既存システム環境をヒアリング
  • AI/DX適用可否の即席アセスメント
  • Phase 1 PoCの想定投資額とROI回収年数を試算
  • 補助金活用(IT導入補助金/ものづくり補助金/事業再構築)の可否判定

NDA締結可、藤吉ダイレクト窓口で承ります。営業電話はしません。

無料診断を申し込む →


よくある質問(FAQ)

Q1. APIの利用にプログラミング知識は必要ですか?

A1. API単体の利用にはプログラミング知識が必要です。ただし、Difyなどのノーコードプラットフォームを使えば、プログラミング不要でAPIを活用したチャットボットやワークフローを構築できます。自社にエンジニアがいない場合は、開発会社に構築を依頼するか、ノーコードツールの活用を検討するとよいでしょう。

Q2. 無料枠はありますか?

A2. Google Gemini APIは無料枠(1分あたり一定リクエスト数まで)を提供しています。OpenAIは新規アカウント登録時に一定額のクレジットを付与する場合があります。Anthropicは無料枠の提供はありませんが、バッチAPIによる50%割引があります。いずれも最新の条件は各社公式サイトで確認してください。

Q3. 日本語の処理は英語より高くなりますか?

A3. はい。日本語は英語に比べて1.5〜2倍のトークンを消費するため、同じ内容でもコストが高くなります。本記事の試算はすべて日本語利用を前提としたトークン数で計算しています。

Q4. 途中でモデルを切り替えることはできますか?

A4. できます。APIはリクエスト単位でモデルを指定するため、いつでも切り替え可能です。特定の用途だけ別モデルに変更することもできるので、テスト段階で複数モデルを試し、タスクごとの最適解を見つけることをおすすめします。

Q5. セキュリティ面で注意すべきことは?

A5. APIキーの管理が最も重要です。ソースコードにAPIキーを直接記載せず、環境変数やシークレット管理ツールを使いましょう。また、個人情報や機密情報をAPIに送信する場合は、各社のデータ利用ポリシーを確認し、必要に応じてデータのマスキング処理を組み込みましょう。


参考資料

  • OpenAI API Pricing(2026 年 4 月確認) https://openai.com/api/pricing/
  • Anthropic API Pricing(2026 年 4 月確認) https://docs.anthropic.com/en/docs/about-claude/pricing
  • Google AI for Developers - Gemini API Pricing(2026 年 4 月確認) https://ai.google.dev/pricing
  • 総務省「令和 7 年版 情報通信白書」AI 利活用動向(2025 年)
  • 経済産業省「AI 利活用ガイドライン」(2024 年 4 月公表)

まとめと次の一歩

  • 入力単価より出力単価が支配的 — 出力 1 トークンの価格は入力の 3〜5 倍
  • 中堅企業の現実解は 「業務ごとに最適モデル」:軽量タスク = Haiku / Gemini Flash、品質重視 = Claude Sonnet 4.6
  • 日本語は英語の 1.5〜2 倍トークン消費 → 円換算実コストで比較すること
  • バッチ API / プロンプトキャッシュで 50% 削減も可能
  • API キー管理 + データ送信前マスキングはセキュリティ必須

なお、API 単価の比較だけで予算を確定すると、本番運用で従量課金・推論コストが膨らみ破綻するのが典型的な失敗パターンです。発注前にAI開発のランニングコスト(従量課金・推論コスト)で破綻しないTCOの見積もり方と、見積書の「AI一式」表記を読み解く方法を確認しておくと、ベンダー見積もりの妥当性を自社で判断できます。失敗パターンを網羅的に押さえたい場合は連載AI開発発注の失敗図鑑(全26回)が体系的です。

GXO は中堅企業の AI 投資判断(モデル選定 / コスト試算 / セキュリティ設計)を 180 社の支援実績で伴走しています。

関連記事