「AIのAPIを使いたいが、どのサービスが一番コスパがいいのか分からない」――中小企業の経営者やDX担当者から、最も多く寄せられる相談だ。2026年に入り、OpenAI・Anthropic・Googleの3社はいずれも新モデルを投入し、料金体系も大きく変わった。しかし公式の料金表は「100万トークンあたり○ドル」という表記で、実際に月いくらかかるのかが直感的に分かりにくい。本記事では、主要APIの最新料金を日本円ベースの月額コストに換算し、用途別の選び方まで解説する。
目次
- 2026年版 主要API料金一覧
- トークンとは何か――料金計算の基礎知識
- 用途別コスト試算(月1,000リクエスト)
- 中小企業の業務別・最適API選定ガイド
- コスト最適化の実践テクニック
- 導入前に確認すべき3つのポイント
2026年版 主要API料金一覧
以下は、2026年4月時点の主要LLM APIの料金表だ。1ドル=155円で換算している(2026年3月末時点の為替レート参考値)。
| モデル | 提供元 | 入力($/100万トークン) | 出力($/100万トークン) | 入力(円/100万トークン) | 出力(円/100万トークン) |
|---|---|---|---|---|---|
| GPT-4o | OpenAI | $2.50 | $10.00 | 約388円 | 約1,550円 |
| GPT-4.1 | OpenAI | $2.00 | $8.00 | 約310円 | 約1,240円 |
| Claude Sonnet 4.6 | Anthropic | $3.00 | $15.00 | 約465円 | 約2,325円 |
| Claude Haiku 4.5 | Anthropic | $0.80 | $4.00 | 約124円 | 約620円 |
| Gemini 2.5 Pro | $1.25 | $10.00 | 約194円 | 約1,550円 |
ポイント:入力単価と出力単価は大きく異なる。出力(AIが生成するテキスト)は入力の3〜5倍の単価が設定されている。実際のコスト試算では出力トークン数が支配的になるため、出力単価を重視して比較すべきだ。
セクションまとめ:GPT-4.1が入出力ともに最安。Claude Sonnet 4.6は出力品質が高いぶん単価も高め。Gemini 2.5 Proは入力が安く、大量の文書を読み込む用途に有利。
トークンとは何か――料金計算の基礎知識
API料金を理解するには「トークン」の概念を押さえる必要がある。トークンとは、AIがテキストを処理する際の最小単位だ。
日本語のトークン数の目安
- 日本語1文字 = 約1〜3トークン(漢字は2〜3トークン、ひらがなは1〜2トークン)
- 日本語1,000文字 = 約1,500〜2,000トークン
- A4用紙1枚(約1,500文字) = 約2,000〜3,000トークン
英語に比べて日本語はトークン効率が悪い。同じ内容でも日本語は英語の1.5〜2倍のトークンを消費する。これは日本語でAPI利用する際のコスト増要因として覚えておくべきだ。
1回のリクエストにかかるトークン数の目安
| 用途 | 入力トークン | 出力トークン | 合計 |
|---|---|---|---|
| 短い質問応答 | 500 | 300 | 800 |
| メール文案作成 | 800 | 1,000 | 1,800 |
| 議事録要約(A4 3枚) | 8,000 | 2,000 | 10,000 |
| 長文レポート生成 | 3,000 | 5,000 | 8,000 |
| 問い合わせ対応(RAG付き) | 5,000 | 1,500 | 6,500 |
用途別コスト試算(月1,000リクエスト)
実際に中小企業が月1,000リクエスト(1日あたり約33回)利用した場合の月額コストを試算する。
ケース1:社内チャットボット(短い質問応答)
1リクエストあたり:入力500トークン+出力300トークン
| モデル | 月額コスト(円) | 特徴 |
|---|---|---|
| GPT-4o | 約660円 | バランス型。応答速度が速い |
| GPT-4.1 | 約530円 | 最安クラス。コーディング性能も高い |
| Claude Sonnet 4.6 | 約930円 | 日本語の自然さに優位性 |
| Claude Haiku 4.5 | 約250円 | 圧倒的に安い。軽量タスク向け |
| Gemini 2.5 Pro | 約400円 | コスパ良好。Google連携に強み |
ケース2:メール・文書作成支援
1リクエストあたり:入力800トークン+出力1,000トークン
| モデル | 月額コスト(円) | 特徴 |
|---|---|---|
| GPT-4o | 約1,860円 | 安定した文章品質 |
| GPT-4.1 | 約1,490円 | 最安。指示追従性が高い |
| Claude Sonnet 4.6 | 約2,680円 | 日本語ビジネス文書の品質が高い |
| Claude Haiku 4.5 | 約770円 | 定型メール作成なら十分な品質 |
| Gemini 2.5 Pro | 約1,700円 | 長文出力に安定 |
ケース3:議事録要約・レポート生成
1リクエストあたり:入力8,000トークン+出力2,000トークン
| モデル | 月額コスト(円) | 特徴 |
|---|---|---|
| GPT-4o | 約4,200円 | 要約精度が高い |
| GPT-4.1 | 約3,360円 | 最安。長文入力にも安定 |
| Claude Sonnet 4.6 | 約5,840円 | 200Kコンテキストで長文に強い |
| Claude Haiku 4.5 | 約2,230円 | 要約タスクでは高コスパ |
| Gemini 2.5 Pro | 約4,650円 | 100万トークンの入力に対応 |
ケース4:問い合わせ対応システム(RAG連携)
1リクエストあたり:入力5,000トークン+出力1,500トークン
| モデル | 月額コスト(円) | 特徴 |
|---|---|---|
| GPT-4o | 約3,270円 | Function Calling対応が充実 |
| GPT-4.1 | 約2,620円 | 最安。ツール利用の精度も向上 |
| Claude Sonnet 4.6 | 約5,820円 | 指示追従性・安全性が高い |
| Claude Haiku 4.5 | 約1,430円 | 簡易な問い合わせなら十分 |
| Gemini 2.5 Pro | 約3,330円 | Googleサービスとの親和性 |
中小企業の業務別・最適API選定ガイド
「結局どれを選べばいいのか」を業務タイプ別に整理する。
社内ヘルプデスク・FAQ対応
推奨:Claude Haiku 4.5 または GPT-4.1
理由:応答速度が重要で、出力は短文が中心。高い推論能力は不要なため、軽量・低価格モデルで十分だ。月1万件の問い合わせでも月額3,000〜5,000円程度に収まる。
ビジネス文書・メール作成
推奨:Claude Sonnet 4.6 または GPT-4o
理由:日本語の敬語・ビジネス慣習を踏まえた文章品質が求められる。Claude Sonnet 4.6は日本語の自然さに定評がある。GPT-4oは応答速度とのバランスが良い。月額は2,000〜3,000円程度。
大量文書の要約・分析
推奨:Gemini 2.5 Pro
理由:入力トークンの単価が最安で、コンテキストウィンドウが100万トークンと圧倒的に広い。契約書の一括分析、マニュアル全文の要約など、大量のテキストを入力する用途で最もコストパフォーマンスが高い。
コード生成・システム開発支援
推奨:GPT-4.1 または Claude Sonnet 4.6
理由:GPT-4.1はコーディングベンチマークで高い性能を示しており、単価も安い。Claude Sonnet 4.6はコードの正確性と長いコンテキスト理解に優れる。開発チームの利用頻度が高い場合はGPT-4.1のコスト優位性が効いてくる。
顧客対応チャットボット(外部公開)
推奨:Claude Sonnet 4.6 または GPT-4o
理由:顧客接点であるため、回答品質と安全性(ハルシネーションの抑制)が最優先。Claude Sonnet 4.6は安全性評価で業界トップクラス。GPT-4oはモデレーション機能との連携が容易。
選定判断フローチャート
- 月間予算1万円以下で抑えたい → Claude Haiku 4.5
- 日本語の文章品質が最優先 → Claude Sonnet 4.6
- 大量文書の入力が中心 → Gemini 2.5 Pro
- コーディング用途が多い → GPT-4.1
- 汎用的に使いたい → GPT-4o
セクションまとめ:万能なモデルは存在しない。業務タイプごとに最適なモデルは異なる。複数モデルを用途別に使い分けるのが最もコスパの高い運用だ。
コスト最適化の実践テクニック
APIコストを抑えるための実践的なテクニックを5つ紹介する。
1. モデルの使い分け(ルーティング)
ここまで読んで
「うちも同じだ」と思った方へ
課題は企業ごとに異なります。30分の無料相談で、
御社に合った進め方と概算費用をお伝えします。
営業電話なし エンジニアが直接対応 相談だけでもOK
すべてのリクエストを高性能モデルに送る必要はない。簡単な質問にはHaikuクラスの軽量モデル、複雑な分析にはSonnetクラスの高性能モデルを自動で振り分ける仕組みを導入すると、平均コストを40〜60%削減できる。
2. プロンプトの最適化
冗長なプロンプトはトークンを浪費する。「以下の文章を要約してください。要約は300文字以内で、箇条書きにしてください」のように、指示を明確かつ簡潔にするだけで入力トークンを20〜30%削減できるケースがある。
3. キャッシュの活用
同一の質問に対しては、APIを呼び出さずにキャッシュから回答を返す。FAQ対応のように同じ質問が繰り返されるユースケースでは、キャッシュ導入でAPI呼び出し回数を50〜70%削減できる。AnthropicとOpenAIはともにプロンプトキャッシュ機能を提供しており、キャッシュヒット時は入力コストが最大90%割引になる。
4. バッチAPIの利用
リアルタイム応答が不要な処理(夜間の一括文書変換、定期レポート生成など)は、バッチAPIを使うことで通常料金の50%割引で処理できる。OpenAI、Anthropicともにバッチ処理用のAPIを提供している。
5. 出力トークンの制限
APIリクエスト時にmax_tokensパラメータを設定し、不要に長い出力を防ぐ。たとえば要約タスクではmax_tokensを500に設定するだけで、出力コストの暴走を防げる。
セクションまとめ:モデルの使い分け・キャッシュ・バッチAPIの3つを組み合わせれば、API費用を50〜70%削減できる。導入初期から最適化設計を組み込むことが重要だ。
導入前に確認すべき3つのポイント
1. 従量課金の上限設定
APIは従量課金であるため、設定ミスや予期しない大量リクエストで請求額が跳ね上がるリスクがある。OpenAI・Anthropic・Googleいずれも月額上限(Usage Limit)を設定できるので、導入初日に必ず設定すること。テスト段階では月額1万円程度の上限から始めるのが安全だ。
2. データの取り扱いポリシー
API経由で送信したデータがモデルの学習に使用されるかどうかは、各社のポリシーによって異なる。2026年4月時点では、OpenAI API・Anthropic API・Google Cloud AI APIのいずれも、API経由のデータをモデル学習に使用しないことを明示している。ただしポリシーは変更される可能性があるため、契約時に最新のデータ利用規約を確認すべきだ。
3. レイテンシ(応答速度)の確認
リアルタイム対応が必要な顧客向けチャットボットでは、API応答速度が体感品質に直結する。軽量モデル(Haiku、GPT-4.1 mini等)は応答開始まで0.3〜0.5秒、高性能モデル(Sonnet 4.6、GPT-4o)は0.5〜1.5秒が目安だ。日本からのアクセスではリージョン選択も応答速度に影響するため、PoC段階で実測しておくことを推奨する。
セクションまとめ:従量課金の上限設定、データポリシーの確認、レイテンシの実測。この3つを導入前に押さえておけば、運用開始後のトラブルを大幅に減らせる。
まとめ
2026年のLLM API市場は、各社の値下げ競争により中小企業にとって現実的な価格帯になった。月1,000リクエスト程度の利用であれば、どのモデルでも月額数千円に収まる。
最適な選択はユースケースによって異なる。コスト最優先ならClaude Haiku 4.5かGPT-4.1、日本語品質重視ならClaude Sonnet 4.6、大量文書処理ならGemini 2.5 Pro。そして最もコスパが高い運用は、用途別に複数モデルを使い分けることだ。
| 判断軸 | 推奨モデル | 月額目安(1,000リクエスト) |
|---|---|---|
| コスト最優先 | Claude Haiku 4.5 | 250〜2,200円 |
| 汎用バランス | GPT-4o / GPT-4.1 | 530〜3,400円 |
| 日本語品質重視 | Claude Sonnet 4.6 | 930〜5,800円 |
| 大量文書入力 | Gemini 2.5 Pro | 400〜4,700円 |
AI開発の無料相談
「自社の業務にどのAPIが最適か分からない」「API連携の開発を依頼したい」――GXOでは、API選定からシステム開発・運用まで一貫して支援しています。まずは無料相談で、貴社の業務に合ったAI活用プランをご提案します。
※ 営業電話はしません | オンライン対応可 | 相談だけでもOK
よくある質問(FAQ)
Q1. APIの利用にプログラミング知識は必要ですか?
A1. API単体の利用にはプログラミング知識が必要だ。ただし、Difyなどのノーコードプラットフォームを使えば、プログラミング不要でAPIを活用したチャットボットやワークフローを構築できる。自社にエンジニアがいない場合は、開発会社に構築を依頼するか、ノーコードツールの活用を検討するとよい。
Q2. 無料枠はありますか?
A2. Google Gemini APIは無料枠(1分あたり一定リクエスト数まで)を提供している。OpenAIは新規アカウント登録時に一定額のクレジットを付与する場合がある。Anthropicは無料枠の提供はないが、バッチAPIによる50%割引がある。いずれも最新の条件は各社公式サイトで確認すること。
Q3. 日本語の処理は英語より高くなりますか?
A3. はい。日本語は英語に比べて1.5〜2倍のトークンを消費するため、同じ内容でもコストが高くなる。本記事の試算はすべて日本語利用を前提としたトークン数で計算している。
Q4. 途中でモデルを切り替えることはできますか?
A4. できる。APIはリクエスト単位でモデルを指定するため、いつでも切り替え可能だ。特定の用途だけ別モデルに変更することもできるので、テスト段階で複数モデルを試し、タスクごとの最適解を見つけることを推奨する。
Q5. セキュリティ面で注意すべきことは?
A5. APIキーの管理が最も重要だ。ソースコードにAPIキーを直接記載せず、環境変数やシークレット管理ツールを使うこと。また、個人情報や機密情報をAPIに送信する場合は、各社のデータ利用ポリシーを確認し、必要に応じてデータのマスキング処理を組み込むべきだ。
参考資料
- OpenAI API Pricing(2026年4月確認) https://openai.com/api/pricing/
- Anthropic API Pricing(2026年4月確認) https://docs.anthropic.com/en/docs/about-claude/pricing
- Google AI for Developers - Gemini API Pricing(2026年4月確認) https://ai.google.dev/pricing
- 総務省「令和7年版 情報通信白書」AI利活用動向(2025年)
- 経済産業省「AI利活用ガイドライン」(2024年4月公表)
「AIで何かやれ」と言われたら
まずは2週間の無料PoCから
御社の業務データで実際にAIを動かし、効果を検証。
PoCの結果を基に、本格導入の費用とROIをご提案します。
- 2週間で効果を実証
- PoCは完全無料
- ROI試算レポート付き
メールアドレスだけでOK|営業電話は一切なし



