主要LLM API の料金差
2026年3月7日時点でも、主要LLMプロバイダーの価格差はかなり大きくなっています。たとえば高性能帯では GPT-5.4、Claude Sonnet 4.6、Gemini 3.1 Pro Preview、Gemini 2.5 Pro、Grok 4、Command A などが並びますが、入力単価も出力単価も各社で大きく異なります。一方で、GPT-5 mini、GPT-4.1 mini、Gemini 3.1 Flash-Lite Preview、Gemini 2.5 Flash-Lite、Mistral Small 3.2、Command R7B、DeepSeek Chat V3.2 のような低コスト帯も増えており、用途ごとの使い分けがしやすくなっています。
コスト最適化の鍵は、用途に応じたモデル選択です。下書きやリサーチには低コストモデル、最終仕上げや複雑な要約だけ高性能モデルに寄せると、品質と単価のバランスを取りやすくなります。Gemini 系も 2.5 だけでなく 3.1 系 preview まで見ておくと、価格差と性能帯の判断がしやすくなります。
日本語はなぜトークンが増えやすいのか
LLMのトークナイザーは英語テキストを効率的に処理するよう設計されています。英語では1単語が1〜2トークンに収まるのに対し、日本語の漢字・ひらがな・カタカナは1文字あたり1.5〜3トークンに分割されることが一般的です。
たとえば「人工知能」という4文字は約6トークンに展開されますが、英語の「AI」は1トークンです。このツールではCJK文字を1.5トークン/文字、英数字を0.25トークン/文字として概算し、日英混在テキストでも加重平均で妥当な見積もりを提供します。
キャッシュ・Batch・長文料金とは
キャッシュ価格: OpenAI・Anthropic・DeepSeek など一部プロバイダーでは、繰り返し送るシステムプロンプトや参考資料にキャッシュ価格を適用できます。同じ入力を何度も使うワークフローでは、通常入力よりかなり安くなることがあります。
Batch API / Batch mode: OpenAI・Anthropic・Google・xAI では、リアルタイム性が不要な処理をまとめて送ることで通常より安い価格を使えるケースがあります。大量のコンテンツ分析やアーカイブ処理では、まずここを確認すると差が出ます。
長文料金: Gemini 2.5 Pro や Claude Opus 4.6 など、一部モデルでは長いコンテキストに対して単価が上がります。大量の資料を一括投入する前に、分割送信や軽量モデルへの切り替えを検討する方が安全です。
よくある使い方別の料金目安
コンテンツ制作における代表的な使い方と、おおよその1件あたりコストを以下にまとめます。実際の単価は選ぶモデルで大きく変わるため、まずテキストモードで候補を広めに比較してから、シナリオモードで月額化する使い方が実務向きです。
- ブログ記事(8,000字出力、リライト2回): 約$0.30〜0.50/記事
- SEOリライト(6,000字、リライト1回): 約$0.20〜0.35/記事
- 長文要約(10,000字入力→1,000字出力): 約$0.03〜0.05/件
- RAG回答生成(5,000字コンテキスト): 約$0.02〜0.04/件
GPT-5 mini、Gemini 2.5 Flash-Lite、Mistral Small 3.2、Command R7B、DeepSeek Chat V3.2 などを使うと、上記よりかなり低い単価で処理できることがあります。シナリオモードで実際のワークフローに合わせた見積もりをお試しください。
よくある質問(FAQ)
- このツールのトークン数はどのくらい正確ですか?
- 現時点では CJK文字を約1.5トークン/文字、英数字を約0.25トークン/文字として概算しています。実際のトークン数はモデルごとの tokenizer によって異なるため、厳密値ではなく予算比較の目安としてお使いください。OpenAI exact 対応などは段階的に追加予定です。
- 日本語はなぜ英語よりトークン数が多いのですか?
- LLMのトークナイザーは英語を基準に学習されているため、日本語の漢字・ひらがな・カタカナは1文字あたり複数のトークンに分割されます。一般的に、日本語テキストは同じ文字数の英語テキストと比べて4〜6倍のトークンを消費します。
- Batch APIとは何ですか?
- 即時レスポンスが不要なリクエストをまとめて処理する仕組みです。OpenAI・Anthropic・Google・xAIなど一部プロバイダーでは通常料金より安いバッチ価格が用意されており、大量のコンテンツ生成や分析に向いています。
- キャッシュ対応モデルは何が違いますか?
- OpenAI・Anthropic・DeepSeekなど一部のAPIでは、繰り返し使うシステムプロンプトや長い参考資料に対してキャッシュ価格が適用されます。運用によっては、毎回フル入力するより大幅に安くなるため、継続処理やRAG系ワークフローで効果が出やすいです。
- 価格データはいつ更新されていますか?
- 各モデルの価格データには取得日が記録されています。APIの公式料金ページを定期的に確認し、更新しています。最新の正確な料金は各プロバイダーの公式サイトをご確認ください。