2025年3月現在、多くの大規模言語モデル(LLM)が利用可能になっています。以下では、最新の主要LLMモデルの比較表を作成し、それぞれの特徴を解説します。
スペック、コストについては、ご利用の前に公式のサイトをご確認ください。
Text Generation Models
主要LLMモデル比較表
モデル名 | 開発企業 | 最大入力トークン | 最大出力トークン | 入力コスト(/1Mトークン) | 出力コスト(/1Mトークン) | 対応ファイル形式 | 特徴 |
---|---|---|---|---|---|---|---|
GPT-4.5 | OpenAI | 128,000 | 128,000 | $75.00 | $150.00 | テキスト、画像、音声、動画 | 2025年2月リリース、自然な会話と感情知能を強化 |
GPT-4o | OpenAI | 128,000 | 128,000 | $2.50 | $10.00 | テキスト、画像、音声、動画 | マルチモーダル処理に特化 |
GPT-4o mini | OpenAI | 128,000 | 128,000 | $0.15 | $0.60 | テキスト、画像、音声、動画 | GPT-4oの軽量版 |
Claude 3.7 Sonnet | Anthropic | 200,000 | 128,000 | $3.00 | $15.00 | テキスト、画像、PDF | 2025年2月リリース、ハイブリッド推論能力、コーディングと開発に強い |
Gemini 2.0 Flash | 1,048,576 | 8,192 | $0.10 | $0.40 | テキスト、画像、音声、動画 | 超長文コンテキスト、高速処理[ | |
Gemini 1.5 Pro | 2,097,152 | 8,192 | $1.25 | $5.00 | テキスト、画像、音声、動画 | 超長文コンテキスト、高精度[2] | |
LlaMA 3.3 (70B) | Meta | 128,000 | 128,000 | 無料(オープンソース) | 無料(オープンソース) | テキスト、画像 | 2024年12月リリース、マルチモーダル対応、オープンソース[ |
モデル別の特徴と用途
OpenAIモデル
- GPT-4.5: 2025年2月末にリリースされた最新モデルで、会話の自然さや感情知能が強化されています。
- GPT-4o: oは、”omni”の略で、テキスト、音声、画像、動画などのマルチモーダル処理に特化しています。
- OpenAI o1シリーズ: 推論に特化したモデルで、難問解決能力が高いのが特徴です。
Anthropicモデル
- Claude 3.7 Sonnet: 2025年2月にリリースされ、「ハイブリッド推論」能力を備え、高速応答と段階的な深い思考を両立しています。特にコーディングとフロントエンド開発での問題解決に優れています。
Googleモデル
- Gemini 2.0シリーズ: マルチモーダル入力やエージェント的機能(ツール使用や長文解析)に重点を置いています[5]。Flash版は高速処理、Pro版は高精度処理に特化しています。
(その他)オープンソースモデル
- LlaMA 3.3: Metaが開発した最新モデルで、マルチモーダル機能を備え、テキストと画像の両方を処理できます。
- Mistral Small 3: 低レイテンシ・高効率タスク向けに設計された24Bパラメータモデルです。
- DeepSeek-R1: 数学やコード生成に優れ、OpenAI-o1と比較して約30倍のコスト効率と5倍の速度を実現しています。
オープンソースモデルは、外部に情報を出したくない場合になどに有効ですが、GPUサーバの運用費用が別途かかります。このため、コストパフォーマンスが良いとは必ずしも言えません。
選定のポイント
モデル選択の際は、以下の点を考慮すると良いでしょう:
- 用途に応じた選択:
- 複雑な推論には Claude 3.7 Sonnet や OpenAI o1シリーズ
- コーディングには Claude 3.7 Sonnet
- 長文処理には Gemini 2.0 シリーズ
また、チャットフローの各ブロックで、モデルを使い分けることもできます。
各モデルは日々進化しており、用途や予算に応じて最適なモデルを選択することが重要です。
Embeddings Models
RAGを使用する場合には、ドキュメントをベクトル化する埋め込みモデルが必要となります。一般的には、OpenAIのモデルが使われることが多いようですが、Anthropicの公式サイトでは、Voyageを紹介しています。
Anthropicでエンベディングを取得する方法
Anthropicは独自のエンベディングモデルを提供していません。上記の考慮事項をすべて網羅する幅広いオプションと機能を持つエンベディングプロバイダーの1つがVoyage AIです。
Voyage AIは最先端のエンベディングモデルを提供し、金融や医療などの特定の業界ドメイン向けのカスタマイズされたモデル、または個々の顧客向けにカスタマイズされた微調整モデルを提供しています。
このガイドの残りの部分はVoyage AIについてですが、特定のユースケースに最適なものを見つけるために、さまざまなエンベディングベンダーを評価することをお勧めします。
https://docs.anthropic.com/ja/docs/build-with-claude/embeddings
OpenAI
Model | Price per 1M tokens |
---|---|
text-embedding-3-small | $0.02 |
text-embedding-3-large | $0.13 |
text-embedding-ada-002 | $0.10 |
Voyage

Text Embeddings
Model | Price per million tokens | Number of free tokens |
---|---|---|
voyage-3-large | $0.18 | 200 million |
voyage-3 | $0.06 | 200 million |
voyage-3-lite | $0.02 | 200 million |
voyage-code-3 | $0.18 | 200 million |
Multimodal Embeddings
Model | Price per million tokens | Price per billion pixels | Number of free tokens and pixels |
---|---|---|---|
voyage-multimodal-3 | $0.12 | $0.60 | 200M text tokens and 150B pixels |