大規模言語モデル(LLM)の比較(2025年3月)

2025年3月現在、多くの大規模言語モデル(LLM)が利用可能になっています。以下では、最新の主要LLMモデルの比較表を作成し、それぞれの特徴を解説します。

スペック、コストについては、ご利用の前に公式のサイトをご確認ください。

Text Generation Models

主要LLMモデル比較表

モデル名開発企業最大入力トークン最大出力トークン入力コスト(/1Mトークン)出力コスト(/1Mトークン)対応ファイル形式特徴
GPT-4.5OpenAI128,000128,000$75.00$150.00テキスト、画像、音声、動画2025年2月リリース、自然な会話と感情知能を強化
GPT-4oOpenAI128,000128,000$2.50$10.00テキスト、画像、音声、動画マルチモーダル処理に特化
GPT-4o miniOpenAI128,000128,000$0.15$0.60テキスト、画像、音声、動画GPT-4oの軽量版
Claude 3.7 SonnetAnthropic200,000128,000$3.00$15.00テキスト、画像、PDF2025年2月リリース、ハイブリッド推論能力、コーディングと開発に強い
Gemini 2.0 FlashGoogle1,048,5768,192
$0.10$0.40テキスト、画像、音声、動画超長文コンテキスト、高速処理[
Gemini 1.5 ProGoogle2,097,1528,192$1.25$5.00テキスト、画像、音声、動画超長文コンテキスト、高精度[2]
LlaMA 3.3 (70B)Meta128,000128,000無料(オープンソース)無料(オープンソース)テキスト、画像2024年12月リリース、マルチモーダル対応、オープンソース[

モデル別の特徴と用途

OpenAIモデル

  • GPT-4.5: 2025年2月末にリリースされた最新モデルで、会話の自然さや感情知能が強化されています。
  • GPT-4o: oは、”omni”の略で、テキスト、音声、画像、動画などのマルチモーダル処理に特化しています。
  • OpenAI o1シリーズ: 推論に特化したモデルで、難問解決能力が高いのが特徴です。

Anthropicモデル

  • Claude 3.7 Sonnet: 2025年2月にリリースされ、「ハイブリッド推論」能力を備え、高速応答と段階的な深い思考を両立しています。特にコーディングとフロントエンド開発での問題解決に優れています。

Googleモデル

  • Gemini 2.0シリーズ: マルチモーダル入力やエージェント的機能(ツール使用や長文解析)に重点を置いています[5]。Flash版は高速処理、Pro版は高精度処理に特化しています。

(その他)オープンソースモデル

  • LlaMA 3.3: Metaが開発した最新モデルで、マルチモーダル機能を備え、テキストと画像の両方を処理できます。
  • Mistral Small 3: 低レイテンシ・高効率タスク向けに設計された24Bパラメータモデルです。
  • DeepSeek-R1: 数学やコード生成に優れ、OpenAI-o1と比較して約30倍のコスト効率と5倍の速度を実現しています。

オープンソースモデルは、外部に情報を出したくない場合になどに有効ですが、GPUサーバの運用費用が別途かかります。このため、コストパフォーマンスが良いとは必ずしも言えません。

選定のポイント

モデル選択の際は、以下の点を考慮すると良いでしょう:

  1. 用途に応じた選択:
  • 複雑な推論には Claude 3.7 Sonnet や OpenAI o1シリーズ
  • コーディングには Claude 3.7 Sonnet
  • 長文処理には Gemini 2.0 シリーズ

また、チャットフローの各ブロックで、モデルを使い分けることもできます。

各モデルは日々進化しており、用途や予算に応じて最適なモデルを選択することが重要です。

Embeddings Models

RAGを使用する場合には、ドキュメントをベクトル化する埋め込みモデルが必要となります。一般的には、OpenAIのモデルが使われることが多いようですが、Anthropicの公式サイトでは、Voyageを紹介しています。

Anthropicでエンベディングを取得する方法

Anthropicは独自のエンベディングモデルを提供していません。上記の考慮事項をすべて網羅する幅広いオプションと機能を持つエンベディングプロバイダーの1つがVoyage AIです。

Voyage AIは最先端のエンベディングモデルを提供し、金融や医療などの特定の業界ドメイン向けのカスタマイズされたモデル、または個々の顧客向けにカスタマイズされた微調整モデルを提供しています。

このガイドの残りの部分はVoyage AIについてですが、特定のユースケースに最適なものを見つけるために、さまざまなエンベディングベンダーを評価することをお勧めします。

https://docs.anthropic.com/ja/docs/build-with-claude/embeddings

OpenAI

ModelPrice per 1M tokens
text-embedding-3-small$0.02
text-embedding-3-large$0.13
text-embedding-ada-002$0.10

Voyage

Text Embeddings

ModelPrice per million tokensNumber of free tokens
voyage-3-large$0.18200 million
voyage-3$0.06200 million
voyage-3-lite$0.02200 million
voyage-code-3$0.18200 million

Multimodal Embeddings

ModelPrice per million tokensPrice per billion pixelsNumber of free tokens and pixels
voyage-multimodal-3$0.12$0.60200M text tokens and 150B pixels