OpenAI社は、ChatGPTを提供している会社で、生成AI分野での代表的な会社です。
OpenAI社は、自然言語処理、画像生成、音声処理(認識・合成)、推論など、多様なタスクに対応可能な最先端のAIモデルを開発・提供しています。これらのモデルは、APIを通じて利用でき、様々なアプリケーションやサービスに組み込むことが可能です。DifyでもOpenAI 社のLLMを簡単に使えるようになっています。
しかし、各モデルには性能(精度、速度、対応機能)、コスト、扱える情報量(コンテキスト長)などに違いがあり、目的や要件に応じて最適なモデルを選択することが重要です。特に近年、GPT-4oファミリーやoシリーズ(推論モデル)など、新しい高性能・高効率モデルが登場し、選択肢が大きく広がっています。
本記事では、OpenAIのモデル選定の判断材料を提供します。
なお、OpenAIは画像生成、音声合成などのモデルも提供していますが、今回は主にテキスト処理モデル(いわゆる大規模言語モデル)に限定します。
検討項目
モデル選定の検討項目としては以下のようになるかと思います。利用する用途によって、どのモデルを選択するかを決定します。
- 精度・性能
-
各種タスクごとの評価値、主観的回答精度、入力可能なコンテキストの種類など。
- 処理速度
-
入力から応答するまでの処理時間 高性能なものほど遅い傾向があります。
- コスト
-
入出力のトークン数によってコストが決まります。
- コンテキスト長
-
一度のリクエストに対して、APIに送受信できるトークン数の最大値。
- 知識のカットオフ
-
モデルの学習がいつまでの情報に基づいているか
単純に、数値だけでは測れないこともありますので、実際に使用するデータなどで検証することが必要です。
主要モデル
OpenAIの公式の情報は以下から取得できます。
現在の主要モデルは、以下の2シリーズとなります。チャットモデルだとGPT-4シリーズ、推論モデルだとoシリーズを選択することになります。
GPT-4シリーズ
LLMのベースとなるチャットモデルです。GPT-4oが主力でしたが、2025年4月にGPT4-1がリリースされました。
性能が上がり、コストは下がっていますので、今後はこちらが主力になるかと思われます。なお、GPT4.5というモデルが一部で公開されていましたが、こちらは廃止になるようです。

また、GPT4.1シリーズには、mini,nanoといった小型モデルもあり、精度は落ちますが、スピードとコストは有利になります。


oシリーズ
oシリーズは、Reasoning model(推論モデル)と言われ、複雑な他段階のタスクを実行するのに適しています。指示に対する手順(思考過程)を生成してから、その手順に従ってタスクに取り掛かります。現時点では、o4-miniかo3が選択肢となります。

まとめ
OpenAI社のモデルをまとめてみましたが、このほかにもGoogle社のGeminiシリーズ、Anthropic社のClaudeなどもあります。
例えば、Geminiは入力テキスト長が200万トークンとOpenAIの倍の入力が可能です。Cluadeは、画像のOCR精度が良いとされています。
それぞれの特徴を理解する必要がありますが、まずは様々なモデルを試してみて、実務で使えるものを探すことが一番重要かと思います。