Anthropic、新Claudeモデル近く投入へ 4.0視野
【東京本局 = テクノロジー】生成AI開発・提供のAnthropic(米カリフォルニア・サンフランシスコ)は3月末までに新しいClaudeモデルを発表する見通しだ。競合が新モデルを次々と投入する中で、主力の3.5 Sonnetは昨年10月のアップデートを最後に、目新しい進展がない。知名度や資金力が競合より低いAnthropicにとって性能・技術面での優位は生命線だ。競合に出遅れないよう、生成AI開発を急ぐ。
昨年3月に発表された3.5 Sonnetだが、性能面では依然として高い評価を維持している。2月初めに日本経済新聞が発表した日本語環境での性能を比較する「AI Model Score」で、Claudeは偏差値65を記録。OpenAIのo-1(同67)とo-1プレビュー(同66)に次ぐ3位につけた。なお、1月末に一般公開されたOpenAI o-3は調査対象外だ。
熟考型モデルを除けば8月の計測開始以来首位を保持している。DeepSeekのV3(同64)やGoogleのGemini 2.0 Flash(同63)を上回る高性能を示した。ただ、論理的推論(偏差値64)や情報検索(同48)では競合に劣後する場面も見られ、次世代モデルでの改善が課題となっている。
総合 | 応用言語力 (日本語) | 制御性 | |
1位 | OpenAI o-1 | o-1 Preview | OpenAI o-1 |
偏差値 | 67 | 67 | 73 |
2位 | o-1 Preview | OpenAI o-1 | Gemini 1.5 Pro |
偏差値 | 66 | 67 | 70 |
3位 | Claude 3.5 Sonnet | DeepSeek-V3 | o-1 Preview |
偏差値 | 65 | 65 | 68 |
4位 | DeepSeek-V3 | Claude 3.5 Sonnet | Claude 3.5 Sonnet |
偏差値 | 64 | 64 | 68 |
新モデルはClaude 3.5 Sonnetの後継として位置付けられる見込みだ。同社は通常3カ月程度の間隔でモデルを更新しており、今回の発表もこの周期に沿う。
フラッグシップの「Opus」が刷新される可能性もある。現行のOpusは3.5世代に唯一未対応で、熟考型モデルとして再設計するとの観測も出ている。
API利用料金の値下げも検討する。同社の開発部門の従業員は昨年末、Xへの投稿で「25年には新しいモデルや料金体系の刷新などを検討している」と明かしていた。
現行のSonnetは100万トークン(出力)あたり15ドルと、OpenAIのGPT-4o(同10ドル)より5割高い水準にある。GoogleのGemini 1.5 Proは(同1.5ドル)10分の1で提供されているほか、Gemini 2.0 Flash試験運用版に至っては無料で提供されており、価格競争力が弱い。API環境の制限も複雑で、利用制限がかかるケースも散見される。こうした課題への対応も急務となっている。