OpenAI、GPT-4oの音声機能リリース延期へ 来月下旬にリリース
【東京総合 = テクノロジー】OpenAIは26日、次世代AIモデル「GPT-4o」の高度な音声機能について、リリース時期を延期すると発表した。当初6月下旬に予定していたChatGPT Plusユーザーへの限定提供を1か月延期し、7月下旬からの開始を目指すという。
延期に踏み切った理由についてOpenAIは、「安全性と品質向上のため」とした。具体的には、モデルの特定コンテンツの検出・拒否能力の向上、ユーザーエクスペリエンスの改善、そしてリアルタイムレスポンスを維持しつつ数百万規模のユーザーに対応できるインフラの準備が必要だとしている。OpenAIは「高い安全性と信頼性の基準を満たすことが重要」と強調した。
展開計画については慎重な姿勢を示しており、段階的なアプローチを採用する。7月下旬から少数のユーザーによるアルファ版テストを開始し、フィードバックを基に段階的に拡大していく計画だ。最終的には今秋までに全てのChatGPT Plusユーザーへのアクセス提供を目指す。ただし、具体的な展開時期は安全性と信頼性の基準を満たすかどうかに依存するという。
GPT-4oの高度な音声機能は、GPT-4Tから応答速度が大幅に向上したことで、感情や非言語的な手がかりを理解し応答できるようになったことで実現した。AIとのリアルタイムで自然な会話が可能になると期待され、活用できる場面が広がる。また、OpenAIはデモンストレーションで紹介した新しいビデオ機能や画面共有機能についても開発を進めている。展開時期は今後詰める。
AI開発競争は激化している。GoogleはGPT-4oに対抗する「Gemini 1.5 Flash」を発表し、AnthropicもOpenAIを上回る性能を示す「Claude 3.5 Sonnet」を公開した。AppleはOpenAIと連携し、「Apple Intelligence」を発表するなど、スタートアップと巨大ITが入り混じって競う。
OpenAIの慎重な姿勢は、同社の安全性を重視する姿勢を意識したものと見られる。サム・アルトマン氏がCEOに就いてから営利的な行動が目立ち、非営利で設立された当初の目的を蔑ろにしていると批判を受けていた。優秀な社員や技術者が流出する事態も起きた。