Googleが「Gemini 2.5 Pro(experimental)」を全ユーザーに公開。新モデルは推論能力が向上し、業界ベンチマークで競合を上回る成績を記録。モバイル対応も予定。
この新しいAIモデルは、思考を通じて推論を行う能力を持ち、12月に登場した「Gemini 2.0 Flash Thinking」モデルの進化版です。
特に注目されるのは、「Humanity’s Last Exam」(HLE)という新しいベンチマークテストにおいて、Gemini 2.5 ProがOpenAIの「o3-mini」やAnthropicの「Claude 3.7 Sonnet」を上回る成績を収めた点です。
HLEは、急速に進化するAIモデルにとって業界テストが簡単になりすぎる問題に対処するために設計されたもので、Gemini 2.5はこのテストで18.8%のスコアを記録しました。
このスコアは、o3-miniの14%やClaude 3.7 Sonnetの8.9%を上回るもので、優れた性能を示しています。
また、Gemini 2.5は「Chatbot Arena」のリーダーボードで首位を獲得し、科学、数学、コーディングにおいても競合モデルを上回る実績を持っています。
ただし、その差は全体的には小さいため、AIモデルの進化のスピードを考慮すれば予想の範囲内と言えるでしょう。
さらに、Googleによると、Gemini 2.5 Proは「1行のプロンプト」でも推論機能やマルチモーダル機能、エージェント機能の改善が見られるとのことです。
Googleは「X」への投稿で、Gemini 2.5 Proを全ユーザーに「レート制限付き」で展開し、まもなくモバイルにも対応する予定であると述べています。
また、「Gemini Advanced」ユーザーには、より大きなコンテキストウィンドウと拡張アクセスが提供される予定です。
この記事は、海外のZiff Davisが発表した内容を朝日インタラクティブが日本向けに編集したものです。
参考リンクhttps://news.yahoo.co.jp/articles/55986b148d9880dfd4c48ad9543028c49076a105