Anthropicが新AI「Claude 3.7 Sonnet」を発表。拡張思考モードにより、ポケモン赤でジムリーダーを3人倒す能力を持ち、数学や科学の問題解決力も向上。安全性も強化。
この新モデルには「拡張思考モード」が導入されており、長時間の深い思考を通じてより正確な回答を提供できるようになっています。
特に、数学、物理学、コーディング、複雑な指示処理などの分野でのパフォーマンス向上が期待されています。
拡張思考モードでは、Claudeが結論に至るまでの思考過程を可視化することで、ユーザーがそのプロセスを確認できる仕組みが整っています。
さらに、エージェント能力も向上しており、コンピューター操作タスクをより効率的に実行できるようになりました。
ベンチマークテスト「OSWorld」では、仮想環境での操作精度が向上していることが確認されています。
興味深いことに、ゲーム「ポケットモンスター 赤」のプレイ実験では、従来のバージョンでは序盤で行き詰まっていたのに対し、Claude 3.7 Sonnetはジムリーダーを3人倒すまで進むことができました。
この成果は、拡張思考モードの活用によるもので、数学の難問への正答率も飛躍的に向上しています。
並列処理を用いたテストでは、異なる思考プロセスを同時に進行させ、最適な回答を選ぶことで科学分野の質問への正答率が大幅に向上しました。
安全性については、Anthropicの専門チームがモデルのリスク評価を行い、Claude 3.7 SonnetはAI安全レベル2(ASL-2)の基準を満たしているとされています。
特に、危険な情報の提供を防ぐ監視システムや、悪意ある攻撃に対する耐性向上が図られています。
また、Claudeの思考プロセスの一部は暗号化されており、センシティブな内容はユーザーに表示されない仕組みが採用されています。
Claude 3.7 Sonnetは、現在Claude.aiやAPI経由で利用可能です。
参考リンクhttps://news.yahoo.co.jp/articles/ab4c12109d57aedf60177a9a45e37ceba5df142f