Googleが新たに発表した生成AI技術には、言語モデル「Gemini-Exp-1206」や動画生成AI「Veo」、高性能天気予報AI「GenCast」などがあり、特にGenCastは従来モデルを超える精度を達成しています。
特に注目されるのは、言語モデル「Gemini-Exp-1206」で、これは業界標準のリーダーボードで1位を獲得しています。
さらに、Googleは高品質な動画生成が可能なAIモデル「Veo」や、画像生成モデル「Imagen 3」をVertex AI上で提供開始しました。
Metaやアリババグループも新しいローカルLLMを発表し、競争が激化しています。
特に、Googleの「GenCast」は、高性能な天気予報AIで、過去40年分のデータを用いて訓練されており、短期予報において従来のモデルを上回る精度を示しています。
具体的には、97.2%の項目で優れた予測精度を達成し、極端な気象現象の予測でも高い性能を発揮しています。
また、動画生成AI「Open-Sora」は、テキストや画像を入力として高品質な動画を生成することを目指しており、効率的なデータ処理や動画の特徴理解を行うシステムを搭載しています。
加えて、Googleの「Genie 2」は、1枚の画像から3D環境ゲームを生成する新しいAIモデルで、ユーザーはプロンプト画像を基に生成された世界に入り込むことができます。
最後に、視覚と言語を組み合わせた「PaliGemma 2」は、画像認識と高性能な言語モデルを組み合わせた多目的なAIで、多くの学術的ベンチマークテストで優れた性能を示しています。
これらの新技術は、生成AI分野における競争を一層激化させると期待されています。
参考リンクhttps://news.yahoo.co.jp/articles/9d27bfa80b6d5120974bbd7a21f5cfd500e4c43b