グーグルとアップルの音声アシスタント競争が激化。グーグルの「Gemini Live」は、画像と音声を統合した新機能を2025年に提供予定。アップルは後退しているとの見方も。
特に、スマートフォンのプロセッサーで処理を行うオンデバイスAIの開発が進む中、音声アシスタントも進化を遂げている。
「OK, Google」や「Hey, Siri」といった音声コマンドにより起動するアシスタントは、個人秘書のような役割を果たすことを目指している。
しかし、現在の技術の進展に伴い、AndroidとiOSの音声アシスタントには明確な違いが見られる。
グーグルが開発した生成AIモデル「Gemini」に基づく「Gemini Live」は、2025年3月に画面共有とライブ動画ストリーミング機能を追加する予定で、これによりユーザーはよりインタラクティブな体験が可能になる。
例えば、ユーザーが通販サイトでジーンズを見つけ、そのコーディネートを尋ねる際に、ジーンズの画像を共有すれば、Geminiはその情報をもとに最適な上着を提案することができる。
さらに、ライブ動画ストリーミング機能では、ユーザーが花瓶の動画を撮影しながら釉薬の選択を質問することも可能で、AIがリアルタイムでアドバイスを提供する。
このように、音声アシスタントは単なる音声認識を超え、視覚情報をも取り入れたマルチモーダルな体験を提供する方向に進化している。
これに対し、アップルは大きく後退しているとの見方もあり、今後の技術革新が注目される。
参考リンクhttps://news.yahoo.co.jp/articles/559f5e3db34f40220d190c5a63e125dc7557ed7c
グーグルとアップルの音声アシスタント競争についてのコメントでは、AI技術の進化や新しいオープンソースのAIエージェントの登場に関する期待が高まっていました。
特に、Manus AIのような完全自律型エージェントが注目され、スマートフォンへの搭載が実現すれば、私たちの生活が大きく変わる可能性があると指摘されていました。
また、AIの進化により、仕事のスタイルも変わるとの意見もあり、特に日本ではAIの活用が進んでいない現状に対する驚きや期待が表現されていました。
さらに、AppleとSonyの経営方針についての意見もあり、Appleが独自規格を重視する一方で、Googleの便利さを評価する声も聞かれました。
音声アシスタントの使用状況については、普段から使わない人が多く、個人のニーズに応じた使い方がされていることも示されていました。
全体として、競争が進む中での期待や懸念が交錯している様子が伺えました。