Googleが新たに画像生成AI「Whisk」の試験運用を開始。既存の画像を組み合わせて新しい画像を生成し、ユーザーのクリエイティビティを高めるツールです。
要約するとGoogleは12日、日本を含む100か国以上で新たな画像生成AI「Whisk」の試験運用を開始しました。
このAIの特徴は、既存の画像をプロンプトとして使用し、ユーザーが選んだモデル、シーン、スタイルに基づいて新しい画像を生成できる点です。
具体的には、ユーザーは好みの画像をそれぞれのカテゴリに入力し、それらを組み合わせて新たなビジュアルコンテンツを創出します。
このプロセスは、GoogleのAIモデル「Gemini」が入力された画像の詳細なキャプションを自動的に生成し、そのキャプションを最新の画像生成モデル「Imagen 3」に渡すことで実現されます。
生成される画像は、入力画像の完全な模倣ではなく、特徴を抽出し、新しい組み合わせを作成するため、ユーザーは予期しない結果を得ることもあります。
万が一、生成された画像が期待と異なる場合、生成時のプロンプトを表示して編集することが可能ですが、最適な結果を得るためには英語でのプロンプト入力が推奨されています。
このように、Whiskは既存の画像を活用しつつ、ユーザーのクリエイティビティを引き出す新しいツールとして注目されています。
参考リンクhttps://news.yahoo.co.jp/articles/197290d7bbd9b10dc49c19a834c8bb953f62787c