グーグルが新しいAIツール「Whisk」を発表。画像を組み合わせてオリジナルアートを生成することが可能で、現在は米国のみ利用可能。
要約するとグーグルは2023年12月16日に、複数の画像を組み合わせて新しい作品を生成するAIツール「Whisk(ウィスク)」を公開しました。
このツールの名称は、英語で「泡だて器」を意味しており、料理の際に材料を混ぜる様子にちなんで名付けられています。
Whiskの最大の特徴は、従来の画像生成AIが用いるテキストプロンプト(指示文)ではなく、ユーザーが画像をドラッグ&ドロップするだけで利用できる点です。
ユーザーは被写体、シーン、スタイルの3種類の画像を入力することで、オリジナルのデジタルアート作品を生成することができます。
具体的な仕組みとしては、グーグルのマルチモーダルAIモデル「Gemini」が入力された画像の詳細な説明文を自動生成し、その情報をもとに画像生成AIモデル「Imagen 3」が新しい作品を作り出します。
重要なのは、Whiskが単に入力された画像を複製するのではなく、それぞれの画像の特徴を捉えた新しい表現を生み出すことです。
このツールは、アイデアを迅速に検討することを目的に設計されており、クリエイティブなプロセスをサポートします。
ただし、現時点ではこのサービスは米国内でのみ利用可能で、日本からはアクセスできません。
アメリカのユーザーは「labs.google/whisk」からサービスを利用することができます。
参考リンクhttps://news.yahoo.co.jp/articles/bc9ffb7ca0a60492cb97d9a995e63c009da047dd