グーグルの新AIツール「Whisk」で画像アート生成が簡単に

グーグルが新しいAIツール「Whisk」を発表。画像を組み合わせてオリジナルアートを生成することが可能で、現在は米国のみ利用可能。

要約するとグーグルは2023年12月16日に、複数の画像を組み合わせて新しい作品を生成するAIツール「Whisk（ウィスク）」を公開しました。

このツールの名称は、英語で「泡だて器」を意味しており、料理の際に材料を混ぜる様子にちなんで名付けられています。

Whiskの最大の特徴は、従来の画像生成AIが用いるテキストプロンプト（指示文）ではなく、ユーザーが画像をドラッグ＆ドロップするだけで利用できる点です。

ユーザーは被写体、シーン、スタイルの3種類の画像を入力することで、オリジナルのデジタルアート作品を生成することができます。

具体的な仕組みとしては、グーグルのマルチモーダルAIモデル「Gemini」が入力された画像の詳細な説明文を自動生成し、その情報をもとに画像生成AIモデル「Imagen 3」が新しい作品を作り出します。

重要なのは、Whiskが単に入力された画像を複製するのではなく、それぞれの画像の特徴を捉えた新しい表現を生み出すことです。

このツールは、アイデアを迅速に検討することを目的に設計されており、クリエイティブなプロセスをサポートします。

ただし、現時点ではこのサービスは米国内でのみ利用可能で、日本からはアクセスできません。

アメリカのユーザーは「labs.google/whisk」からサービスを利用することができます。

最近の投稿