Recraftが新たに発表した画像生成モデル「Recraft V3」は、業界最高水準の品質を誇り、長文テキストを画像化できる機能を搭載。解剖学的な正確さも特長で、デザイナー向けの機能も充実しています。
この新モデルは、業界標準のベンチマークテストでELOレーティング1172点を記録し、MidjourneyやBlack Forest Labsなどの競合を抑えて首位に立ちました。
Recraft V3の最大の特徴は、長文のテキストを画像として生成できる点です。
従来の画像生成AIは短いテキストしか扱えなかったため、この機能は特に重要です。
さらに、解剖学的な正確さが際立っており、手足の数や体の比率、背景との整合性が保たれています。
プロンプトで指定した複雑なシーンを正確に再現でき、オブジェクトの数や色、位置関係も忠実に表現可能です。
また、デザイナー向けの機能も充実しており、画像内のテキストの位置やサイズを指定できる配置制御機能や、複数の画像とテキストを組み合わせたグラフィックデザインが生成できます。
Recraft V3は、デスクトップアプリやiOS/Android向けモバイルアプリ、APIを通じて利用可能で、無料・有料ユーザーともにアクセスできます。
API利用ではラスター形式とベクター形式の両方をサポートし、テキスト付き画像の生成やカスタムスタイル作成も行えます。
Recraftは2022年に設立され、機械学習フレームワーク「CatBoost」の開発者であるAnna Veronika Dorogush氏が率いる企業であり、AdobeやCanvaといった大手企業に対抗するために独自の基盤モデル開発に注力しています。
参考リンクhttps://news.yahoo.co.jp/articles/914244bf884eba799a582c1e4975307d4336f144