Stability AIが最新の画像生成AI「Stable Diffusion 3.5」を発表。FLUXとの競争が激化し、商用利用が無料のモデルも登場。高解像度画像生成が可能で、利用者の著作権も保障される。
この新モデルは、オープンモデルの競合「FLUX」との競争が激化する中で登場しました。
Stable Diffusion 3.5には、同日から利用可能な2つのモデルがあり、さらに10月29日には一般向けのモデルが公開予定です。
フラッグシップモデル「Stable Diffusion 3.5 Large」は、80億パラメーターを持ち、1メガピクセルの高解像度画像生成が可能で、特にプロンプトの追従性において業界トップクラスの性能を誇ります。
また、処理速度を向上させた「Large Turbo」モデルは、わずか4ステップで高品質な画像を生成することができます。
さらに、10月29日に公開予定の「Medium」モデルは、25億パラメーターで設計されており、一般的なコンピューターでも快適に動作するように最適化されています。
このモデルは、0.25から2メガピクセルまでの解像度に対応し、カスタマイズのしやすさと画質のバランスを重視しています。
利用条件としては、年間収益が100万ドル未満の企業や個人クリエイターは商用利用を含めて無料で利用可能で、非商用目的の場合も完全に無料です。
生成された画像の著作権は利用者に帰属し、年間収益が100万ドルを超える企業向けにはエンタープライズライセンスが用意されています。
現在、これらのモデルはHugging Faceでダウンロード可能で、Stability AI APIやReplicate、ComfyUI、DeepInfraなど複数のプラットフォームでも利用できます。
Mediumモデルの公開後には、高度な制御機能「ControlNet」も順次リリースされる予定です。
一方、競合の「FLUX.1」は120億のパラメータを持ち、特にテキスト生成能力や解剖学的な描写の正確さに優れた性能を示しています。
Stable Diffusion 3.5の登場により、画像生成業界での競争はさらに激化することが予想されます。
参考リンクhttps://news.yahoo.co.jp/articles/34bd6be6a13b9e74dcf3d22b4f9e4a89734388bf