新たな画像生成AI「Stable Diffusion 3.5」発表の詳細

  • このエントリーをはてなブックマークに追加

Stability AIが「Stable Diffusion 3.5」を発表。新モデルはパラメータ数を増やし、コミュニティのフィードバックを反映させた高性能な画像生成AIです。

要約するとStability AIは、最新の画像生成AIモデル「Stable Diffusion 3.5」シリーズを発表しました。

この新モデルには、80億パラメータを持つ「Large」と、4ステップで高速に画像を生成できる「Large Turbo」が含まれています。

また、10月29日には、25億パラメータを搭載した「Medium」モデルもリリース予定です。

このモデルは、消費者向けハードウェアでも実行可能で、コミュニティライセンスに基づき、非営利目的または年間収益100万ドル以下の営利目的での利用が無料です。

前回のStable Diffusion 3 Mediumは、社内基準やコミュニティの期待を十分に満たさなかったため、同社はフィードバックをもとに根本的な改善に取り組んできました。

今回の開発では、柔軟な基盤を提供するためにカスタマイズ性が重視され、クエリキー正規化がトランスフォーマブロックに統合されました。

これにより、モデルのトレーニングプロセスが安定し、ファインチューニングや開発プロセスが簡素化されました。

特にMediumモデルでは、品質、一貫性、マルチ解像度生成の強化が図られ、アーキテクチャとトレーニングプロトコルに調整が加えられています。

Stability AIによれば、Stable Diffusion 3.5 Largeは競合他社の大規模モデルに匹敵し、Large Turboは他の非蒸留モデルと比較しても遜色ない性能を持つとされています。

さらに、Mediumモデルは他の中型モデルを上回る性能を誇り、プロンプトの再現性と画像品質のバランスに優れています。

参考リンクhttps://news.yahoo.co.jp/articles/4e81a4575271b81417c1b88dc95d69e237ebd58d

関連URL

2024年最新!生成AIのニュースに関するまとめ

2024年最新!画像生成AIのニュースに関するまとめ

  • このエントリーをはてなブックマークに追加

SNSでもご購読できます。