stable-diffusion-xl-base-1.0

🧠 AIモデルstabilityai

Stability AIの主力オープンソース text-to-imageモデル。2.6Bパラメータでネイティブ1024x1024生成に対応。

Stable Diffusion XL (SDXL) Base 1.0は、Stability AIによる高解像度text-to-image合成のための潜在拡散モデルです。主な技術的特徴として、2.6BパラメータのUNetバックボーンと、デュアルテキストエンコーダースタック（OpenCLIP ViT-bigG/14とCLIP ViT-L/14）を組み合わせ、豊かな言語理解を実現しています。アップスケーリングを必要とせず、ネイティブで1024x1024画像の生成が可能で、SDXL Refinerモデルと組み合わせて細部のディテールを強化する設計です。幅広い芸術スタイル、フォトリアリスティックな出力、複雑な構図のプロンプトをサポートします。OpenRAIL++ライセンスで配布され、責任あるAI制限のもと商用利用が可能です。ONNXおよびsafetensorsチェックポイントが利用可能で、Diffusers、ComfyUI、Automatic1111などのフレームワークに柔軟にデプロイできます。

💡ハイライト

├─2.6BパラメータのデュアルテキストエンコーダーUNet
├─ネイティブ1024x1024画像生成
├─OpenRAIL++オープンソースライセンス
├─Hugging Faceで100万件超のダウンロード
└─ONNXおよびsafetensors対応

🎯対象

├─AI研究者
├─デジタルアーティスト
└─アプリケーション開発者

🔗リンク

├─Hugging Faceモデルカード
└─SDXL論文 (arXiv:2307.01952)