stable-diffusion-xl-base-1.0
🧠 AIモデルstabilityai
Stability AIの主力オープンソース text-to-imageモデル。2.6Bパラメータでネイティブ1024x1024生成に対応。
Stable Diffusion XL (SDXL) Base 1.0は、Stability AIによる高解像度text-to-image合成のための潜在拡散モデルです。主な技術的特徴として、2.6BパラメータのUNetバックボーンと、デュアルテキストエンコーダースタック(OpenCLIP ViT-bigG/14とCLIP ViT-L/14)を組み合わせ、豊かな言語理解を実現しています。アップスケーリングを必要とせず、ネイティブで1024x1024画像の生成が可能で、SDXL Refinerモデルと組み合わせて細部のディテールを強化する設計です。幅広い芸術スタイル、フォトリアリスティックな出力、複雑な構図のプロンプトをサポートします。OpenRAIL++ライセンスで配布され、責任あるAI制限のもと商用利用が可能です。ONNXおよびsafetensorsチェックポイントが利用可能で、Diffusers、ComfyUI、Automatic1111などのフレームワークに柔軟にデプロイできます。
💡ハイライト
- ├─2.6BパラメータのデュアルテキストエンコーダーUNet
- ├─ネイティブ1024x1024画像生成
- ├─OpenRAIL++オープンソースライセンス
- ├─Hugging Faceで100万件超のダウンロード
- └─ONNXおよびsafetensors対応
🎯対象
- ├─AI研究者
- ├─デジタルアーティスト
- └─アプリケーション開発者