
FLUX.1 Dev
FLUX.1 Devは、Black Forest Labsによる高度なオープンウェイト・ガイダンス蒸留型テキストから画像生成AIモデルであり、非商用用途向けに高品質な画像生成を実現します。
Stable Diffusion 3.5 Largeは、Stability AIによる最先端のテキストから画像へのAIモデルであり、卓越した画像品質、プロンプト遵守、および幅広いスタイルやタスクに対応する多様性を提供します。
Stable Diffusion 3.5 Largeは、Stability AIが2024年6月にリリースしたフラッグシップのマルチモーダルテキストから画像へのモデルです。81億ものパラメータを備え、新しいMultimodal Diffusion Transformer(MMDiT)アーキテクチャを基盤とし、比類なき画像の忠実度、多様なスタイル、プロンプトの正確さを実現します。SD 3.5 Largeは、創造的かつプロフェッショナルな用途における新たなベンチマークとなり、従来バージョンや他の多くの生成AI競合モデルを凌駕します。
機能 | SD 3.0 / 3.5 Medium | SD 3.5 Large |
---|---|---|
パラメータ数 | 20億~30億 | 81億 |
アーキテクチャ | DiT, U-Net系 | Multimodal DiT (MMDiT) |
プロンプト遵守 | 良い | 優れている |
タイポグラフィ | 良い | 最先端 |
画像解像度 | 最大1024x1024 | 最大2048x2048 |
スタイルの多様性 | 高い | 非常に高い |
レイテンシ | 低~中 | 中 |
Stable Diffusion 3.5 Largeは、Midjourney v6やDALL·E 3などのモデルと直接競合するよう設計されています。独立したベンチマークやユーザー評価において、SD 3.5 Largeは以下を実現しています。
Pythonでdiffusers
ライブラリを使う場合:
from diffusers import DiffusionPipeline
pipeline = DiffusionPipeline.from_pretrained(
"stabilityai/stable-diffusion-3.5-large",
torch_dtype="float16",
variant="fp16"
)
pipeline.to("cuda")
prompt = "A futuristic cityscape at sunset, ultra high resolution, photorealistic"
result = pipeline(prompt)
result.images[0].save("sd35_large_sample.png")
注意: Hugging Faceで本モデルを利用するには、特定のライセンス規約への同意が必要な場合があります。
Stability AIは、不適切または有害なコンテンツの生成を最小限に抑えるため、高度なセーフティフィルターと整合性評価を実装しています。ユーザーは、モデルカードを確認の上、SD 3.5 Largeを公共または商用プロジェクトで利用する際は倫理規範を遵守してください。
詳細は、公式リリース発表やHuggingFaceモデルページをご覧ください。
AIエージェントで画像生成を自動化
当プラットフォームで利用できる他のAIモデルもご覧ください
FLUX.1 Devは、Black Forest Labsによる高度なオープンウェイト・ガイダンス蒸留型テキストから画像生成AIモデルであり、非商用用途向けに高品質な画像生成を実現します。
FLUX.1 Schnellは、Black Forest Labsが開発した最先端の超高速ステップ蒸留型テキストから画像生成AIモデルで、12億パラメータのRectified Flow Transformerアーキテクチャを用いて、迅速かつ高品質な画像生成を実現します。
Ideogram V3 ターボは最先端のAIテキストから画像へのモデルであり、フォトリアリズム、クリエイティブなデザイン、高度なテキストレンダリングに優れ、一貫したスタイルコントロールやプロフェッショナル向けの画像合成機能を備えています。
Ideogram V3 クオリティは、驚くほどリアルな表現、創造的なデザイン、一貫したスタイルを実現する最先端のテキストから画像へのAIモデルであり、生成メディアの新たな基準を打ち立てます。
Ideogram V3 バランスは、クリエイティブやプロフェッショナル用途において、速度・品質・コストの最適なバランスを実現するために最適化された高度なAIテキスト画像生成モデルです。
Ideogram V2は、業界トップクラスのリアリズム、グラフィックデザイン、テキスト描画能力を備えた高度なテキストから画像生成AIモデルです。スタイル制御、カラーパレット指定、そして最高水準のテキストと画像の整合性を実現します。
Ideogram V2 Turboは、高速かつ高品質なテキストから画像生成を実現する最先端のAIモデルであり、プロンプト理解、インペインティング、画像内テキスト描画に優れています。
Ideogram V2Aは、高速かつコスト効率の良い生成と、多彩なスタイルやアスペクト比の選択肢を実現する高度で効率的なテキストから画像へのAIモデルです。
Ideogram V2A Turboは、超高速な画像生成、高品質な出力、強力なインペインティングとテキスト描画機能に特化した先進的なAIテキスト生成画像モデルです。
Stable Diffusion 3.5 Large Turboは、テキストから画像への生成を目的とした最先端のAIモデルであり、超高速かつ高忠実度な画像合成を、Multimodal Diffusion Transformer(MMDiT)アーキテクチャとAdversarial Diffusion Distillation(ADD)を用いて実現します。
Stable Diffusion 3.5 Mediumは、高品質な画像を独自のスタイルで生成するために設計された強力なAIモデルです。