Stable Diffusion
基礎攻略

Stability AIが開発した、オープンソースのAI画像生成モデル。
ローカル環境でも無料で使える。

ツール概要

得意なこと

高品質な画像生成
LoRA・モデルの自由なカスタマイズ
ローカル環境での完全無料利用
細かいパラメータ調整
大量生成・バッチ処理
独自モデルの学習・Fine-tuning

苦手なこと

初期セットアップの難易度が高い
文字の正確な描写
手・指の描写（工夫が必要）
クラウド版は有料
動画生成（基本は静止画）

向いている人・用途

エンジニア・クリエイター

画像生成を無料・無制限で使い倒したい人。

LoRA作成者

独自スタイル・キャラクターの学習モデルを作りたい人。

デザイナー・マーケター

大量の画像素材をバッチ生成し、効率化したい人。

上級ユーザー

プロンプトやパラメータを細かくコントロールしたい人。

企業・個人

商用利用・社内利用でAPIコストをかけたくない人。

料金・プランの考え方

ローカル版 (AUTOMATIC1111 / ComfyUI)	完全無料・無制限 ※高性能なGPU環境が必要
Stable Diffusion Online (Dream Studio)	クレジット制・$10〜
Stability AI API	従量課金・画像1枚あたり約$0.002〜
推奨環境	NVIDIA RTX 3060以上（VRAM 8GB以上）でローカル運用可能。 Google ColabやRunPodなどのクラウドGPUでも利用可。

始め方（最短手順）

インストール

AUTOMATIC1111（WebUI）をGitHubからクローン、または「Stability Matrix」（簡単インストーラー）を使用する。

モデル入手

Civitai（civitai.com）から好みのモデル（Checkpoint）をダウンロードして所定フォルダに入れる。

起動

WebUIを起動してブラウザで localhost:7860 にアクセスする。

生成開始

プロンプトを入力して「Generate」ボタンを押して画像を生成。

Stability AI 公式へ

基本操作

txt2img

テキストプロンプトから画像を新規生成する基本機能。

img2img

既存の画像を参照して新しい画像を生成・変換する。

Inpainting

画像の一部だけをマスクして修正・差し替えを行う。

LoRA

追加学習モデルを適用して特定の画風やキャラを再現。

CFG Scale

プロンプトへの忠実度を調整（7〜12が一般的）。

Sampling Steps

生成ステップ数（20〜30が品質と速度のバランス良）。

プロンプトテンプレート

パターン1：基本型

[クオリティタグ], [被写体], [スタイル], [背景・環境], [ライティング], [カメラ・構図]

Negative Prompt（除外タグ）: [除外したい要素: worst quality, bad anatomy, blurry など]

例（Positive）：
masterpiece, best quality, 1girl, solo, business casual outfit, modern office background, soft natural lighting, portrait, sharp focus, 8k

例（Negative）：
worst quality, low quality, blurry, bad anatomy, bad hands, extra fingers, deformed

パターン2：LoRA適用型

[クオリティタグ], [被写体], <lora:モデル名:0.8>, [スタイル指定], [背景]

例：
masterpiece, best quality, product photography, luxury watch, <lora:product_style:0.8>, white background, studio lighting, macro lens

ベストプラクティス

1. クオリティ設定

良い例

Positive Promptの先頭にクオリティタグ（masterpiece, best quality）を入れ、Negative Promptにbad hands, worst qualityなどを必ず設定する。

悪い例

クオリティタグなし・Negative Prompt未設定で生成してしまい、低品質な出力になる。

2. パラメータ設定

良い例

CFG Scaleを7〜10、Sampling Stepsを20〜30に設定してバランスの取れた品質を安定させる。

悪い例

Stepsを極端に高く（50以上）設定して、品質が変わらないのに時間を無駄に消費する。

3. モデル選定

良い例

Civitaiで高評価のCheckpointモデルとLoRAを組み合わせて用途に特化した生成を行う。

悪い例

デフォルトモデルのまま使い続けて、求めている画風が出ないと諦める。

注意点（リスクと対策）

著作権：Civitaiのモデルは利用規約がそれぞれ異なる。商用利用前にライセンスを必ず確認する。
不適切コンテンツ：モデルによっては予期せず不適切な画像が生成されることがある。NSFWフィルタを適切に設定する。
GPU・電力コスト：ローカル運用はGPUの電力消費が大きい。クラウドGPUとのコスト比較を推奨。
モデルの信頼性：外部サイトからダウンロードするファイルは、使用前にウイルスチェックなどを行う。
社内利用：生成画像の著作権帰属・利用範囲について、社内ポリシーと法務確認を行う。

よくある失敗と解決

Case 1: 手・指が不自然

Before

指が多い、変形している、ぐちゃぐちゃになる。

After

Negative Promptに「bad hands, extra fingers」等を追加。さらにControlNetのOpenPoseで手の形を制御する。

Case 2: 生成結果が定まらない

Before

毎回プロンプトが同じなのに全然違う画像が出る。

After

Seedを固定（-1ではなく特定の数値）して一貫性を確保。気に入った画像のSeedを保存して使い回す。

Case 3: セットアップで挫折

Before

PythonやGitのコマンド操作が難しくてWebUIが動かない。

After

「Stability Matrix」を使用する。ワンクリックで環境構築とモデル管理が可能になる。

活用例（業務サンプル）

キャラクター一貫生成

毎回違う顔になる問題を解決。LoRAで独自キャラを学習させて、どの構図でも同じ顔のキャラ画像を量産する。

商品画像の背景変更

撮影スタジオ不要。img2imgとInpaintingを使って、既存の商品写真の背景だけを高級感のある部屋や自然の中に差し替える。

大量素材生成

素材サイト探しの時間を短縮。バッチ処理機能を使って、同一スタイルのアイコンや背景素材を100枚一括生成して選定する。

スタイル統一

バラバラの素材を統一。異なるソースの画像をimg2imgに通して、全て同じ画風・トーンに再生成しデザインを整える。