Stable Diffusionの絵画・二次元イラスト向けモデル(checkpoint)のまとめ
色々試した結果などを書いていく。
注意事項
ライセンス
各モデルにはライセンスや独自の制限が定められているので、使用前によく読むこと。
本記事の本文に不足や誤りがあったり、後でモデルの制作者によってライセンス等が変更される可能性もある。
一切の責任を持てないので、あしからず。
むしろライセンスや制限については非常に怪しい部分が多い。
特に公開したり販売したりする場合は、現状では無視出来ないリスクがあることも留意して頂きたい。
CreativeML Open RAIL-Mライセンスについては、既に和訳や意訳されたものがネット上で公開されているので、ここでは取り上げない。
NSFW
モデルによってはヌードやグロなど、NSFW要素を含む可能性が多々ある。
閲覧する場合は、その閲覧している自身の環境に注意を払ってほしい。
ファイル形式
safetensorsとckptの2種類(もしくはその他)が用意されているが、セキュリティの安全上からsafetensorsを選んでおくべきだろう。
技術的な話をすると、ckptはほぼzipファイル(pythonコードも含む)であり、解凍して簡単に改変出来てしまう。
例えば配布が終了した大人気のモデルに、悪意のあるコードを含めて拡散される危険が考えられる。
Meina系
MeinaMix
MeinaMix – Meina V11 | Stable Diffusion Checkpoint | Civitai
プロンプトをほとんど使わなくても、非常に高品質なイラストが生成されるモデルで、非常に人気がある。
以下は推奨設定。
Clip Skip | 2 |
サンプリング方法(その1) | DPM++ SDE Karras |
サンプリングステップ数(その1) | 20~40 |
サンプリング方法(その2) | DPM++ 2M Karras |
サンプリングステップ数(その2) | 20~60 |
サンプリング方法(その3) | Euler a |
サンプリングステップ数(その3) | 40~60 |
解像度(ポートレート) | 512×768,512×1024 |
解像度(風景) | 768×512,1024×512,1536×512 |
CFGスケール | 4~11 |
ネガティブプロンプト | (worst quality, low quality:1.4), monochrome, zombie, (interlocked fingers) |
ネガティブプロンプト(高解像度補助なし) | (worst quality:1.6, low quality:1.6), (zombie, sketch, interlocked fingers, comic) |
高解像度補助 | |
アップスケーラ― | R-ESRGAN 4x+Anime6b |
高解像度でのステップ数 | 10 |
ノイズ除去 | 0.3~0.6 |
ライセンス | CreativeML Open RAIL-M |
作成者のクレジットを表示せずにモデルを使用する | NG |
生成した画像を販売する | OK |
お金を払って画像を生成するサービスを実行する | NG |
Civitaiで実行 | OK |
このモデルを使用してマージを共有する | OK |
このモデルか、このモデルをマージに使用したモデルを販売する | NG |
マージを共有するときに異なる権限(制限)を与える | OK |
MeinaPastel
MeinaPastel – V6 ( Pastel ) | Stable Diffusion Checkpoint | Civitai
パステルやカラフルなイメージを生成出来る。
Clip Skip | 2 |
サンプリング方法 | DPM++ 2M Karras/SDE Karras/Euler a |
サンプリングステップ数 | 20~40 |
解像度(ポートレート) | 512×768,512×1024 |
解像度(風景) | 768×512,1024×512,1536×512 |
CFGスケール | 4~11 |
ネガティブプロンプト | (worst quality, low quality:1.4), monochrome, zombie, (interlocked fingers) |
高解像度補助 | |
アップスケーラ― | R-ESRGAN 4x+Anime6b |
高解像度でのステップ数 | 15 |
ノイズ除去 | 0.4 |
ライセンス | CreativeML Open RAIL-M |
作成者のクレジットを表示せずにモデルを使用する | NG |
生成した画像を販売する | OK |
お金を払って画像を生成するサービスを実行する | NG |
Civitaiで実行 | OK |
このモデルを使用してマージを共有する | OK |
このモデルか、このモデルをマージに使用したモデルを販売する | NG |
マージを共有するときに異なる権限(制限)を与える | OK |
MeinaUnreal
MeinaUnreal – V4.1 | Stable Diffusion Checkpoint | Civitai
2.5次元のアニメアートを目標にしたモデル。
Clip Skip | 2 |
サンプリング方法(その1) | DPM++ SDE Karras |
サンプリングステップ数(その1) | 20~30 |
サンプリング方法(その2) | DPM++ 2M Karras |
サンプリングステップ数(その2) | 20~40 |
サンプリング方法(その3) | Euler a |
サンプリングステップ数(その3) | 40 |
解像度(ポートレート) | 512×768,512×1024 |
解像度(風景) | 768×512,1024×512,1536×512 |
CFGスケール | 7 |
ネガティブプロンプト | (worst quality, low quality:1.4), monochrome, zombie, (interlocked fingers) |
高解像度補助 | |
アップスケーラ― | R-ESRGAN 4x |
高解像度でのステップ数 | 10~30 |
ノイズ除去 | 0.3~0.5 |
ライセンス | CreativeML Open RAIL-M |
作成者のクレジットを表示せずにモデルを使用する | NG |
生成した画像を販売する | OK |
お金を払って画像を生成するサービスを実行する | NG |
Civitaiで実行 | OK |
このモデルを使用してマージを共有する | OK |
このモデルか、このモデルをマージに使用したモデルを販売する | NG |
マージを共有するときに異なる権限(制限)を与える | OK |
MeinaHentai
NSFWに特化したモデルで閲覧及び使用には注意が必要。
リンクはなし。
ライセンス | CreativeML Open RAIL-M |
作成者のクレジットを表示せずにモデルを使用する | NG |
生成した画像を販売する | OK |
お金を払って画像を生成するサービスを実行する | NG |
Civitaiで実行 | OK |
このモデルを使用してマージを共有する | OK |
このモデルか、このモデルをマージに使用したモデルを販売する | NG |
マージを共有するときに異なる権限(制限)を与える | OK |
Anythingシリーズ
万象熔炉 | Anything V5/Ink – ink | Stable Diffusion Checkpoint | Civitai
V1、V2、V3、V3.2、および V5の基本バージョンが存在する。
Meina系に匹敵するクオリティでありながら、CreativeML Open RAIL-Mライセンスのみ指定されている。
他に制限は設定されていないのが最大の魅力だろうか。
AbyssHell
2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠。
AbyssHellHero
AIARTCHAN/AbyssHellHero · Hugging Face
AbyssOrangeMix2 + Helltaker 0.27 + HeroAcademia 0.2
ゲーム「Helltaker」と漫画「僕のヒーローアカデミア」のLoRA(追加学習ファイル)がマージされている。
AbyssHellVer3
AIARTCHAN/AbyssHellVer3 · Hugging Face
AbyssOrangeMix2 + JK Style 0.27 + Helltaker 0.2 + HeroAcademia 0.2
AbyssHellHeroにアーティスト「J.K.」のLoRAであるJK Styleを加えた派生モデル。
AbyssMaple Ver3
AIARTCHAN/AbyssMapleVer3 · Hugging Face
AbyssOrangeMix2 NSFW + maplestoryStyle 0.34 + Terada Tera Style 0.26 + myHeroAcademiaHorikoshi 0.11 + yomYomuStyle 0.08
ゲーム「メイプルストーリー」とアーティスト「寺田てら」、漫画「僕のヒーローアカデミア」(ともう一つ)のLoRAがマージされている。
ロリキャラっぽい仕上がりになる。
AOM3
WarriorMama777/OrangeMixs · Hugging Face
高品質でリアルな質感をもつイラストを生成出来る。
バージョンがいくつか存在する。
2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠(AOMA1のみ違う?)。
AOMA1
ChilloutMixがマージされており、ChilloutMixはCreativeML Open RAIL-MライセンスだけでなくDreamlikeライセンスも適用している。
Dreamlikeライセンスは以下のような驚くべき条項が存在する。
13.The Licensor has a unilateral right to change the terms of the license at any time for any reason.
LICENSE.md · dreamlike-art/dreamlike-diffusion-1.0 at main
14.The Licensor has a right to prohibit the use of the model or the model’s derivatives at any time, for any reason, by anyone.
翻訳すると、
13.ライセンサーは、理由の如何を問わず、いつでもライセンスの条件を変更する一方的な権利を有します。
14.ライセンサーは、いかなる理由であっても、いつでもモデルまたはモデルの派生物の使用を禁止する権利を有します。
というもの。
なので私的利用以外で公開したりする場合は、トラブルを避ける意味でもこのモデルは避けるべきだろう。
AOMA2
油絵のような仕上がりが期待出来るモデル。
AOMA3
一般的な二次元イラストと油絵の中間のような位置づけのモデル。
AOM3A1B
モデル制作者の操作ミスで生み出されたが、良好な結果を残したために公開されたモデル。
AOM3A1とA3の中間のようなスタイル。
AOM3B2
AOM3A1BとBreakdomainM21をマージしたモデル。
背景や緻密な描写が得意なBreakdomainによって、全体的なクオリティが向上している。
Waifu Diffusion
Waifuは主にマイワイフ(俺の嫁)を語源とする、非日本語圏で使われる言葉。
日本語なら理想の二次元嫁というところか。
名前から二次元女性に特化しているように思われるが、男性の描画も十分に可能。
バージョンによって大きく描画が変わるため、最新のバージョンが優れているとは限らない。
Waifu Diffusion v1.3
hakurei/waifu-diffusion-v1-3 · Hugging Face
過去に非常に人気があったモデル。
今でも絵画とアニメ・ゲームイラストの中間的な作風は、独特な個性がある。
ただし古いモデルゆえに安定性には欠けている。
完成度の高いイラストが生成されるまで、根気と時間が求められる。
2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠。
Waifu Diffusion v1.4
hakurei/waifu-diffusion · Hugging Face
モデルのファイル名にanimeとあるが、どちらかと言えば海外イラストの雰囲気が強く出る傾向にある。
日本人の好む二次元イラストには不向きかもしれない。
2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠。
Waifu Diffusion v1.5 beta3
waifu-diffusion/wd-1-5-beta3 · Hugging Face
作者とライセンスが異なるため、注意が必要。
yden
キャラクターの線をハッキリと描画し、塗りはシンプルというかなり特徴のあるモデル。
好みが合う人には、個性的で唯一無二と言ってもよい。
バージョンによって差異があるため、好みで使い分けるのが良さそう。
2023-09-27時点でライセンスの表示はない点に注意してもらいたい。
yden v1
yden – v1.0 | Stable Diffusion Checkpoint | Civitai
サンプリング方法 | DPM++ 2M Karras |
サンプリングステップ数 | 22 |
CFGスケール | 7 |
ネガティブプロンプト | (worst quality, low quality:1.4) |
高解像度補助 | |
アップスケーラ― | R-ESRGAN 4x+Anime6B |
高解像度でのステップ数 | 10 |
ノイズ除去 | 0.35~0.6 |
アップスケール倍率 | 1.5~2 |
yden v2
yden – v2.0 | Stable Diffusion Checkpoint | Civitai
v1と比較して画像はより詳細になり、構図も大幅に変更されている。
推奨設定はV1と同じ。
yden v3
yden – v3.0 | Stable Diffusion Checkpoint | Civitai
v1とv2から更に大幅に変更されており、特に高ステップ数で優れた性能を発揮する。
公開停止されたモデル
animefull
ファイル名は「model-animefull-final-pruned.ckpt」。
公開停止というよりは、有料サービスのNovelAIのモデルデータ(非公開)が流出したという、曰く付きのシロモノ。
当時の主流だったWaifu Diffusion v1.3よりも高品質なイラストが生成されるとのことで、大きな話題になった。
流出したモデルということもあって、公開されていたとしても法的な観点から使用するべきでないし、セキュリティ上の懸念もある。
そもそも最近のモデルがかなり進化しており、リスクを犯してこのモデルを使う理由はない。