Stable Diffusionの絵画・二次元イラスト向けモデル(checkpoint)のまとめ

AI画像の一例(モデル:meinamix_meinaV11)

色々試した結果などを書いていく。

注意事項

ライセンス

各モデルにはライセンスや独自の制限が定められているので、使用前によく読むこと。

本記事の本文に不足や誤りがあったり、後でモデルの制作者によってライセンス等が変更される可能性もある。

一切の責任を持てないので、あしからず。

むしろライセンスや制限については非常に怪しい部分が多い。

特に公開したり販売したりする場合は、現状では無視出来ないリスクがあることも留意して頂きたい。

CreativeML Open RAIL-Mライセンスについては、既に和訳や意訳されたものがネット上で公開されているので、ここでは取り上げない。

NSFW

モデルによってはヌードやグロなど、NSFW要素を含む可能性が多々ある。

閲覧する場合は、その閲覧している自身の環境に注意を払ってほしい。

NSFW – Wikipedia

ファイル形式

safetensorsとckptの2種類(もしくはその他)が用意されているが、セキュリティの安全上からsafetensorsを選んでおくべきだろう。

技術的な話をすると、ckptはほぼzipファイル(pythonコードも含む)であり、解凍して簡単に改変出来てしまう。

例えば配布が終了した大人気のモデルに、悪意のあるコードを含めて拡散される危険が考えられる。

Meina系

MeinaMix

MeinaMix – Meina V11 | Stable Diffusion Checkpoint | Civitai

プロンプトをほとんど使わなくても、非常に高品質なイラストが生成されるモデルで、非常に人気がある。

以下は推奨設定。

Clip Skip2
サンプリング方法(その1)DPM++ SDE Karras
サンプリングステップ数(その1)20~40
サンプリング方法(その2)DPM++ 2M Karras
サンプリングステップ数(その2)20~60
サンプリング方法(その3)Euler a
サンプリングステップ数(その3)40~60
解像度(ポートレート)512×768,512×1024
解像度(風景)768×512,1024×512,1536×512
CFGスケール4~11
ネガティブプロンプト(worst quality, low quality:1.4), monochrome, zombie, (interlocked fingers)
ネガティブプロンプト(高解像度補助なし)(worst quality:1.6, low quality:1.6), (zombie, sketch, interlocked fingers, comic)
高解像度補助
アップスケーラ―R-ESRGAN 4x+Anime6b
高解像度でのステップ数10
ノイズ除去0.3~0.6
MeinaMixV11推奨設定
ライセンスCreativeML Open RAIL-M
作成者のクレジットを表示せずにモデルを使用するNG
生成した画像を販売するOK
お金を払って画像を生成するサービスを実行するNG
Civitaiで実行OK
このモデルを使用してマージを共有するOK
このモデルか、このモデルをマージに使用したモデルを販売するNG
マージを共有するときに異なる権限(制限)を与えるOK
2023-09-22時点

MeinaPastel

meinapastel_v6Pastel

MeinaPastel – V6 ( Pastel ) | Stable Diffusion Checkpoint | Civitai

パステルやカラフルなイメージを生成出来る。

Clip Skip2
サンプリング方法DPM++ 2M Karras/SDE Karras/Euler a
サンプリングステップ数20~40
解像度(ポートレート)512×768,512×1024
解像度(風景)768×512,1024×512,1536×512
CFGスケール4~11
ネガティブプロンプト(worst quality, low quality:1.4), monochrome, zombie, (interlocked fingers)
高解像度補助
アップスケーラ―R-ESRGAN 4x+Anime6b
高解像度でのステップ数15
ノイズ除去0.4
MeinaPastelV6推奨設定
ライセンスCreativeML Open RAIL-M
作成者のクレジットを表示せずにモデルを使用するNG
生成した画像を販売するOK
お金を払って画像を生成するサービスを実行するNG
Civitaiで実行OK
このモデルを使用してマージを共有するOK
このモデルか、このモデルをマージに使用したモデルを販売するNG
マージを共有するときに異なる権限(制限)を与えるOK
2023-09-22時点

MeinaUnreal

MeinaUnreal – V4.1 | Stable Diffusion Checkpoint | Civitai

2.5次元のアニメアートを目標にしたモデル。

Clip Skip2
サンプリング方法(その1)DPM++ SDE Karras
サンプリングステップ数(その1)20~30
サンプリング方法(その2)DPM++ 2M Karras
サンプリングステップ数(その2)20~40
サンプリング方法(その3)Euler a
サンプリングステップ数(その3)40
解像度(ポートレート)512×768,512×1024
解像度(風景)768×512,1024×512,1536×512
CFGスケール7
ネガティブプロンプト(worst quality, low quality:1.4), monochrome, zombie, (interlocked fingers)
高解像度補助
アップスケーラ―R-ESRGAN 4x
高解像度でのステップ数10~30
ノイズ除去0.3~0.5
MeinaUnrealV4.1推奨設定
ライセンスCreativeML Open RAIL-M
作成者のクレジットを表示せずにモデルを使用するNG
生成した画像を販売するOK
お金を払って画像を生成するサービスを実行するNG
Civitaiで実行OK
このモデルを使用してマージを共有するOK
このモデルか、このモデルをマージに使用したモデルを販売するNG
マージを共有するときに異なる権限(制限)を与えるOK
2023-09-22時点

MeinaHentai

NSFWに特化したモデルで閲覧及び使用には注意が必要。

リンクはなし。

ライセンスCreativeML Open RAIL-M
作成者のクレジットを表示せずにモデルを使用するNG
生成した画像を販売するOK
お金を払って画像を生成するサービスを実行するNG
Civitaiで実行OK
このモデルを使用してマージを共有するOK
このモデルか、このモデルをマージに使用したモデルを販売するNG
マージを共有するときに異なる権限(制限)を与えるOK
2023-09-22時点

Anythingシリーズ

AnythingV5Ink_ink

万象熔炉 | Anything V5/Ink – ink | Stable Diffusion Checkpoint | Civitai

V1、V2、V3、V3.2、および V5の基本バージョンが存在する。

Meina系に匹敵するクオリティでありながら、CreativeML Open RAIL-Mライセンスのみ指定されている。

他に制限は設定されていないのが最大の魅力だろうか。

AbyssHell

2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠。

AbyssHellHero

AIARTCHAN/AbyssHellHero · Hugging Face

AbyssOrangeMix2 + Helltaker 0.27 + HeroAcademia 0.2

ゲーム「Helltaker」と漫画「僕のヒーローアカデミア」のLoRA(追加学習ファイル)がマージされている。

Steam:Helltaker

AbyssHellVer3

AbyssHellVer3

AIARTCHAN/AbyssHellVer3 · Hugging Face

AbyssOrangeMix2 + JK Style 0.27 + Helltaker 0.2 + HeroAcademia 0.2

AbyssHellHeroにアーティスト「J.K.」のLoRAであるJK Styleを加えた派生モデル。

J.K. – pixiv

AbyssMaple Ver3

AIARTCHAN/AbyssMapleVer3 · Hugging Face

AbyssOrangeMix2 NSFW + maplestoryStyle 0.34 + Terada Tera Style 0.26 + myHeroAcademiaHorikoshi 0.11 + yomYomuStyle 0.08

ゲーム「メイプルストーリー」とアーティスト「寺田てら」、漫画「僕のヒーローアカデミア」(ともう一つ)のLoRAがマージされている。

ロリキャラっぽい仕上がりになる。

AOM3

WarriorMama777/OrangeMixs · Hugging Face

高品質でリアルな質感をもつイラストを生成出来る。

バージョンがいくつか存在する。

2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠(AOMA1のみ違う?)。

AOMA1

ChilloutMixがマージされており、ChilloutMixはCreativeML Open RAIL-MライセンスだけでなくDreamlikeライセンスも適用している。

Dreamlikeライセンスは以下のような驚くべき条項が存在する。

13.The Licensor has a unilateral right to change the terms of the license at any time for any reason.
14.The Licensor has a right to prohibit the use of the model or the model’s derivatives at any time, for any reason, by anyone.

LICENSE.md · dreamlike-art/dreamlike-diffusion-1.0 at main

翻訳すると、

13.ライセンサーは、理由の如何を問わず、いつでもライセンスの条件を変更する一方的な権利を有します。

14.ライセンサーは、いかなる理由であっても、いつでもモデルまたはモデルの派生物の使用を禁止する権利を有します。

というもの。

なので私的利用以外で公開したりする場合は、トラブルを避ける意味でもこのモデルは避けるべきだろう。

AOMA2

油絵のような仕上がりが期待出来るモデル。

AOMA3

一般的な二次元イラストと油絵の中間のような位置づけのモデル。

AOM3A1B

AOM3A1B_orangemixs

モデル制作者の操作ミスで生み出されたが、良好な結果を残したために公開されたモデル。

AOM3A1とA3の中間のようなスタイル。

AOM3B2

AOM3B2_orangemixs

AOM3A1BとBreakdomainM21をマージしたモデル。

背景や緻密な描写が得意なBreakdomainによって、全体的なクオリティが向上している。

Waifu Diffusion

Waifuは主にマイワイフ(俺の嫁)を語源とする、非日本語圏で使われる言葉。

日本語なら理想の二次元嫁というところか。

名前から二次元女性に特化しているように思われるが、男性の描画も十分に可能。

バージョンによって大きく描画が変わるため、最新のバージョンが優れているとは限らない。

Waifu Diffusion v1.3

Waifu Diffusion v1.3
Waifu Diffusion v1.3

hakurei/waifu-diffusion-v1-3 · Hugging Face

過去に非常に人気があったモデル。

今でも絵画とアニメ・ゲームイラストの中間的な作風は、独特な個性がある。

ただし古いモデルゆえに安定性には欠けている。

完成度の高いイラストが生成されるまで、根気と時間が求められる。

2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠。

Waifu Diffusion v1.4

hakurei/waifu-diffusion · Hugging Face

モデルのファイル名にanimeとあるが、どちらかと言えば海外イラストの雰囲気が強く出る傾向にある。

日本人の好む二次元イラストには不向きかもしれない。

2023-09-22時点において、CreativeML Open RAIL-Mライセンス準拠。

Waifu Diffusion v1.5 beta3

waifu-diffusion/wd-1-5-beta3 · Hugging Face

作者とライセンスが異なるため、注意が必要。

Fair AI Public License 1.0-SD

yden

キャラクターの線をハッキリと描画し、塗りはシンプルというかなり特徴のあるモデル。

好みが合う人には、個性的で唯一無二と言ってもよい。

バージョンによって差異があるため、好みで使い分けるのが良さそう。

2023-09-27時点でライセンスの表示はない点に注意してもらいたい。

yden v1

yden_v10

yden – v1.0 | Stable Diffusion Checkpoint | Civitai

サンプリング方法DPM++ 2M Karras
サンプリングステップ数22
CFGスケール7
ネガティブプロンプト(worst quality, low quality:1.4)
高解像度補助
アップスケーラ―R-ESRGAN 4x+Anime6B
高解像度でのステップ数10
ノイズ除去0.35~0.6
アップスケール倍率1.5~2
yden v1推奨設定

yden v2

yden_v20

yden – v2.0 | Stable Diffusion Checkpoint | Civitai

v1と比較して画像はより詳細になり、構図も大幅に変更されている。

推奨設定はV1と同じ。

yden v3

yden_v30

yden – v3.0 | Stable Diffusion Checkpoint | Civitai

v1とv2から更に大幅に変更されており、特に高ステップ数で優れた性能を発揮する。

公開停止されたモデル

animefull

ファイル名は「model-animefull-final-pruned.ckpt」。

公開停止というよりは、有料サービスのNovelAIのモデルデータ(非公開)が流出したという、曰く付きのシロモノ。

当時の主流だったWaifu Diffusion v1.3よりも高品質なイラストが生成されるとのことで、大きな話題になった。

流出したモデルということもあって、公開されていたとしても法的な観点から使用するべきでないし、セキュリティ上の懸念もある。

そもそも最近のモデルがかなり進化しており、リスクを犯してこのモデルを使う理由はない。

申し込む
注目する
guest

0 Comments
インラインフィードバック
すべてのコメントを見る