画像生成AIについてと使えそうな呪文(言葉)

海と崖

どのような言葉によってどんな画像に仕上がるのか、いろいろ探ってみる。

使用したソフト

NMKD Stable Diffusion GUI – AI Image Generator by N00MKRAD

ソフトを動かすにはNVIDIA製のGPUを搭載したPCが必要。

AMD製などの他のGPUはサポートされていない。

これは画像生成に使われている機械学習ツールキットであるStable Diffusionがそもそも対応していないため。

GPUのメモリは8GB以上を推奨している。

ちなみに今回使用したGPUは「GeForce GTX 1060 6GB」で、一応メモリが足りていなくても動くが、保障は出来ない。

環境を用意出来ない人は、Midjourney(Discord上で動作)やDALL・E2などの他のサービスを利用してみるのも手。

ただし制限が多いものがほとんどなので、環境がある人はStable Diffusionを用いたGUIソフトを使うのが効率的である。

画像生成に設定したパラメータ

以下の設定に固定して画像生成をした。

パラメータ数値
Detail(Steps)100
Creativeness(Guidance Scale)9.5
Seed-1
Resolution512*512
Samplerk_euler_a
Stable Diffusionのパラメータ

呪文一覧

初めに

当然だが、全ての単語を網羅することは出来ない。

どういった単語が自分の求めている画像を生成する上で有効なのか、ヒントとして見てもらえればと思う。

基本呪文

castle

「城」「城郭」

中世の城

cthulhu mythos

「クトゥルフ神話」

クトゥルフ神話 – Wikipedia

クトゥルフ神話の怪物

devil

「魔王」「サタン」「悪魔」「悪鬼」

demon

「鬼」「悪魔」「悪霊」

dragon

「ドラゴン」「竜」

山のドラゴン

farm village

「農村」

中世の農村

female

「女性」「雌(メス)」

アニメ風の赤いロングヘアーの女性

人間が生成されるとは限らず、動物が多い。

人間に限定する場合は「woman」を使用するか、humanと組み合わせる。

forest

「森」

神秘的な森

girl

「女の子」「少女」「女性」

美しいブロンドの白人女性の顔

grassland

「草原」

草原

island

「島」

大きな木が生えた島

library

「図書館」

図書館

male

「男性」「雄(オス)」

何かの動物のオス

こちらも「female」と同様、人間に限定されない。

「guy」や「man」の方が人間に限定できる。

pond

「沼」

薄暗い森の沼地

「dark」や「death」と組み合わせるとこんな風になる。

starry night

「星空の夜」

volcano

「火山」

噴火中の火山

追加呪文

background

「背景」

風景画を作成したい時に使える。

back portrait

「後ろ姿」

beautiful

「美しい」

concept art

「コンセプトアート」

コンセプトアート – Wikipedia

dark

「暗い」「邪悪な」

evil

「悪い」「邪悪な」「悪魔の」

Full body

「全身」

highly detailed

「非常に詳細な」

デティール向上に貢献する?

kawaii

共通化された日本語で「かわいい」

intricate

「入り組んだ」「複雑な」

masterpiece

「傑作」「大作」

mysterious

「神秘的な」

ソフトフォーカスが掛かることが多い。

参照系呪文

【解像度系】

hd, 4k, 8k

を単独で使ったり

wallpaper

と組み合わせるパターンもある。

artstation

trending on artstation

と組み合わせることで人気がある画像が参照されやすい?

ArtStation – Explore

2D/3Dアーティスト向けの画像投稿サイトで、世界中のアマチュア、プロのアーティストが利用している。

pixiv

pixiv

日本のイラストや漫画を中心としたSNS。

作風系呪文

alex grey

Home | Alex Grey

Alex Grey – Wikipedia

アレックス・グレイは精神・幻想・心理的な作風が特徴のアメリカの視覚芸術家。

andrey shishkin

Andrey Shishkin – Wikipedia

アンドレイ・シシーキンはロシアの画家で、ロシアのスラブ先住民信仰を題材とした作品を描いている。

ghibli

スタジオジブリ|STUDIO GHIBLI

日本で最も著名なアニメ制作会社の一つ。

greg rutkowski

Greg Rutkowski

グレッグ・ルトコフスキはポーランドのイラストレーター。

世界的なトレーディングカードゲームでお馴染みのMtG(マジック:ザ・ギャザリング)を出版するWotCやゲームメーカーのUbisoftBlizzard、ディズニーなどのイラストを担当している。

hiroshi yoshida

吉田博 – Wikipedia

吉田博は1876-1950年の日本の洋画家・版画家。

ivan shishkin

イヴァン・シーシキン – Wikipedia

1832~1898年のロシアの風景画家。

james jean

James Jean

James Jean – Wikipedia

ジェームズ・ジーンは台湾系アメリカ人のビジュアルアーティスト。

lee madgwick

Lee Madgwick – Original Artwork

イギリスを拠点とする画家、イラストレーター。

leonardo da vinci

レオナルド・ダ・ヴィンチ – Wikipedia

1452-1519年のルネサンス期を代表する芸術家。

makoto shinkai

新海誠 – Wikipedia

日本のアニメーション監督。

代表作は『ほしのこえ』『秒速5センチメートル』『言の葉の庭』『君の名は。』『天気の子』。

mandy jurgens

Art of Mandy Jurgens

フランスのイラストレーターで、人物画が主体。

marc simonetti

martin johnson heade

マーティン・ジョンソン・ヒード – Wikipedia

1819-1904年のアメリカの風景、静物、肖像画家。

ruan jia

takashi takeuchi

武内崇 – Wikipedia

「月姫」「Fate/Stay night」「空の境界」のイラストレーター。

ufotable

ufotable

鬼滅の刃、Fate/Stay nightなどのアニメ作品を手掛ける制作会社。

zdislav beksinski

ズジスワフ・ベクシンスキー – Wikipedia

Zdzislaw Beksinski

1929-2005年のポーランドの画家、写真家、芸術家。

画像生成AIでのコツ

リアルでかつ人間のような複雑な生き物を生成しようとすると、破綻した画像が出来やすい。

より多くの画像を生成したり、生き物の一部分のみ(顔のみなど)を指定すると、良いかもしれない。

逆に架空(ファンタジー)の背景画やモンスターとは抜群に相性が良く、多少崩れていても違和感を感じにくい。

著作権的な話

Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 | STORIA法律事務所

専門的で分かりやすかった。

ただ実際に裁判所がどう判断するかは、また違ってきそう。

感想

記事のサムネイルとしては非常に便利そう。

環境さえあれば単語を入力するだけで、全く新しい画像が作れてしまう。

今作っているサムネイルで一番簡単な絵でも、10分は掛かっている。

画像生成AIを使えば最短3分で、クオリティの高い画像が出来る。

一方で、思った通りの絵が出来るとは限らず、破綻している絵が多い。

呪文を詳細に唱えて精度を上げつつ、試行回数を増やすことでより良い画像を作り出すしかない。

ただし将来的に、より高精度なサービスが開発されるかもしれない。

イラストレーターや画家は廃業しそうだ。

さすがに物語まではAIによって生成されるのは時間が掛かりそうだから、漫画家はしばらく安泰と言える?

guest

0 Comments
インラインフィードバック
すべてのコメントを見る