Stable Diffusionではモデルデータの他に、生成される画像をさらに調整する「LoRA」というものがあります。これを使うと一定の人物やキャラクターに近づけるなど、生成される画像の方向づけをしてくれます。
特定のキャラが描かれるLoRAも数多くあるのですが、私が気に入ってるのはもっと「コンセプト」のあるLoRAです。プロンプトだけではなかなか狙って生成できるものではないちょっと特殊な画像を生成できるLoRA、そんなものをいくつか紹介します。
ディティールの増減「flat2」
flat2は、そのまま適用するとイラストのディテイールを減らしてフラットなものにします。このウェイトを-1と負の値にすると逆にディティールが加えられます。
これが普通に出力したflat2なしのもの。
ウェイト1で出力したもの。
ウェイトを-1にしたもの。かなり線が多くなってますね。
ディティールはすごくなりますが、若干しつこいと感じるかもしれないので、そのあたりは好みでウェイトを調整すると良いでしょう。
ディティールの増減「Detail Tweaker」
これもflat2と同じくディティールを調整するものです。こちらはウェイトが正の値の場合にディテールアップ、負の値の場合にフラットになります。
ウェイト-1の場合。flat2と似てるけど同じではありません。
ウェイト1の場合。なんか構図までも変わってしまった!?ディティールもflat2よりも細かくなってるようです。
公式の説明ではウェイトは「-2~2」と書かれていたのでウェイト2でやってみました。よりいっそう濃くなりましたね…。ウェイトの調整は細かくやったほうが良いかもしれません。
上原亜衣「AI_uehara」
元セクシー女優の上原亜衣さんの画像を学習させたLoRAです。特定のキャラを出すようなものはあまり興味が無いと言いながら挙げたのは、これがオフィシャルなものだからです。これを使ったコンテストも行われており、他の人が生成したものを見られて面白いです。
似ているのかどうかはわかりませんが、実写系なら同じような顔が出てきます。イラスト系のモデルだとわりとマスピ顔に寄せられますが、それでもどこか雰囲気ある顔になる率が上がります。
> <な目「> < Eyes」
マンガ的表現な> <の目を生成します。かわいい。さすがにアニメ系のモデルでしかうまく出ません。
トリガーワードは (> <:1.2)
片目だけ適用させるにはone eye closedを入れればできるかもしれませんが、難しいとのこと。
猫口「:3」
こちらもマンガ的表現の猫口(ω)にしてくれるLoRAです。
トリガーワードは ;3, uwu です。:じゃなくて;です。また、オプションとしてcatmouth, smugといったプロンプトを入れても良いでしょう。
黒いオーラ「殺意の波動 Satsui no Hadou」
ストリートファイターシリーズで出てくる「殺意の波動」なイラストにするLoRAです。一時期このパターンのイラストが流行りましたね。おそらくそれを元に学習しているようで、横にテキストらしきものが出てくる事が多いです。
トリガーワードは satsui ですが、なくても発動可。AOM3A2モデルとの相性が良いらしい。
スライム娘「slime girl」
半透明なスライムの女の子を生成するLoRAです。slimegirl11とslimegirl16の2種類あり、11は色や形が豊富で洋服との相性が良く、16は透明度が高く様々なモデルに対応できます。
トリガーワードは slime girl で、補助的に transparent body や see-through skin があると良いかもしれません。基本的には青かグレーっぽい体になるので、別の色にしたい場合はred skinやgreen skinなど入れるとその色になります。
グラフィック系冊子の表紙「Cover Page Layout Graphic design」
オシャレな本の表紙のような画像を生成してくれるLoRAです。説明には同人誌と書かれていますね。もちろん出てくるのは文字らしきナニカなのでそのままでは使えませんが、素材として使ったり参考にするなりで利用価値あります。
トリガーワードは cover です。補助的にmagazine cover や concept art、posterなど入れるのもいいと思います。
ドット絵「M_Pixel」
レトロゲームのようなドット絵を生成してくれるLoRAです。ファンタジーRPGのものを学習しているのか、特に指定しないと戦士や魔法使いのようなキャラが生成されます。
トリガーワードは pixel で、ウェイトは0.5で十分とのこと。
プラカード持ち「Anime Girls Holding Signs」
白いプラカードを持った女の子を生成してくれます。プラカードと言ってもペラペラの紙の場合もあります。あとから自分でテキストを書き込む前提ですね。
トリガーワードは Holding_Sign でウェイトは0.5-1.0くらい。
パステルカラー「Pastel Vector illustrated」
淡いパステルカラーでフラットな画像を生成してくれるLoRAです。全体的に赤と青の印象が強い画像になります。雰囲気あってかっこいいです。
トリガーワードは PastelVectorAi です。
髪が宇宙「Hair with scenery reflection」
人物の髪部分を宇宙で塗りつぶしたような画像を生成してくれます。夕焼けや雪景色で塗りつぶすこともできるようですが、宇宙が一番簡単。
トリガーワードは starry sky, galaxy, sunset, snow など。塗りつぶしたいものを選べばOKです。
テック業界イラスト「Tech Startup Illustration」
テック業界のウェブサイトやサービス紹介にありそうな、オフィス風景などを描いたフラットなイラストを生成してくれます。
トリガーワードは tech startup illustration です。
指差し「Finger gun」
人差し指でこちらを指差ししてるような画像を生成するLoRAです。銃のように突き出したり、思いついたように上に伸ばすなどあります。ただ両手でそうなったり、わりと成功率は低いです。
トリガーワードは finger_gun,pointing at viewers です。
お嬢様ポーズ「Ojou-Sama Pose」
「おーほっほ」「可愛らしいこと」といったセリフが浮かんできそうな「お嬢様ポーズ」を生成してくれるLoRAです。手を口に持ってくるものです。比較的持ってきた手の形はしっかりしてる気がします。
トリガーワードは ojou-sama pose ですが、なくても生成されるとのこと。
まとめ
いろいろあって面白いですね。これらのLoRAは組み合わせて使うこともできます。それで期待通りの画像ができるかはまた別の話ですが…。
今後も面白いLoRAがあれば追加していきたいと思ってます。