最近流行りの画像生成AI、私もこれまでウェブ上でできるものをいくつか試したりしてましたが、最近はMacBook Airのローカル環境でStable Diffusion Web UIを使っています。
今回のトップ画像も、Stable Diffusion Web UIを使って出したものに日付を入れただけです。いやぁ、なんか楽しいね、これは。
MacBook Air (M2)でStable Diffusion Web UI
画像生成AIは、前々から興味あって自分のPCでも動かせたら…とは思っていたのですが、なにせこれはちゃんとしたグラフィックボードを積んだつよつよPCでないとできないっぽいので違う世界の話だと思ってました。
で、そういえば最近はそれを使ったアプリもあるじゃない…と調べていたら、どうやらMacBook Airのローカル環境でもできる、とわかりました。
Macを使い始めて間もない私ですが、このあたりを解説してるサイトも多いので割とすぐに使えるようになりました。私が参考にしたのは以下のページです。
使い方やモデルの紹介なども日本語で情報が十分にあるので、簡単に使うだけならすぐにできちゃいますね。
パッと見はいいけど、よくよく見るとどこか破綻してたりしておかしい、という画像もよく出てきます。(本当にわけわからんのも出てくる。)でもまぁ、パッと見がいい、上図のように背景の書き込みもできてる画像が簡単に生成できるのはすごいです。
狙った画像をピタリと出すにはまだまだ勉強不足ですが、他の人のプロンプトを見られるサイトもあるので、それらでいろいろ試しながらできるのは面白い。
私のように、ブログでちょっとしたイメージ画像を使いたい、という用途にはすごく合ってると思います。一昨日の花粉症についての記事では、「マスクをして涙目の女の子」の画像が欲しくて繰り返し生成してました。マスクが医療用のマスクと仮面のマスクと混ざってしまうようで、(メディカルマスクと指定しても)両方出ることも多かったです。
モデルの違いでガラリと変わる
Stable Diffusionにはいくつもの学習モデルが存在します。日々新しいものや、それらをマージしたものが出ているようです。で、そのモデルによって得意分野や出力結果も変わってくるわけで、これもまた面白いのです。
以下は同じプロンプトで別々のモデルで出力したものです。
オリエンテーリングのイラストを出してみよう
基本的に、学習してるものの影響なのか女の子が一番得意だったりする画像生成AIですが、これを使ってオリエンテーリングのイメージ画像を出せないか?と、やってみました。
とりあえず森を走らせようと「trail running」をプロンプトに入れたら、それっぽいものが出てきました。いや、まぁ、オリエンテーリングというよりもトレイルランニングですけど。なんかどこかで見たことあるような構図ですね。
で、ここから「orienteering」を強調したり、キャップやバックパックをNGに入れてみたりで…
ん?なにか持ってる?それに胸にはゼッケン?
あ、地図とコンパスを持ってる…?
左下に写ってる白とオレンジアはコントロールフラッグ!?
…と、こんな感じに「惜しい」といえるくらいには出てくるようになりました。ただ、やっぱり学習元となるものがなかったのか、どのモデルを使っても同じような雰囲気の画像が出てきました。あまりアニメっぽいものとか顔がはっきりしたものが出てくれません。なんとなく、どこかの写真を水彩画風にしたような…というものばかりでした。まぁ、ここまで描ければすごいですよね。
顔が比較的しっかりでても、他が破綻というかわけわからないものも…。
そのほかに生成したもの
いろいろ生成してみてるものの、特に何に使おうとか考えてないので、せめてここで公開しておきます。
うん、サイトタイトル用に細長い画像が欲しいとか、そういうのでも対応できるのがいいですね。
しかし…こういうの、ほぼランダムのようにしてできるので、削除してしまえばもう見ることができなくなるわけです。でもだからといって何に使うでもない画像が溜まっていくのは無駄でもあるわけで…。これらの画像の扱いをどうしたらいいのか、なかなか悩ましいです…。