とみます(@20tomimasu)です。
AI画像が簡単に作れるStable Diffusion。
ゲーミングPCのグラボもあるので、触ってみるか…
最初、Pythonでコーディングしたものの、途中で挫折。
初心者は、NMKD Stable Diffusion GUIを使った方が良いですね。
Stable Diffusionとは
この方の記事が分かりやすかった。
>>https://ja.stateofaiguides.com/20221012-stable-diffusion/
ざっくり、
- 拡散モデル
と呼ばれる方程式を解いて、最適解を得るものと理解した。
正確には、
- ノイズ除去拡散確率モデル
らしく、ノイズを確率的に処理していくことで、AI画像を仕上がるといったところ。
まずは、どのレベルまで達しているのだろうか。
試しに触ってみよう。
Stable Diffusion Pythonの始め方・使い方
この方の記事を参考にした。
>>【Python】自分のPCで、画像生成AI「Stable Diffusion」を実行する方法(GPU版) – 概要、NSFW無効化も紹介 –
コードをコピペし、自分用に書き直していく。
途中で、バージョン更新などのデバックを交えながら。
一応、テキストから、AI画像を描くことができた。
試しに、
- AI CAT
を読み込ませ、掃き出させると↓
お…おう。
何か、エイリアン要素でも入っているのだろうか。w
ちと怖い。
ちなみに、数枚を描かせて、出来の良かったものを選んで、このブログに載せている。
外れも多く、トライ&エラーしながら試していくものなのだろう。
んで、すでに保有している画像から、AIで修正していくのをやりたかったのだが…
なかなかコードでの微調整と検証が大変で。
誰か、UI作ってないかな?
と検索してみると。
NMKD Stable Diffusion GUI が使える
この記事に辿り着いた。
>>Stable Diffusionのimg2img(画像から画像)をソフトから簡単に実行 [NMKD Stable Diffusion GUI]
やっぱり。
GUIがあるのね。
これがとても便利で。
↑編集画面はこんな感じ。
テキストでAIに描かせることもできるし、元の画像の一部を選択しその部分だけを修正することも可能。
(上の図では、三毛猫と入力しただけ。)
すごいな。
1時間ほどトライ&エラーしていると…
↑じゃん!!
パッと見は可愛い。
ところが、よく見ると、足の向きなどが変なのよね。
その辺の調整がまだ難しい…
パラメータなどの意味を理解して、使いこなしていくのが今後の課題だね。
ちなみに、イメージは、SCO猫ちゃん×クリスマスver.↓
大分、可愛くなったな。w
クリエイターとしての活動? も進めていければ。
おわりに
以上「StableDiffusionの始め方」でした。
何かと話題になるStable Diffusion。
高品質な画像生成、メモリの少ないGPUでも手軽に動かせる、さらに、コードが公開→カスタマイズ可能と、社会に与える影響は大きく。
時代を象徴するようなAIですね。
引き続き、注目していければ。
それでは、また。