とみます(@20tomimasu)です。
Stable Diffusionの環境を構築し、いざ、QRコードのAIアートに挑戦したものの…
スマホの読み込みが全然成功しない。
ノイズが多いと、デザイン性は良いが、読み込み不良に。
一方で、ノイズが少ないと、読み込めるけど、デザインがイマイチ。
トレードオフの関係で。w
ざっと、600枚以上挑戦してみたけど、失敗したので、Denoising strengthの設定の理解度を深めていきます。
QRコード×Stable Diffusionの環境について
まず、QRコード
- QRコード生成: https://qrbtf.com/
- 生成先のリンク: https://lit.link/tomimasu
- fault tolerance(耐障害性: 汚れても読みやすい): 30%
おそらく、URLの文字列が少ない方が、QRコードで認識する情報が少なくなるので、結果的に読み込みやすい。
もう少し、短いURLにすれば良かったかも。あるいは、短縮させるか。
Stable Diffusion
- UI: Stable Diffusion web UI (AutoiMATIC1111)
- Model: chilled_remix_v2
- PCのグラボ: RTX 3070 Ti
あまり関係ないと思っていたが、
もしかしたら、Modelとの相性があるのかも?
この人のブログを参考にし
基本的に、彼の通りに進めていった
- image-to-image
- Resize mode: Just resize
- Sampling method: DPM++2M Karras
- Sampling step: 50
- Width: 768
- Height: 768
- CFG Scale: 7
- Denoising strength: 0.75 (変数として検証していく)
ControlNet
- Enable: Yes
- Control Type: Tile
- Preprocessor: tile_resample
- Model: control_xxx_tile ←出てこなかったので、none。多分Controlnetのバージョンの違い?
- Control Weight: 0.87
- Starting Control Step: 0.23
- Ending Control Step: 0.9
prompt
- a cubism painting of a town with a lot of houses in the snow with a sky background, Andreas Rocha, matte painting concept art, a detailed matte painting
- nega: ugly, disfigured, low quality, blurry, nsfw
Denoising strength比較
拡散モデルの要点は、
- ノイズレベルをどのくらに設定するか。
この、
- Denoising strength
は、デ・ノイズとあるように、ノイズ除去の強度を設定できる。
順に、大きくしていった場合の様子を見ていこう。
Denoising strength=60
まず、私のアンドロイドスマホで読み込めたのは、これ↑
62~63くらいが、読み込みをほぼ成功する限界値である。
読み込むことはできるけど、とてもアート性は感じられない…
ここから、ノイズ量を増やすことで、デザイン性を高めていく。
Denoising strength=65
↑まだまだイマイチ。
が、もうすでに、この時点で読み取れない。
QRコードの配列を眺めていくと、壊れている箇所が多い。
こりゃ、思っていたよりもムズイぞ。
Denoising strength=70
↑70まで上げると。
あー、デザインは良い。
が、もはや、QRコードの配列は、どこにいった。w
Denoising strength=75
↑75。
ブログの方は、この75を推奨していたが…
読み込むのは、無理やろぉぉ。
もしかして、何千枚も作ったうちの1枚なのかも…? と不安になるほどで。
こりゃ、想定上に、ハードモード。
その内、QRコードに特化したモデルが出てきそうな予感。
(それを使わせてもらうことにしようかな…)
QRコード×AIジェネレーターみたいなツール。
もしかしたら、爆発的にヒットするかもねん。
おわりに
以上「ノイズ理解度を深めるためにDenoising strength比較」でした。
QRコードの崩れ方を見つつも、
上手いく行っている彼のデザインは、もっと崩れているんだよな…
QRコードの仕組みを学んだ方が近道かもですね。
自分の知識をアップデートしていければ。
それでは、また。