とみます(@20tomimasu)です。
ChatGPTの画像生成の精度が上がったそうで。
早速、試してみると…
お、日本語の文字の反映精度がアップしていますね。
使用感をまとめておきます。
入力したプロンプト文章
まず、
- 青髪の青年がPCゲームしている様子を描いて、アニメで。
と、
- Gemini 2.0Flash
- ChatGPT4.5
にそれぞれ入力して、出力してみた。
次に、
その結果がこちら↓
Gemini 2.0Flash vs ChatGPT4.5
ChatGPT4.5の結果↓
ん、生成までが遅い…
感覚的に1~2分ほど。
しかも、エラー文章が出てきた。
どうやら、ユーザーが混み合っている模様。
時間が経てば、もう少し早くなるのかも?
まあ、出力された画像は、難なく再現されているね。
一方、Gemini 2.0Flashでは↓
生成が速い!
10~20秒ほどだ。
この速さで、この精度が出るのであれば、Geminiに軍配が上がるかな。
そして、出力された画像をさらに加工していこう↓
線画の抽出結果と比較
同様に
- その絵の線画を抽出して
と続けると。
Gemini 2.0Flash。
おー、色が入っているけど、上出来だね。
1発目でこの精度が出ると、使いやすいかと。
ただ、元の画像を加工したというよりは、
画像から情報を抜き出して、書き直したような感じだね。
絵柄が異なってしまった。
この辺はプロンプトを修正しながら進めていくことになりそう。
一方、ChatGPT4.5は↓
Pythonで線画プログラムを書いて、画像を抽出してくれた。
元の画像をそのまま処理しているので、画風は完全に一致しており。
が、線が途切れてしまい。
実際に使うとなると、修正箇所が多くなりそうだね。
最後に、日本語の文字入れチェック↓
日本語の文字入れ結果と比較
↑Geminiの場合、文字化けが発生してしまい。
まだ、日本語の文字入れに難があった。
一方、今回アプデされた、ChatGPTでは…
(あまりにも、4.5では遅かった? ので、4oで生成し直している。)
じゃん!!
お、なんかサムネっぽく、仕上がっているね。
しかも、
モニター内の画像が映るように、改行と文字位置が工夫されており。
これは、すごい。
んー、この精度が出るのであれば、ChatGPTのサブスクは継続かなぁ、色々と悩ませてくれるね。
おわりに
以上「ChatGPTの画像生成、日本語の文字入れ精度が向上した」でした。
今のところの雑感をまとめてみました。
競争が激化しており、自分に合った生成AIを見つけるのが大変な時代になりましたね。笑
手を動かしながら、よりよい使い方を模索していければ。
それでは、また。