ChatGPTの画像生成、日本語の文字入れ精度が向上した

 

とみます(@20tomimasu)です。

 

ChatGPTの画像生成の精度が上がったそうで。

早速、試してみると…

 

お、日本語の文字の反映精度がアップしていますね。

使用感をまとめておきます。

 

入力したプロンプト文章

 

まず、

  • 青髪の青年がPCゲームしている様子を描いて、アニメで。

と、

  • Gemini 2.0Flash
  • ChatGPT4.5

にそれぞれ入力して、出力してみた。

 

次に、

  • 線画の抽出
  • Youtubeサムネを作って「生成AIがすごい」という文字を入れて

と指示した。

 

その結果がこちら↓

 

Gemini 2.0Flash vs ChatGPT4.5

 

ChatGPT4.5の結果↓

gemini than gpt250326-1

ん、生成までが遅い…

感覚的に1~2分ほど。

 

しかも、エラー文章が出てきた。

どうやら、ユーザーが混み合っている模様。

 

時間が経てば、もう少し早くなるのかも?

まあ、出力された画像は、難なく再現されているね。

 

一方、Gemini 2.0Flashでは↓

gemini than gpt250326-2

 

生成が速い!

10~20秒ほどだ。

 

この速さで、この精度が出るのであれば、Geminiに軍配が上がるかな。

そして、出力された画像をさらに加工していこう↓

 

線画の抽出結果と比較

 

同様に

  • その絵の線画を抽出して

と続けると。

 

gemini than gpt250326-3

Gemini 2.0Flash。

 

おー、色が入っているけど、上出来だね。

1発目でこの精度が出ると、使いやすいかと。

 

ただ、元の画像を加工したというよりは、

画像から情報を抜き出して、書き直したような感じだね。

絵柄が異なってしまった。

この辺はプロンプトを修正しながら進めていくことになりそう。

 

一方、ChatGPT4.5は↓

gemini than gpt250326-4

Pythonで線画プログラムを書いて、画像を抽出してくれた。

元の画像をそのまま処理しているので、画風は完全に一致しており。

 

が、線が途切れてしまい。

実際に使うとなると、修正箇所が多くなりそうだね。

 

最後に、日本語の文字入れチェック↓

 

日本語の文字入れ結果と比較

gemini than gpt250326-6

↑Geminiの場合、文字化けが発生してしまい。

まだ、日本語の文字入れに難があった。

 

一方、今回アプデされた、ChatGPTでは…

gemini than gpt250326-5

(あまりにも、4.5では遅かった? ので、4oで生成し直している。)

 

じゃん!!

お、なんかサムネっぽく、仕上がっているね。

 

しかも、

モニター内の画像が映るように、改行と文字位置が工夫されており。

 

これは、すごい。

んー、この精度が出るのであれば、ChatGPTのサブスクは継続かなぁ、色々と悩ませてくれるね。

 

おわりに

 

以上「ChatGPTの画像生成、日本語の文字入れ精度が向上した」でした。

 

今のところの雑感をまとめてみました。

競争が激化しており、自分に合った生成AIを見つけるのが大変な時代になりましたね。笑

 

手を動かしながら、よりよい使い方を模索していければ。

それでは、また。

 

「普通の会社員」こそ 安定した副収入が得られる 不動産投資を

「安定した不労所得」の仕組みを作り、給与を超える家賃収入で、経済的自由を手に入れる方法はこちらから。私も20代の時によく無料のセミナーに参加していました。初心者は多くの情報に触れることをオススメします。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です