とみます(@20tomimasu)です。
Google DeepMindのImagen 3の評判が良いようで。
早速、画像生成AIを試してみました。
ChatGPTのDALL-Eと比較してみます。
写真のような絵が生成されやすいかも。
GoogleのImageFXの始め方
引用…https://deepmind.google/technologies/imagen-3/
↑GoogleのImagen3。
テキスト to イメージの最高品質モデルと書かれており。
早速、
- Try it on ImageFX
を選択すると。
↑生成画像の一例が表示された。
裏返すと、プロンプト文章を確認することができる。
このまま、
- Sign in with Google
でログインすると、Image FXを始めることができた。
今のところ、無料で生成できるみたいなので、早速↓
ImageFXによる生成AIの始め方
引用…https://aitestkitchen.withgoogle.com/ja/tools/image-fx
↑左側にプロンプト入力箇所があるので、適当に文章を入力しよう。
例が英語なので、英語で試していこう。
プロンプトは、
- 渋谷ハチ公前を歩いている黄色い猫
これをGPTに画像生成AI用の文章に書き換えさせると↓
A yellow cat walking in front of the Hachiko statue in Shibuya, Tokyo. The scene captures the bustling atmosphere of Shibuya with people walking by, tall buildings, and neon signs in the background. The cat is prominently in the foreground, with a curious expression, standing on the sidewalk. The iconic Hachiko statue is visible in the background, surrounded by people taking photos and the typical city scenery of Shibuya
じゃん。
おぉー、速いね。
プロンプトの文言から、自動的に強度? を抽出し、濃淡で分類し始めた。
その後、右側に生成画像が3枚表示され。
なかなか、現実チックな絵だね。
写真に近いようなテイストか。
ImageFXの生成画像とChatGPTのDALL-Eとの比較
全く同じプロンプトで、ChatGPTのDALL-Eで生成した場合は↓
↑少しアニメ風になるのと、背景がぼやけてしまうのよね。
比較してみると、ImageFXの解像度が高いことに驚きだ。
実際の現実と合っているかは別として。
ちなみに、あまり渋谷に行ったことが無いので、背景との配置関係などが全く分からない。(笑
似ていたら、コメントしてくれ。
次に、もう少し、意地悪なプロンプトにしてみよう。
- 市原市の小湊鉄道の上を黄色い猫がスーパーマンで飛んでいる。
A yellow cat flying like Superman above the Kominato Railway in Ichihara City. The scene captures the rural landscape of Ichihara with the train running along the tracks below. The cat is soaring through the sky with a heroic pose, its cape fluttering in the wind. The traditional Japanese countryside, with green fields and small houses, provides a serene background, contrasting with the dynamic and playful image of the flying cat
んんー、やはり難しいか。w
小湊鉄道は、市原市のマイナーな電車で、車両の上が黄色で、下が赤色なんよね。
残念ながら、再現は悪く。
田んぼの風景の感じは似ているものの。
ちなみに、ChatGPTでは↓
ありゃ?
コンテンツポリシーに違反するとのことで。
んんー、この辺のAIによる線引きの感覚が分からんわ。(笑
実際に生成した画像を使用する場合は、一度、生成画像を検索にかけて確認した方が良いね。
総じて、ImageFXは写真のような画像生成に向いていることが分かり。
プロンプトを極めれば、もっと現実に寄せることができそうだ…
おわりに
以上「ImageFXの生成画像をChatGPTと比較してみた」でした。
Googleの生成画像レベルも高いですね。さすがのGoogleです。
元となるデータ自体の情報量は、Googleに分がありそうで。
今後の動向に注目していければ。
それでは、また。