ChatGPTとSoraのどちらの画像生成を使えば良いのか
とみます(@20tomimasu)です。
Soraでも画像生成ができるので、
ChatGPTのDALL-Eでどちらを使うべきなのか。
おそらく、同じ仕様で生成しているとは思うのですが、微妙に出力が違うのよね。
悩ましい…
鎧を着た猫を描いて
今回の検証用プロンプトはこちら。
- 神殿の奥から、鎧を着た猫が手前に歩いている様子を描いて。西洋ゲームのような世界観で
最近の生成AIは、
適当に入力した文章でも、意図をくみ取って精度の高い画像を生成してくれる。
とりあえず、指示を投げておけば良いだろう。
ChatGPTとSoraで生成した違いを確認していこう。
ChatGPTとSoraの画像生成の違い
↑ChatGPTの4oでの出力がこちら。
うん、かなり良くできているね。
↑対して、Soraで画像生成した結果がこちら。
まあ、ほとんど同じだね。笑
強いていえば、
Soraの方が光の当て方がよく、見やすいかと。
この辺は、人の好みやね。
極論、どっちでもOKということだ。
んで、Soraは、動画生成に強みがあり。
生成した画像をそのまま(シームレスに)、動画にできるのが良いね。
その結果↓
途中で、アングルが変わってしまった。笑
奥から手前に歩くように、プロンプトを追加した方が良さそうだ。
といった感じに、前提が動画生成の場合、Soraの方が良いかな。
まとめておこう↓
SoraとDALL-Eの使い分け
項目 | Sora | DALL·E |
---|---|---|
出力形式 | 動画 | 静止画 |
特徴 | 動きのある映像 | 高精細な1枚絵 |
適した用途 | プロモーション動画、ショートフィルム、SNS映像 | アイキャッチ画像、イラスト、ポスター、SNS投稿 |
時間軸 | あり | なし |
ざっくり、
- 動かしたい!→ Sora。
- さらに細部を描き込みたい、他の構図で… → ChatGPTのDALL-E
で、良いかな。
結局、Sora用のプロンプトをChatGPTで作っているので、
- モニター1に、ChatGPTで、プロンプトや構図の相談
- モニター2に、Soraで、動画生成
といった感じに、2つを同時並行で進めると良いかも。
ChatGPTにSora用のプロンプトを書いてというと↓
A cinematic fantasy scene.
A majestic armored cat warrior walks slowly from the depths of an ancient temple toward the camera.
The cat is wearing detailed medieval European-style armor, shining under the soft golden light filtering through broken stained-glass windows.
The atmosphere is mysterious and epic, like a Western RPG game.
The camera smoothly tracks the cat from a low angle, emphasizing its confident stride and the intricate textures of its armor and fur.
Dust particles float in the sunbeams.
The background shows towering stone pillars and faded murals, adding depth and ancient grandeur to the scene.
The cat’s amber eyes are focused forward, giving a heroic and determined expression.
Use dramatic lighting and dynamic camera movement to enhance the sense of motion and immersion.
シネマティックでファンタジーなシーン。
鎧を着た威厳ある猫の戦士が、古代神殿の奥からカメラに向かってゆっくり歩いてくる。
細かく作り込まれた中世ヨーロッパ風の鎧が、壊れたステンドグラスから差し込む柔らかな黄金の光に輝く。
雰囲気はミステリアスで壮大、西洋のRPGゲームのよう。
カメラは低めのアングルで滑らかに猫を追い、鎧や毛並みの質感を強調。
光の中に埃が舞い、背景には巨大な石柱や色褪せた壁画があり、シーンに深みと古代の威厳を加える。
猫の琥珀色の目は前方をまっすぐ見据え、英雄的で決意に満ちた表情。
ドラマチックなライティングとダイナミックなカメラワークで臨場感を高める。
それをSoraに入力して…
↑うーん。笑
途中から、プロンプトの意図を読んで、出力しているね。
これは、時間で切り取ればいいだろう。
が、刀がフック付きみたいなのに変形してしまったね。笑
この辺は、まだ生成レベルが低いのかも。
Runwayを始め、他の動画生成を使った方がいいかな。
生成AIのアプデをしていければ。
おわりに
以上「ChatGPTとSoraのどちらの画像生成を使えば良いのか」でした。
とりあえず、ChatGPTの画像生成で十分かな。
その画像を動画生成用に転用することもできるので。
今後、Soraの動画生成レベルがもう一段階上がれば、Soraの選択肢が入ってくるのかと。
それでは、また。