日々AIも進化して、最近ではChatGPTの画像生成能力が格段にアップしている!などという話題もありますが、今まで試してきた限り「日本人」を生成したいのに、なんとなく海外の映画に出てきそうな偏った日本人像が生成されることも多かったAIの画像生成。
そういった背景もあって以前「“日本人の女性”をより自然に生成してくれる画像生成AIはどれだ?Firefly、Bing Image Creator、Canvaを比較してみた!」という検証もしてみたくらいです。
しかし、その後、見識者からいろんな話を聞き・・

日本人はCopilotに書かせるといいよ!

いやいや新しいAIも良かったよ。。
再度、日本人での画像生成で試してみます!
私が噂で「日本人を生成するのが得意」と噂で聞いたのは「Copilot(コパイロット)」と「ImageFX」と「ChatGPT」の3つ。早速試してみますね!
Copilot(コパイロット)
https://copilot.microsoft.com/chats/2WhfciS62pPofmHNHkHwK
「Copilot(コパイロット)」は、マイクロソフトが開発した人工知能(AI)アシスタントです。無料と有料(月額3,200円)があり、違いは生成する速度。無料プランでもマイクロソフトアカウントが必要になります。

ログインをするとフォームが出てくるので、こちらにプロンプトを依頼します。

日本人女性が日本のレストランで美味しそうにビールを飲んでいる画像を生成して

おぉ!美人な女性たちが生成されました。以前の『日本人女性がなぜか民族衣装』のようなことはないですね。しかし、指示の「飲んでいる」仕草ではありませんし、年齢を支持していないわりに日本人女性というだけで「若い女性」が生成されました。また、てっきり1名で生成されると思っていましたが、3名生成されてビックリ。プロンプトは具体的に細かく指示するのが大切、と思い知ります。
どの方も美人ですが、顔に個性がなく、ビールを持つ高さも同じ。面白味が少々足りない感じ。

3名描かれていますが、どの方も顔が似ています。女性3人に個性を出してください。
追加の指示をしてみました。

少し個性が出たでしょうか。ブラスの形もまちまちになりました。急にこっちを見るからビックリです(笑)。美しい女性ではありますが、皆さん同じような口の形、歯並び、メイク、なので、逆に不自然に見えるといえば見えますね。
イラストではどうでしょうか?

イラストにしてみてください。

あぁ・・イラストだとあからさまに着物になってしまいました💦
ただ、プロンプトをもっと細かく指示すれば、思い通りにいける余地がありそうです。
imageFX/Googleの画像生成AIツール
https://labs.google/fx/tools/image-fx
現在、無料で利用でき、Googleアカウントを持っていれば、誰でも使用可能。回数も無制限です。

グーグルアカウントでログインをしたらこのような画面になりました。

日本語で入れてみます。

日本人女性が日本のレストランで美味しそうにビールを飲んでいる画像を生成して
日本語でダメだったので・・

A Japanese woman is happily enjoying a beer at a restaurant in Japan.
日本語に翻訳して再度生成してみました。

お!一度に4枚生成されるのですね!どれもかなり自然な日本人女性です。
(ただし、よく見ると後ろのメニュー表など日本語が描かれていますが、宇宙語になっています)


気になったのはプロンプトを入力するフォーム下のボタンです。

35mm film? handmade?? 気になる単語が並んでいるので使ってみました。
「handmade」をクリックしたら、プロンプトに追加されました。なるほど「提案」ということですね。

「handmade」からサブメニュー「painted」にしたらイラスト風になりました。
どうやらフィルターのような役目のようです。

次にプロント上でイラストを描いてもらいました。

Generate an illustration of a Japanese woman enjoying a delicious beer at a Japanese restaurant.

イラストに、と指示をしたら、やはり着物を着ています。背景ののれんなども『日本語風』。イラストにすると古風な日本像になるのはなぜなのでしょう?
ChatGPT
2024年3月、画像生成機能がアップしたと話題になったChatGPT。特に「ジブリ風の画像」を作ってSNSでアップすることが流行しました。
今回、久しぶりにChatGPTの画面を開いたのですが、質問フォームの下の三点マークをクリックしたら「画像を作成する」というメニューがあったので、こちらから進めてみたいと思います。(pro版です)

選択しただけで質問フォームのところに「画像を生成する」と青文字で入りました。

先ほどと同じプロンプトを入れてみます。

日本人女性が日本のレストランで美味しそうにビールを飲んでいる画像を生成して
たまたまChatGPTの画像生成機能が話題になっていたからかもしれませんが、生成に一番時間がかかりました

お!いいですね!すごくいいです。「おいしそうに飲んでいる」をしっかり再現しています。
背景の日本語は正しくない感じですが、大きく不自然ともいえません。
女性のシミやシワ感も自然です。Copilotが生成した画像が合コン風・モデル風だとしたら、こちらは、しっぽり女性一人で近所の居酒屋で飲んでいる、という感じでしょうか。
次にイラストも依頼してみます。

イラストにしてみてください。

一度生成された画像から続けてイラスト化を依頼したためか、生成された画像をもとにイラスト化されました。したがって他のAIのように「日本人女性」と聞いて着物を着ているということはありませんでした。 画風は特に指定はしていません。
後ろのメニュー?の「寿司」はまだしも「酒司」と書かれているところが気になるところですが、全体的にとてもクオリティが高いです。


画像、イラストで比較してみました。画像化後の流れからイラスト化をお願いしたので構図が似ていますが、とても自然な仕上がりです。これなら、元々手元にある画像をアップしてイラスト化も安心して依頼できそう!
Copilot、ImageFX、ChatGPTの作品を並べてみる



今回、試したAIの結果を並べてみました。意外と個性がありますね。
プロンプトでは「ビールを美味しそうに飲んでいる」と指定しているので、一番忠実に再現しているのは、なんとChatGPTと言えます。比較してみると、Copilotのルッキズム感(笑)
AIは日々進化しており、断定はできないものの2025年4月の段階では、
ChatGPTの画像生成が日本人を自然に描けます!
コメント