【レビュー】Geminiで画像生成する方法｜使い方と生成結果（旧Bard）

Googleの対話型AIツール「Gemini（旧Bard）」。OpenAIの「ChatGPT」に遅れを取った感があり、ちょっと影の存在でもありましたが、リリースからどんどん機能が向上しています。

AIモデル「Gemini」を組み込んで、テキスト以外に動画や音声、写真なども学習するようになりました。画像生成モデルは「Imagen2」で、Bardを使って無料で画像を生成できるようになったとのこと。

ただし、今のところ英語でのプロンプトのみ対応とか。

そういえば「Gemini（旧Bard）」に久しぶりにアクセスしたらこのようなアナウンスが出ていました。

要はGoogleの持っている他のサービスからの連動や使用感が良くなったよ、ということらしいです。

Gemini（旧Bard）での画像生成を試してみた

では、さっそくGemini（旧Bard）で画像生成を試してみたいと思います。

「今は英語でだけだよ」と知ってはいつつも、少々の希望を持って、
まずは、日本語で依頼をしてみました。

AIカケル

夕暮れの中の高層ビルの風景、人々が行きかう様子の画像を生成して

GoogleBard

申し訳ありませんが、画像の作成はまだサポートされていないため、リクエストにお応えすることができません。

おおぅ、Nooooo!!!!!!!失敗。断られました。

そうですよね、英語でのプロンプトのみですからね。

したがって、最初の

AIカケル

夕暮れの中の高層ビルの風景、人々が行きかう様子の画像を生成して

をグーグル翻訳さんにお願いして、以下のようにしてみました。

AIカケル

Generate images of skyscrapers at dusk and people walking by.

生成成功です！！

生成には10秒ほどかかりましたが、それほどストレスには感じませんでした。

生成した画像は個別にダウンロードも可能ですが、若干イラストタッチの画像でした。
また、「日本の」と伝えていなかったため、生成された画像は海外風。マンハッタン風？（知らんけど）

ちなみに、Googleのレポートによると、Gemini（旧Bard）はGemini（旧Bard）が生成した画像と人間の作品を区別ができるように、AI生成画像のピクセルに透かしが埋め込まれているのだそう！

見た目には全くわかりませんが、有名画家の絵を描くように依頼すると、コピーにならないよう荒い画像が生成されたり、工夫がされているのだそうですし、特定の著名人の画像は生成を拒否されるそうです。

今現在は英語での生成になりますが、Gemini（旧Bard）はどんどん進化しているので、日本語を含む他の言語で利用がもっと便利になるのもそう先ではなさそうです。