グーグルの動画生成AI「Veo3」を使ってみたら、クオリティの高さに驚いてとても感動したのですが、そういえばOpenAIの「sora」を試していませんでした。
この記事ではグーグルの「Veo3」とOpenAIの「sora」に同じプロンプトを入力して、どういった動画が生成できるのか、生成時間や質、使い勝手など徹底的に比較してみようと思います。
OpenAIのsoraとは?
DALL-E3の技術を基盤に開発され、2024年2月に初めて公開されました。現在はChatGPTPlusとProユーザー向けにリリースされています。
https://sora.chatgpt.com/onboarding
リリース時は、国内でも大変話題になりましたが、今現在有料プランユーザーのみが使えるので、活用している人は限定的かもしれません。
では、さっそくですがsoraを使ってみます。
soraの使い方
soraを使うにはChatGPTの有料ユーザーになる必要あり
https://sora.chatgpt.com/onboarding

上記URLにアクセスするとログインを求められるので、ChatGPTのPlusやProのアカウントでログインします。(有料のアカウントです)※すでにChatGPTにログインをしている場合は、サイドバーの「sora」から行けます。

はじめてsoraを使う場合は、生年月日を入力する画面が出るので入力します。

どんな名前で生成するのかを決めて、プロンプトを入力していく
すると、他の人の作品を背景に、プロンプト入力フォームが出るので、テキストを入力してきます。
フォーム下にサイズや解像度を選択できます。

https://gemini.google.com/app?pli=1
OpenAI sora | Google Veo3 | |
使用方法 | https://sora.chatgpt.com/onboarding ※要有料プラン |
https://gemini.google.com/app?pli=1 |
料金やプランによる制限 | ChatGPTの有料プラン(Plus(月額20ドル) Pro(月額200ドル))に加入している必要がある。
Plus(月20ドル)は最大50本の高速生成、解像度は最大720p、最大10秒まで。 利用回数は、動画の解像度や長さ、アスペクト比によって消費クレジットが |
Google AI Proプラン(月額2,900円)、Google AI Ultraプラン(月額36,000円)で使える |
最長時間 | 5秒~最長20秒(Plusは5秒まで) | 8秒 |
解像度 | 最大1080pまで(Plusユーザーは720pまで) | 720p |
アスペクト比 | ワイドスクリーン、縦型、横型、正方形(2:31、1:1、3:2、16:9、9:16) | 16:9 |
プリセット | 8種類 | なし(プロンプトで指示か) |
バリエーション | 1、2、4 | なし |
ダウンロード形式 | MP4、GIF形式 ※動画にはウォーターマークが入る |
MP4 |
アニメーション | ◎プロンプトで指示 | ◎プロンプトで指示 |
日本語対応 | ◎ | ◎ |
画像 | 同じ画面で画像も生成できる | チャット画面で生成 |
音声 | なし | あり |
透かし | Plusユーザーはあり(Proユーザーはなし) | なし |
今回は、3:2のアスペクト比、720pの解像度、5秒で以下のプロンプトで生成してみました。

柴犬が夜の街を寂しそうに歩き、飼い主を探す
生成が終わるとダッシュボードの「My media」メニューの中に入ります。
選択して、「バリエーションを見る」にすると、動画をつなげたり、カットしたりと編集も可能です。


soraの生成動画
生成速度:体感41秒(5秒の動画)
Veo3の生成動画
生成速度:1分20秒(8秒の動画)
soraなら縦型の動画も作れるのでユーチューブショートやTicktok向けの動画も作れる!しかし・・soraには音がない!のと透かしあり!
動画のアスペクト比を選べます。
- 16:9/YouTube
- 1:1/Instagram
- 9:16/Ticktok
と、プラットフォームに応じて使い分けることができます。
しかし、生成した動画には透かしが入り、AIで生成された動画であることが分かるようになっています。(Proプランなら透かしなし)
また、生成してみて気が付いたのですがsoraが生成するのは動画のみ。音声がありません。いわゆるミュートモードで生成するので、今回の動画ならば例えば「犬の息使い」や「歩く足音」などはありません。
したがって、バックグラウンドミュージックに動画だけ重ねるのならいいのですが、自然な動画という意味ではVeo3に一票です。
sora vs veo3まとめ比較まとめ
ChatGPTのsoraは、生成する前にアスペクト比や生成数を選べて、より自分好みの動画を作りやすいと感じました。表記が英語なので、使うのに少々苦戦しましたが、プロンプトは日本語にも対応。
ストーリー仕立てにもできるのと、簡単な動画編集機能もありとても便利。ただし、ダウンロードする際になぜか何度もエラーになってしまったり、無駄な時間も過ごす羽目に。ユーザーの多さが原因なのか、動きが鈍い点もストレスがありました。

veo3と比較して、柴犬のイメージも自然な感じがしましたが、動画が犬の後ろ側ばかりなのが気になりました(プロンプトで指示するべし)
Veo3を先に試したからかもしれませんが、やはり音がないのは致命的。音だけを生成して合成するには逆に技術が必要になるので、音が必要ならばVeo3ですね。一方、曲に重ねるなど動画自体の音声が不要な場合はsoraでもいいと思います。
今回、Veo3とsoraを比べてみて、ウォーターマークがつかず音声付きのVeo3の方が実用的、と感じました。とはいえ、どちらも有料なのでどのくらい動画生成に赴きを置くかによってメインAIを決めるのが良いのでは?と感じました。
コメント