Sora 2のまとめ

Sora 2について

Sora

Sora 2 – Sam Altman

OpenAI が開発した次世代の動画生成AI Sora 2 は、前世代と比べて飛躍的な進化を遂げ、世界中を驚かせている。

前世代「Sora」の課題

旧世代の Sora は完成度が低く、

  • 物理法則が無視された動きや描写が多い
  • プロンプトで指定していないシーンが突如挿入される
  • 意図と異なる動画が生成される

といった問題があり、実用性に乏しく大きな話題にはならなかった。

「Sora 2」の進化

新たに登場した Sora 2 は、これらの弱点を克服し、以下の点で大幅な改善を示した。

  • 物理法則を考慮した生成:絵や動きが破綻しにくく、自然な映像を構築できる。
  • プロンプトの忠実な反映:指定内容に沿った動画が生成され、意図しない場面が挿入されることがほとんどない。
  • 映像と音声の統合生成:映像に合わせて音楽や声も同時に生成され、違和感が少なく自然に仕上がる。

得意なこと

実写映像がとてもリアル

今みたものがAIで作られた動画とは、信じられませんね(Sora 2 AI)
A realistic Japanese news program studio scene. Two anchors, a woman and a man, sit side by side at the news desk. On the top of the screen, there is a news-style title graphic that says: “News Fake”. After finishing watching a video, the female announcer turns to the male announcer with a surprised expression and says in Japanese: 「今みたものがAIで作られた動画とは、信じられませんね」. The male announcer responds naturally in Japanese: 「いやぁ見分けが付きませんでした」. Then the female announcer smiles awkwardly and reveals in Japanese: 「でも私もAIで作られているんです」. Both laugh together lightly, in a natural way as if on a real news show. The atmosphere should feel authentic and professional, but with a subtle comedic twist.

報道、自撮り、ホームビデオと実写映像の方向性を決めるだけで、実際のAIで生成されていない映像と見分けるのが難しいレベルの動画が生成される。

簡単なCMレベルだと、もうカメラマンや俳優、スタジオは不要になるだろう。

構成を考える人間と、パソコンやスマートフォンのどちらか一つがあれば出来てしまう。

今はまだ解像度や時間の制約、細かな映像の破綻という問題を抱えているが、早ければ来年度中には解決してしまいそうな勢いの進化である。

ハイクォリティのアニメ映像

最新型ポータブルカセットテープのプロモーションビデオ Promotional video for the latest portable cassette tape(Sora 2 AI)
High-quality promotional animation of a girl listening to a portable cassette player. The atmosphere is cyber and futuristic, with rapid and intense scene transitions that emphasize rhythm and energy. The girl’s appearance must be based on the uploaded reference image (use the reference only for her look, not as a still frame at the beginning). The animation should start immediately with motion, not with a static image. The background alternates between neon-lit streets, glitch effects, electronic cityscapes, and abstract cyber motifs, all cut quickly to match the high-tech promotional style. The girl should appear immersed in the music, occasionally moving her head or tapping her foot, with close-ups of the cassette player’s buttons and spinning tape reels. The tone should feel like a stylish cyberpunk commercial with energetic editing. Portrait video, around 10 seconds.

じゃあアニメや3DCGが弱いかと言えば全く違う。

プロンプトで上手く指定してやれば、滑らかで高品質なアニメーションが生成しやすい。

苦手なこと

存在しない物体

(FAKE)永久機関をDIYした中国人

まず、データセットに存在しない題材は映像がチープになりやすい。

例えばエイリアンやスペースコロニーといった実在しないものを指定すると、作り込みが甘く、安っぽい印象を与える。

逆に、ありふれた様子の動画であれば少ない試行回数で非常に高品質な映像を得られる。

実際、先ほどの偽ニュース番組のような題材は、数回の試行で完成度の高い結果になった。

想定外の動き

現実の動きから大きく外れた指示も苦手である。

たとえばハムスターにダンスを踊らせるような、本来の生態や動きから逸脱した要求をすると、不自然で品質が低下する。

ただし最初から「アニメCG風」と指定しておくと、ピクサーの3DCGアニメのような映像が生成され、見栄えが良くなる。

動きの速いもの

マトリックスのような銃弾を避けたり、殺陣といった動きの早いものは想像通りにいかないことが多い。

日本語

ヤンキー女子高生ですが、恋も喧嘩も忙しいんです!(Sora 2 AI)

日本語で文章を読ませると、よく漢字が読めない。

これは平仮名で書くことで、対処可能だ。

ただテロップや字幕を表示させる場合、ぐちゃぐちゃの日本語が高頻度で登場するため、完全な動画を作るには多くの試行回数が求められる。

制約など

動画の規格

ポートレート(縦長)、ランドスケープ(横長)の二択で、正方形などのその他詳細なアスペクト比は選べない。

解像度はポートレートで704*1280。

長さは10秒で、フレームレートは30fps。

Proアカウントは15秒でも投稿可能(生成時間も延びるが)で、低解像度も選べるようになる。

生成制限

現時点ではPlusアカウントと無料アカウントは差別化されていない。

サービス開始時点では1日100本も生成出来たが、現在は過去24時間以内で30本まで。

30本を超えた時点で生成不可(警告メッセージが出る)となり、過去24時間以内に投稿した動画が30本を下回るまで、利用できなくなる。

Proは無制限みたい(未確認)?

画像の読み込みは一つまで

複数の画像を読み込むことは出来ないため、例えばキャラクター二人を読み込んで、会話させることは出来ない。

ただし片方を読み込んで、もう片方はプロンプトで指定すれば一応可能。

プロンプトで指定した方は一貫性を保つのが困難という欠点は抱えているが。

著名人や著作権で保護されているもの

政治家などの著名人、著作権で保護されているアニメのキャラクターを用いた動画は、生成が出来ない(サービス公開初期は出来ていた)。

またOpenAIのポリシーに引っ掛かるような暴力や性表現、薬物などの表現も生成時点で中断される。

使い道について

法に触れない範囲で好きに作れば良いと思うが、いくつかアイデアを。

架空のアニメOPやミュージックビデオ、プロモーションビデオ

Last Order(Sora 2 AI)

オリジナルキャラクターを作っても良いし、全てプロンプトに丸投げして作っても良い。

アニメOPなので、ほぼ確実にBGMが挿入されて、クオリティの高い物が出来やすく面白い。

タイトルや公開時期を入力しておくとリアリティが増す。

啓発系動画

今まさにショート動画を見ている貴方へ(Sora 2 AI)

啓発系動画もアイデアさえあれば簡単に作れる。

社会に対する啓発も、動画ならインパクトがある。

ネタ動画

(Fake)ビーム兵器のDIYしたアメリカ人 Americans who built their own beam weapons(Sora 2 AI)

完全にウケ狙いの動画も面白い。

よくある日本やアメリカの通信販売風も面白そうだし、世間一般でバズっている動画を参考にして作ると良さそうだ。

感想

延々と作りたくなるくらい面白い。

ただ生成上限の30個が結構少なめで、厳選するために試行回数を増やすと全く足りていない。

現在Plusアカウントだが、やはり支払っている分、生成の上限を緩和して欲しいとは思う。

次回

guest

0 Comments
最も古い
最新 高評価
インラインフィードバック
すべてのコメントを見る