米OpenAIは9月30日(現地時間)、最新の動画・音声生成モデル「Sora 2」を発表しました。従来の動画生成AIを大きく進化させたモデルで、新たに公開されたiOSアプリ「Sora」を通じて利用できます。
Sora 2は従来よりもリアルで物理的に正確な映像を生み出すことができ、複雑な指示にも応えられるのが特徴です。セリフや効果音の合成に加え、人や動物を映像の中に登場させる“カメオ”機能も備えています。
■ 「動画におけるGPT-3.5の瞬間」──複雑な動作も再現可能に
Soraシリーズは2024年に初登場し、テキストから自然に動画を生成できる試みとして注目を集めました。今回のSora 2はその進化版で、同社は「動画におけるGPT-3.5の瞬間」と位置づけています。
これまでのモデルでは難しかった体操の演技や氷上でのトリプルアクセルなども、現実に近い動作で再現できるようになったといいます。
■ “カメオ機能”で自分や友人を映像に登場させることが可能
そして注目されるのが、「カメオ機能」。短い映像と音声を一度記録することで“カメオ出演”としてSoraの世界に登場させることが可能となっています。
この機能について、社内テストでは「カメオを通じて新しい友達ができた」という声もあり、新しいコミュニケーションの形として期待されています。
■ 依存や安全性への懸念に配慮した設計
また、アプリ設計では依存や使いすぎへの懸念にも配慮し、フィードは自分で調整できる仕組みを採用。定期的にユーザーに心身の状態を確認し、フィードの調整を促す仕組みも組み込まれています。
未成年向けには閲覧制限やカメオ機能の制約を設け、保護者が利用環境を管理できるペアレンタルコントロールも備えています。
こうした自動化された安全対策に加えて、人間のモデレーターによるチームを拡充し、いじめなどの問題が発生した場合は迅速に対応できる体制を整えているそうです。
■ まずは米国・カナダで提供開始、順次拡大予定
アプリは招待制で提供されています。iOSアプリ「Sora」をダウンロードし、アプリ内で通知登録すれば、アクセスが解放されたときにプッシュ通知を受け取れる仕組みです。
サービスはまず米国とカナダで提供が始まり、今後は順次拡大予定。当面は無料で利用でき、ChatGPT Proユーザー向けには高品質版「Sora 2 Pro」も用意されます。
OpenAIは「Sora が世界に多くの喜び、創造性、つながりをもたらすと信じています」とコメントしています。
<参考・引用>
OpenAI「Sora 2 is here」