OpenAIのSoraを凌駕する性能
2024年12月16日、GoogleのAI研究組織であるGoogle DeepMindは、最新の動画生成AIモデル「Veo 2」を発表しました。
このモデルは、前バージョンの「Veo」から大幅に進化し、最大4Kの高解像度で数分間の動画を生成する能力を備えています。
OpenAIのSoraと比べて、重力・慣性などの物理処理が比較にならないほど正確で、いくつかの比較ビデオが投稿されていますが、優劣は明らかです。
Veo 2の主な特徴:
- 高解像度動画生成:
- Veo 2は、最大4Kの解像度でリアルな動画を生成できます。これにより、従来のモデルで見られた解像度の制約が解消され、細部まで鮮明な映像を作成可能です。
- 動画の長さの延長:
- 前モデルでは約60秒の動画生成が限界でしたが、Veo 2では数分間の動画生成が可能となり、より長尺のコンテンツ制作に対応しています。
- シネマトグラフィ対応:
- 映画撮影で使用される「18mmレンズ」や「被写界深度」といった専門用語を理解し、背景のボケ感や特定のカメラアングルなど、シネマティックな表現を再現できます。
- ハルシネーションの低減:
- AI生成で問題となる不要な要素の混入(ハルシネーション)を抑制し、プロンプトに忠実な動画生成を実現しています。
利用方法と提供状況:
現在、Veo 2はGoogle Labsの動画作成ツール「VideoFX」やAI開発プラットフォーム「Vertex AI」で利用可能です。ただし、一般公開に先立ち、ウェイティングリストへの登録が必要となります。公式サイトからサインアップし、順番待ちリストに登録することで、利用開始の案内を受け取ることができます。
競合の動画生成モデルとの比較:
Veo 2は、他社の動画生成AIモデル、例えばOpenAIの「Sora Turbo」やKLINGAIの「Killing v1.5」と比較しても、総合的な品質やプロンプトの正確な追従度で高い評価を得ています。特に、物理現象のリアルさや動きの多いシーンに関する品質が際立っているとされています。
今後の展望
Googleは、Veo 2の性能向上に向けて継続的な研究開発を進めており、2025年にはYouTube Shortsなどでの展開も予定しています。また、生成コンテンツの安全性や知的財産権の保護、社会的影響への配慮も重視しており、生成動画には電子透かし(SynthID)が埋め込まれる仕組みを導入しています。
Veo 2の登場により、動画制作のプロセスがさらに効率化され、クリエイターや企業にとって新たな可能性が広がることが期待されます。今後のアップデートや新機能の追加にも注目が集まっています。
参考)Veo 2公式ページ