Google、最大4K対応の動画生成AI「Veo 2」を発表

OpenAIのSoraを凌駕する性能

2024年12月16日、GoogleのAI研究組織であるGoogle DeepMindは、最新の動画生成AIモデル「Veo 2」を発表しました。

このモデルは、前バージョンの「Veo」から大幅に進化し、最大4Kの高解像度で数分間の動画を生成する能力を備えています。

OpenAIのSoraと比べて、重力・慣性などの物理処理が比較にならないほど正確で、いくつかの比較ビデオが投稿されていますが、優劣は明らかです。

Veo 2の主な特徴:

  • 高解像度動画生成:
    • Veo 2は、最大4Kの解像度でリアルな動画を生成できます。これにより、従来のモデルで見られた解像度の制約が解消され、細部まで鮮明な映像を作成可能です。
  • 動画の長さの延長:
    • 前モデルでは約60秒の動画生成が限界でしたが、Veo 2では数分間の動画生成が可能となり、より長尺のコンテンツ制作に対応しています。
  • シネマトグラフィ対応:
    • 映画撮影で使用される「18mmレンズ」や「被写界深度」といった専門用語を理解し、背景のボケ感や特定のカメラアングルなど、シネマティックな表現を再現できます。
  • ハルシネーションの低減:
    • AI生成で問題となる不要な要素の混入(ハルシネーション)を抑制し、プロンプトに忠実な動画生成を実現しています。

利用方法と提供状況:

現在、Veo 2はGoogle Labsの動画作成ツール「VideoFX」やAI開発プラットフォーム「Vertex AI」で利用可能です。ただし、一般公開に先立ち、ウェイティングリストへの登録が必要となります。公式サイトからサインアップし、順番待ちリストに登録することで、利用開始の案内を受け取ることができます。

競合の動画生成モデルとの比較:

Veo 2は、他社の動画生成AIモデル、例えばOpenAIの「Sora Turbo」やKLINGAIの「Killing v1.5」と比較しても、総合的な品質やプロンプトの正確な追従度で高い評価を得ています。特に、物理現象のリアルさや動きの多いシーンに関する品質が際立っているとされています。

今後の展望

Googleは、Veo 2の性能向上に向けて継続的な研究開発を進めており、2025年にはYouTube Shortsなどでの展開も予定しています。また、生成コンテンツの安全性や知的財産権の保護、社会的影響への配慮も重視しており、生成動画には電子透かし(SynthID)が埋め込まれる仕組みを導入しています。

Veo 2の登場により、動画制作のプロセスがさらに効率化され、クリエイターや企業にとって新たな可能性が広がることが期待されます。今後のアップデートや新機能の追加にも注目が集まっています。

参考)Veo 2公式ページ

監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。

「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

高セキュリティと低コストを実現するローカルLLM

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶