ディープフェイク技術?1枚の写真でここまで!?OmniHumanの実力

AI活用ブログ
AI活用ブログ

あなたがもし「たった1枚の写真と音声データで、高品質な人間動画を自在に生成できる」と聞いたら信じられるでしょうか? 本記事では、そんな意外性と驚きに満ちた最新技術「OmniHuman」を分かりやすく解説します。

OmniHumanとは?

OmniHumanは、ByteDanceの研究チームによって開発されたワンステージ型の条件付きヒューマンアニメーションモデルです。

たった1枚の人間画像に音声や映像、あるいはその両方を組み合わせることで、非常に自然なモーションと質感を持つヒト動画を生成します。参考までに、こちらのアインシュタインの動画をご覧ください。

この動画は、OmniHumanによって作られたものです。わずかな入力情報(特に音声のみの場合など)からでも、驚くほどリアルな動きを再現できます。

特徴1:あらゆる画角・体型に対応

OmniHumanは、縦長・横長などのアスペクト比の違いや、全身・半身・バストアップといった多様な構図でも自然な結果を生み出します。照明や質感など、細部にわたってリアルさを再現するのが大きな強みです。

特徴2:音声と映像の両方に対応

入力が音声だけの場合でも、人間のジェスチャーや口パクをかなり精巧に再現できます。さらに、参考となる動画の動きをなぞる「ビデオドライビング」にも対応しており、複数のモーション要素を同時に制御可能です。

特徴3:多彩なスタイルとモーション表現

OmniHumanはリアルな人間だけではなく、イラストやアニメキャラクター、動物などの多彩な被写体にも適用できます。各スタイルの特徴的な動きやデザインをキープしながら自然なモーションを生成できる点がユニークです。

使用例と可能性

  • 動画クリエイションの効率化:宣伝動画やプレゼン資料のキャラクターアニメーション作成が圧倒的にスピードアップ
  • エンターテインメント:ゲームやバーチャルYouTuberなどでの新しい表現手法
  • 教育・トレーニング:リモート授業や遠隔トレーニングにも応用可能

こうした広がりのあるアプリケーションは、映像制作やコミュニケーションのあり方を大きく変えるかもしれません。

OmniHumannに関する注意点・今後の展開

現在のところ、OmniHumanのサービスやダウンロードは一切提供されていません。インターネット上にある誤った情報やなりすましサイトには十分ご注意ください。

今後の進展については、公式からのアナウンスがあり次第、アップデートされる予定です。研究チームは、問い合わせや権利に関する懸念などにも迅速に対応しているとのことですので、興味のある方は注目しておくと良いでしょう。

OmniHuman:まとめ

OmniHumanの登場によって、「1枚の画像+音声」という最小限の条件から、本格的なヒト動画を生み出す未来がすぐそこまで来ています。

今後の研究開発が進めば、さらに品質が向上すると同時に、より広範な利用ケースが想定されるでしょう。映像表現のハードルが劇的に下がることで、新しいクリエイターやサービスが生まれる可能性も期待されます。

参考)OmniHuman-lab公式ページ

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする

監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。

「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

Chat Icon
タイトルとURLをコピーしました