Figure AIの新世代ロボット制御:Helixが示す未来の労働力

AI活用ブログ
AI活用ブログ

ロボットが人間の代わりに買い物や製造現場で活躍する日は来るのでしょうか。

この記事では、自然言語での指示や複数のロボット同士の協力を可能にし、労働力不足の解消や危険作業の削減を目指す技術Figure AIの「Helix」について紹介します。

今なら助成金活用で最大75%OFFと大変お得にご利用いただける、AI・ChatGPT活用研修サービスがご好評をいただいています。ご興味のある方は以下のリンクから、助成金の活用方法やサービス内容が分かる資料をダウンロードいただけます。

AI・ChatGPT活用研修サービスの紹介資料ダウンロードはこちら(無料)

Figure AIとHelixの背景

Figure AIは2022年にBrett Adcock氏によって創設された、アメリカのロボティクス企業です。AIを活用した人型ロボットの開発を専門としており、2022年に「Figure 01」、2024年8月には後継機種「Figure 02」を相次いで発表しました。これらのロボットは製造業や物流、倉庫、小売といった幅広い業種で深刻化している労働力不足を補うことを目標としています。

そうしたFigure AIのロボット制御技術を支える中核的存在が、Vision-Language-Action(VLA)モデルである「Helix」です。公式情報によれば、Helixを搭載したロボットは自然言語による指示で動作し、複数のロボット間協調や未知の物体の操作など、多岐にわたるタスクを単一のニューラルネットワークで実行できることが最大の特徴です。

Helixがもたらす革新ポイント

1. 全身の制御(35の自由度、200Hz)

Helixは手首や胴体、頭部、さらには指の一本一本まで合計35の自由度を制御し、200Hz(1秒間に200回)の速さで動作を調整します。

その結果、人間のような細かい手先の作業が可能となり、引き出しを開ける、冷蔵庫を使う、物体を正確にピックアップするといった動作を自然にこなします。

2. ロボット間の協力

2台のロボットが協力してタスクを実行できるのは、Helixが高いレベルで環境理解と言語理解を組み合わせているからです。

たとえば「この食料品を2台で一緒に運んで」という指示にもゼロショット(※)で対応し、事前に見たことのないアイテムでも協力して運搬・配置できるよう設計されています。

※ゼロショットとは、AIモデルが事前に学習していないタスクやデータに対しても推論を行う能力を指します。つまり、そのタスク専用に訓練されたことがなくても、既存の知識をもとに新しい問題に対応できるという特徴です。

3. 自然言語対応

「このリンゴを手に取ってください」といったシンプルな日本語や英語のコマンドで、多数の家庭用品を扱うことができます。

特定のタスクのための追加学習やパラメータ調整を必要としないため、さまざまな場面にスピーディに適応できるのがHelixの強みです。

4. 単一ネットワークによる柔軟性

従来は「モノをつかむ動作」と「ドアを開ける動作」などを別々のモデルで学習させるケースが多かったのに対し、Helixは全動作を単一のニューラルネットワークで学習しています。

この学習により、タスクごとにモデルを切り替える手間が省け、ロボット導入のハードルを下げることに成功しています。

Helixの技術的アーキテクチャ

System 2(S2):シーンと言語の理解

7B(70億)パラメータを持つVision Language Model (VLM) がS2にあたります。動作速度は7〜9Hzと比較的ゆっくりですが、ロボットが「今どこにいて」「何をすべきか」といった全体の戦略を考える“頭脳”のような役割を担います。

System 1(S1):高速な連続動作制御

80M(8千万)パラメータのトランスフォーマーで、200Hzという高速制御を行います。S2が考えた戦略を具体的な動作に落とし込み、リアルタイムにロボットの姿勢や手先の力加減などを調整する“瞬発力”の部分です。

このS2とS1はそれぞれ別のGPU上で動作しており、効率的かつ安定した制御ループを実現しています。

トレーニングデータと学習効率

Helixの学習には約500時間分のテレオペレーション(人間がリモート操作した)行動データが用いられました。VLM(S2)で自動的にラベル付けを行い、自然言語条件付きペアとして処理することで、高い学習効率を達成しています。

これは従来のVLAデータセットの5%未満の規模でありながら、全身制御や多ロボット協調まで可能にしている点が大きな特徴です。

実用化とパートナーシップ

HelixはFigure AIのロボット、とくに最新機種「Figure 02」に搭載され、商用利用にすぐ対応できる段階にあります。

2024年1月にはBMWとパートナーシップを結び、サウスカロライナ州の生産ラインでデータ収集と実用性の検証を実施。さらに2024年2月には、675百万ドルの大型資金調達を行い、企業価値は26億ドルに達しました。MicrosoftやNvidia、Amazon、Intelといった大手企業が投資家として名を連ねており、OpenAIとの協力もHelixの開発を加速させる要因となっています。

しかし、2025年2月、Figure AIの創設者兼CEOであるブレット・アドコック氏は、同社がOpenAIとの協力関係を終了し、完全に自社開発のAIモデルを採用する決定を下したと発表しました。

2024年12月には、Figure 02が初めて商用顧客に納入され、同社は創立からわずか31か月で収益を生む企業へと成長しました。RBR50イノベーションアワードを受賞するなど、ロボット業界からの注目度も急上昇しています。

今後の展望

2025年2月時点では、15億ドル規模の追加資金調達が検討されており、企業価値が395億ドルにまで跳ね上がる可能性があると報じられています。Helixを搭載した人型ロボットは、製造や物流にとどまらず、災害現場や介護・医療など多様な分野で活躍しうると期待されており、今後の技術アップデートや新たなパートナーシップにも目が離せません。

Figure AIの公式ウェブサイトでも、Helixチームへの参加を呼びかけており、「Embodied AIを数百万のロボットにスケールさせる」ことをビジョンに掲げています。新たな労働力の創出や危険作業の軽減といった社会課題の解決に直結する研究開発であるだけに、今後もさらなる飛躍が期待されるでしょう。

家庭内ロボットとしての普及を目論む、NEO Gammaについて知りたい方は以下をご覧ください。

Helixの可能性:まとめ

Helixは「自然言語理解」「ロボット間の協調」「全身制御」という3つの大きな柱で、ロボットの可能性を一気に広げる技術です。

単一ネットワークで多彩なタスクをこなせる柔軟性や、高速な動作制御を小さなデータセットで実現できる点など、業界をリードするイノベーションが詰まっています。労働力不足や危険作業の削減といった社会課題の解決策として、今後の発展に要注目といえるでしょう。

参考)公式YouTube動画

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする
監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。
「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

Chat Icon
タイトルとURLをコピーしました