XiaomiのオープンソースAI「MiMo-V2.5」がエージェントタスクで最高効率・低コストを実現

AI活用ブログ
AI活用ブログ

「MiMo-V2.5」がエージェントタスクで最高効率・低コストを実現

「AIエージェントの利用コストが予測不能で、プロジェクト予算が圧迫されている」――そんな悩みを抱える企業担当者の方は多いのではないでしょうか?実際、GitHub Copilotが2026年4月から従量課金制に移行するなど、主要AIサービスの料金体系が大きく変化しています。このような中、Xiaomiが発表したオープンソースAIモデル「MiMo-V2.5」シリーズが、エージェントタスクにおいて最高効率と圧倒的低コストを両立させると注目を集めています。


最近「社外に出せないデータで生成AIを使いたい」という相談をいただきます。ChatGPTの利用は社内で禁止されているそうです。セキュリティやコスト面が気になる企業には、社内のローカル環境で動かせる仕組みがあることはご存知ですか?
OpenAIのオープンなAIモデル「gpt-oss」も利用いただけます。

Xiaomi MiMo-V2.5の特徴とオープンソースライセンス

Xiaomiはスマートフォンや電気自動車で知られる中国企業ですが、近年は高性能で低コストなオープンソースAI大規模言語モデルの提供にも力を入れています。今回発表されたMiMo-V2.5とMiMo-V2.5-Proは、企業に優しいMITライセンスの下で提供されており、商用アプリケーションでの利用が可能です。

Xiaomi MiMo-V2.5の特徴とオープンソースライセンス
Xiaomi MiMo-V2.5の特徴とオープンソースライセンス

MITライセンスは最も寛容なオープンソースライセンスの一つで、企業にとって以下のようなメリットがあります:

  • 承認不要での商用利用が可能
  • 独自データでの継続学習や fine-tuning が自由
  • 収益上限やユーザー数制限がない

企業や開発者はHugging Faceから直接モデルをダウンロードし、必要に応じて修正して、オンプレミスまたは仮想プライベートクラウドで実行できます。

エージェントタスクでの圧倒的効率性と性能比較

MiMo-V2.5シリーズの最大の特徴は、エージェントタスクにおける抜群の効率性です。Xiaomiが公開したClawEvalベンチマークによると、MiMo-V2.5-Proはオープンソースモデルの中で最高の63.8%の成功率を達成しながら、1トラジェクトリーあたり約70,000トークンしか消費しません。

エージェントタスクでの圧倒的効率性と性能比較
エージェントタスクでの圧倒的効率性と性能比較

これは、Anthropic Claude Opus 4.6、Google Gemini 3.1 Pro、OpenAI GPT-5.4と同等の結果を得るために必要なトークン数よりも40-60%少ない消費量です。特にエージェントタスクにおいて、トークン使用量の削減は利用コストの直接的な削減につながります。

主要モデルとのトークン効率比較

  • MiMo-V2.5-Pro: 70,000トークン/トラジェクトリー
  • Claude Opus 4.6: 約116,000-175,000トークン
  • GPT-5.4: 約116,000-175,000トークン
  • Gemini 3.1 Pro: 約116,000-175,000トークン

Pro版の高度なソフトウェア開発能力と実績

MiMo-V2.5-Proは「長期的な一貫性」と複雑なソフトウェアエンジニアリングに特化して設計されています。GDPVal-AA(Elo)ベンチマークでは1581ポイントを達成し、Kimi K2.6やGLM 5.1などの競合を上回りました。

Pro版の高度なソフトウェア開発能力と実績
Pro版の高度なソフトウェア開発能力と実績

実際の高度なタスク実行例として、以下のような実績があります:

RustでのSysYコンパイラ実装

4.3時間でレキサー、パーサー、RISC-Vアセンブリバックエンドを含む完全なコンパイラをゼロから実装。672のツール呼び出しを経て、隠されたテストスイートで233/233の完璧なスコアを達成しました。これは通常、コンピューターサイエンス専攻の学生が数週間かかるタスクです。

フル機能ビデオエディタの開発

11.5時間と1,868回のツール呼び出しをかけて、マルチトラックタイムラインとエクスポートパイプラインを備えた8,192行のデスクトップアプリケーションを作成しました。

アナログEDA最適化

大学院レベルのエンジニアリングタスクとして、TSMC 180nmプロセスでのFlipped-Voltage-Follower(FVF-LDO)レギュレータを最適化。ngspiceシミュレーションループを通じて、初期試行からラインレギュレーションなどのメトリクスを22倍改善しました。

競争力ある価格設定と利用料金体系

Xiaomiは国内外の市場に向けて競争力のある価格設定を提供しています。海外開発者向けの高性能MiMo-V2.5-Proは、標準コンテキストウィンドウ(最大256Kトークン)で入力100万トークンあたり1.00ドル、出力100万トークンあたり3.00ドルです。

256Kから1Mトークンの超長コンテキストタスクでは、入力が2.00ドル、出力が6.00ドルになりますが、アーキテクチャのキャッシュ機能により、キャッシュヒット時には入力コストが100万トークンあたり0.20〜0.40ドルに大幅に削減されます。

主要AIモデル利用料金比較(100万トークンあたり)

  • MiMo-V2.5: $0.40(入力) + $2.00(出力) = $2.40
  • Grok 4.1 Fast: $0.20 + $0.50 = $0.70
  • MiniMax M2.7: $0.30 + $1.20 = $1.50
  • Gemini 3 Flash: $0.50 + $3.00 = $3.50
  • Claude Opus 4.7: $5.00 + $25.00 = $30.00
  • GPT-5.5: $5.00 + $30.00 = $35.00

MoEアーキテクチャとモデル設計の技術的特長

MiMo-V2.5の核心には、Sparse Mixture-of-Experts(MoE)アーキテクチャがあります。このモデルは合計310億のパラメータを誇りますが、推論サイクル中に「アクティブ」になるのは150億パラメータのみです。

一方、V2.5-Proは1.02兆パラメータのMixture-of-Expertsモデルで、420億のアクティブパラメータを持ちます。この設計は専門病院に例えることができ、特定の症例(クエリ)に必要な専門医(パラメータ)のみが呼び出される仕組みです。

V2.5の5段階トレーニングプロセス

  • テキスト事前トレーニング:48兆トークンでの大規模言語基盤構築
  • プロジェクターウォームアップ:社内音声・視覚エンコーダーと言語コアの調整
  • マルチモーダル事前トレーニング:高品質なクロスモーダルデータでの拡張
  • エージェント的事後トレーニング:コンテキストウィンドウを32Kから1Mトークンへ段階的に拡張
  • RLとMOPD:強化学習とマルチモーダル選好最適化による実世界推論・知覚の精密化

MITライセンスの商用利用メリットとエコシステム

XiaomiがMITライセンスを選択したことは、次世代AIエージェントの基盤インフラとしてMiMoを位置付ける戦略的な決定です。これにより、全世界の開発者コミュニティがこのモデルを公共インフラとして扱うことが促進されます。

エコシステムサポートも充実しており、SGLangとvLLMという2つの人気な高スループット推論エンジンがローンチ時点でV2.5シリーズをサポートしています。AWS、AMD、T-HEAD、Enflameとのハードウェアパートナーシップにより、クラウドベースのH100から国内中国アクセラレータまで、あらゆる環境で効率的に実行できます。

Xiaomi MiMoのプロジェクトリーダーであるFuli Luo氏はX(旧Twitter)で「モデルの価値はランキングだけでは測れません。解決する問題で測られるのです」と述べ、開発者コミュニティへの参加を呼びかけています。

MiMo-V2.5の登場は、オープンソースコミュニティの独立宣言とも言えるでしょう。マルチモーダルエージェント作業でClaude Sonnet 4.6に、ビデオ理解でGemini 3 Proに対抗できる性能を実証し、「クローズドドア」ラボとオープン研究の間のギャップが事実上閉じられたことを示しています。

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする
監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。
「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

タイトルとURLをコピーしました