XiaomiのオープンソースAI「MiMo-V2.5」がエージェントタスクで最高効率・低コストを実現

「MiMo-V2.5」がエージェントタスクで最高効率・低コストを実現

「AIエージェントの利用コストが予測不能で、プロジェクト予算が圧迫されている」――そんな悩みを抱える企業担当者の方は多いのではないでしょうか？実際、GitHub Copilotが2026年4月から従量課金制に移行するなど、主要AIサービスの料金体系が大きく変化しています。このような中、Xiaomiが発表したオープンソースAIモデル「MiMo-V2.5」シリーズが、エージェントタスクにおいて最高効率と圧倒的低コストを両立させると注目を集めています。

「MiMo-V2.5」がエージェントタスクで最高効率・低コストを実現

Xiaomi MiMo-V2.5の特徴とオープンソースライセンス
エージェントタスクでの圧倒的効率性と性能比較
1. 主要モデルとのトークン効率比較
Pro版の高度なソフトウェア開発能力と実績
競争力ある価格設定と利用料金体系
1. 主要AIモデル利用料金比較（100万トークンあたり）
MoEアーキテクチャとモデル設計の技術的特長
1. V2.5の5段階トレーニングプロセス
MITライセンスの商用利用メリットとエコシステム

Xiaomi MiMo-V2.5の特徴とオープンソースライセンス

Xiaomiはスマートフォンや電気自動車で知られる中国企業ですが、近年は高性能で低コストなオープンソースAI大規模言語モデルの提供にも力を入れています。今回発表されたMiMo-V2.5とMiMo-V2.5-Proは、企業に優しいMITライセンスの下で提供されており、商用アプリケーションでの利用が可能です。

MITライセンスは最も寛容なオープンソースライセンスの一つで、企業にとって以下のようなメリットがあります：

承認不要での商用利用が可能
独自データでの継続学習や fine-tuning が自由
収益上限やユーザー数制限がない

企業や開発者はHugging Faceから直接モデルをダウンロードし、必要に応じて修正して、オンプレミスまたは仮想プライベートクラウドで実行できます。

エージェントタスクでの圧倒的効率性と性能比較

MiMo-V2.5シリーズの最大の特徴は、エージェントタスクにおける抜群の効率性です。Xiaomiが公開したClawEvalベンチマークによると、MiMo-V2.5-Proはオープンソースモデルの中で最高の63.8%の成功率を達成しながら、1トラジェクトリーあたり約70,000トークンしか消費しません。

これは、Anthropic Claude Opus 4.6、Google Gemini 3.1 Pro、OpenAI GPT-5.4と同等の結果を得るために必要なトークン数よりも40-60%少ない消費量です。特にエージェントタスクにおいて、トークン使用量の削減は利用コストの直接的な削減につながります。

主要モデルとのトークン効率比較

MiMo-V2.5-Pro: 70,000トークン/トラジェクトリー
Claude Opus 4.6: 約116,000-175,000トークン
GPT-5.4: 約116,000-175,000トークン
Gemini 3.1 Pro: 約116,000-175,000トークン

Pro版の高度なソフトウェア開発能力と実績

MiMo-V2.5-Proは「長期的な一貫性」と複雑なソフトウェアエンジニアリングに特化して設計されています。GDPVal-AA（Elo）ベンチマークでは1581ポイントを達成し、Kimi K2.6やGLM 5.1などの競合を上回りました。

実際の高度なタスク実行例として、以下のような実績があります：

RustでのSysYコンパイラ実装

4.3時間でレキサー、パーサー、RISC-Vアセンブリバックエンドを含む完全なコンパイラをゼロから実装。672のツール呼び出しを経て、隠されたテストスイートで233/233の完璧なスコアを達成しました。これは通常、コンピューターサイエンス専攻の学生が数週間かかるタスクです。

フル機能ビデオエディタの開発

11.5時間と1,868回のツール呼び出しをかけて、マルチトラックタイムラインとエクスポートパイプラインを備えた8,192行のデスクトップアプリケーションを作成しました。

アナログEDA最適化

大学院レベルのエンジニアリングタスクとして、TSMC 180nmプロセスでのFlipped-Voltage-Follower（FVF-LDO）レギュレータを最適化。ngspiceシミュレーションループを通じて、初期試行からラインレギュレーションなどのメトリクスを22倍改善しました。

競争力ある価格設定と利用料金体系

Xiaomiは国内外の市場に向けて競争力のある価格設定を提供しています。海外開発者向けの高性能MiMo-V2.5-Proは、標準コンテキストウィンドウ（最大256Kトークン）で入力100万トークンあたり1.00ドル、出力100万トークンあたり3.00ドルです。

256Kから1Mトークンの超長コンテキストタスクでは、入力が2.00ドル、出力が6.00ドルになりますが、アーキテクチャのキャッシュ機能により、キャッシュヒット時には入力コストが100万トークンあたり0.20〜0.40ドルに大幅に削減されます。

主要AIモデル利用料金比較（100万トークンあたり）

MiMo-V2.5: $0.40（入力） + $2.00（出力） = $2.40
Grok 4.1 Fast: $0.20 + $0.50 = $0.70
MiniMax M2.7: $0.30 + $1.20 = $1.50
Gemini 3 Flash: $0.50 + $3.00 = $3.50
Claude Opus 4.7: $5.00 + $25.00 = $30.00
GPT-5.5: $5.00 + $30.00 = $35.00

MoEアーキテクチャとモデル設計の技術的特長

MiMo-V2.5の核心には、Sparse Mixture-of-Experts（MoE）アーキテクチャがあります。このモデルは合計310億のパラメータを誇りますが、推論サイクル中に「アクティブ」になるのは150億パラメータのみです。

一方、V2.5-Proは1.02兆パラメータのMixture-of-Expertsモデルで、420億のアクティブパラメータを持ちます。この設計は専門病院に例えることができ、特定の症例（クエリ）に必要な専門医（パラメータ）のみが呼び出される仕組みです。

V2.5の5段階トレーニングプロセス

テキスト事前トレーニング：48兆トークンでの大規模言語基盤構築
プロジェクターウォームアップ：社内音声・視覚エンコーダーと言語コアの調整
マルチモーダル事前トレーニング：高品質なクロスモーダルデータでの拡張
エージェント的事後トレーニング：コンテキストウィンドウを32Kから1Mトークンへ段階的に拡張
RLとMOPD：強化学習とマルチモーダル選好最適化による実世界推論・知覚の精密化

MITライセンスの商用利用メリットとエコシステム

XiaomiがMITライセンスを選択したことは、次世代AIエージェントの基盤インフラとしてMiMoを位置付ける戦略的な決定です。これにより、全世界の開発者コミュニティがこのモデルを公共インフラとして扱うことが促進されます。

エコシステムサポートも充実しており、SGLangとvLLMという2つの人気な高スループット推論エンジンがローンチ時点でV2.5シリーズをサポートしています。AWS、AMD、T-HEAD、Enflameとのハードウェアパートナーシップにより、クラウドベースのH100から国内中国アクセラレータまで、あらゆる環境で効率的に実行できます。

Xiaomi MiMoのプロジェクトリーダーであるFuli Luo氏はX（旧Twitter）で「モデルの価値はランキングだけでは測れません。解決する問題で測られるのです」と述べ、開発者コミュニティへの参加を呼びかけています。

MiMo-V2.5の登場は、オープンソースコミュニティの独立宣言とも言えるでしょう。マルチモーダルエージェント作業でClaude Sonnet 4.6に、ビデオ理解でGemini 3 Proに対抗できる性能を実証し、「クローズドドア」ラボとオープン研究の間のギャップが事実上閉じられたことを示しています。