Hugging Faceでウェイト公開
OpenAIの新モデル「o3」シリーズなど、パートナー企業の大型モデルが次々と発表される中、Microsoftは独自ブランドの小型モデルに注力している。その最新例が「Phi-4」だ。すでに一部で話題となっていたPhi-4について、MicrosoftがこのほどHugging Face上で公式のウェイトをMITライセンス付きで公開した。
Phi-4とは?
Phi-4は、Microsoftが2024年12月13日に発表した最新の小規模言語モデル(SLM)で、パラメータ数は140億です。Phi-4は、日本語を含む多言語に対応しており、Azure AI Foundryを通じて利用可能です。
Phi-4は、Microsoft Research License Agreement(MSRLA)の下で提供されていましたが、2025年1月からはMITライセンスで提供されるようになり、商用利用や改変、配布が可能となりました。これにより、研究者や開発者はPhi-4を活用して、さまざまなアプリケーションやサービスの開発に取り組むことができます。
小型モデル「Phi-4」が注目を集める理由
Phi-4は、わずか140億パラメータという比較的コンパクトな規模ながら、多くの大規模モデルに迫る高い推論能力を実現している。数学的推論やマルチタスク言語理解の分野で優れた性能を示し、特に以下の点で注目を浴びている。
- 数学系ベンチマーク(MATHやMGSMなど)で80%超をマーク
GoogleのGemini ProやGPT-4o-miniといった大規模モデルを上回る結果を示し、金融・エンジニアリング・科学分野など高度な算術・推論を要する場面で有用性が高いと評価される。 - コード生成を評価するHumanEvalで高スコア
関数のコード生成タスクでも高い精度を発揮し、AIを活用したプログラミング支援で有望なモデルとされる。 - 高品質かつ多彩なデータで学習
9.8兆トークンに及ぶ大規模コーパスには、公開文書のほか、数学やプログラミングの教材データ、学術書やQ&Aデータも含まれる。これにより、汎用性と専門性のバランスがとれたモデルに仕上がっている。
元々Phi-4は、2024年12月にMicrosoftのAzure AI Foundryで先行リリースされ、限定的な研究ライセンスの下で利用が可能だった。しかし高い性能が評判となり、「ウェイトを公開してほしい」という要望が強まっていた。
ウェイトの完全公開とMITライセンスの意義
AIモデルの真価は、その「ウェイト」──学習によって得られた数値パラメータ──が公開されるかどうかにかかっている。ウェイトが公開されることで、研究者や開発者はモデルを再調整(ファインチューニング)したり、新たな用途に適応させたりすることが容易になる。
今回のMITライセンスによる公開により、商用利用も含めた自由度の高い活用が実現した。たとえば企業が社内向けにカスタマイズしたり、独自のサービスとして再提供したりすることができる。
MicrosoftのAIプリンシパルリサーチエンジニアであるShital Shah氏もSNS(X)で次のようにコメントしている。
「Phi-4の正式なウェイトをHugging Faceで公開したことに対して、非常に大きな反響をいただいています。MITライセンスなので幅広い利用が可能です!」
これにより、より多くの研究者や開発者が省リソースで強力な推論ができるモデルを活用し、各種アプリケーションの実装スピードを高められると期待されている。
“小さくても高性能”の流れが加速か
近年、ChatGPTなど大規模モデルによる高度な自然言語処理が普及する一方、学習や推論にかかるコストの高騰が大きな課題となっている。Phi-4のように規模を抑えながらも強力な性能を発揮するモデルは、クラウドリソースの制約がある中小企業や研究機関にとって特に有益だ。
さらに、14億パラメータ規模から1000億パラメータ規模に及ぶ競合モデルの中でも、Phi-4は多方面のベンチマークで高スコアをマーク。大規模モデルに引けを取らない応答品質を狙うことで、“より軽く、より効率的”を志向するAI設計思想のトレンドを後押ししている。
セーフティとアライメントへの配慮
公開にあたりMicrosoftは、Phi-4に対してアライメント(モデルの安全性・公平性の確保)を徹底するためのプロセスを組み込んだと説明している。具体的には、監督付き微調整や直接的な嗜好最適化(DPO)などを行い、不適切な出力やバイアスの抑制に取り組んだ。
もっとも、実運用では開発者や企業側がアプリケーションに合わせて追加のフィルタリングを施すことが推奨されている。特に高リスク分野では、外部の認証済みデータやプロンプトガイドラインとの連携が望ましい。
AI業界へのインパクト
このPhi-4の公開は、OpenAIやGoogleといった大手プレイヤーがリードする大規模モデル偏重の流れに一石を投じる可能性がある。必要な計算資源を抑えつつ先端的な自然言語処理や推論ができることで、中規模の研究機関や企業にも高度なAI活用が手の届く選択肢となるからだ。
今後、Phi-4を活用したサービスや研究事例が増えることで、大規模モデルだけではない小型・高効率モデルの可能性がさらにクローズアップされていくとみられる。Microsoftによる公式ウェイト公開が起爆剤となり、オープンソース界隈を中心に新たなイノベーションの波が広がりそうだ。
参考)microsoft/phi-4 Hugging Face
Introducing Phi-4: Microsoft’s Newest Small Language Model Specializing in Complex Reasoning