Microsoft、小型AIモデル Phi-4 を完全オープンソース化

Hugging Faceでウェイト公開

OpenAIの新モデル「o3」シリーズなど、パートナー企業の大型モデルが次々と発表される中、Microsoftは独自ブランドの小型モデルに注力している。その最新例が「Phi-4」だ。すでに一部で話題となっていたPhi-4について、MicrosoftがこのほどHugging Face上で公式のウェイトをMITライセンス付きで公開した。

Phi-4とは?

Phi-4は、Microsoftが2024年12月13日に発表した最新の小規模言語モデル(SLM)で、パラメータ数は140億です。Phi-4は、日本語を含む多言語に対応しており、Azure AI Foundryを通じて利用可能です。

Phi-4は、Microsoft Research License Agreement(MSRLA)の下で提供されていましたが、2025年1月からはMITライセンスで提供されるようになり、商用利用や改変、配布が可能となりました。これにより、研究者や開発者はPhi-4を活用して、さまざまなアプリケーションやサービスの開発に取り組むことができます。

小型モデル「Phi-4」が注目を集める理由

Phi-4は、わずか140億パラメータという比較的コンパクトな規模ながら、多くの大規模モデルに迫る高い推論能力を実現している。数学的推論やマルチタスク言語理解の分野で優れた性能を示し、特に以下の点で注目を浴びている。

  • 数学系ベンチマーク(MATHやMGSMなど)で80%超をマーク
    GoogleのGemini ProやGPT-4o-miniといった大規模モデルを上回る結果を示し、金融・エンジニアリング・科学分野など高度な算術・推論を要する場面で有用性が高いと評価される。
  • コード生成を評価するHumanEvalで高スコア
    関数のコード生成タスクでも高い精度を発揮し、AIを活用したプログラミング支援で有望なモデルとされる。
  • 高品質かつ多彩なデータで学習
    9.8兆トークンに及ぶ大規模コーパスには、公開文書のほか、数学やプログラミングの教材データ、学術書やQ&Aデータも含まれる。これにより、汎用性と専門性のバランスがとれたモデルに仕上がっている。

元々Phi-4は、2024年12月にMicrosoftのAzure AI Foundryで先行リリースされ、限定的な研究ライセンスの下で利用が可能だった。しかし高い性能が評判となり、「ウェイトを公開してほしい」という要望が強まっていた。

ウェイトの完全公開とMITライセンスの意義

AIモデルの真価は、その「ウェイト」──学習によって得られた数値パラメータ──が公開されるかどうかにかかっている。ウェイトが公開されることで、研究者や開発者はモデルを再調整(ファインチューニング)したり、新たな用途に適応させたりすることが容易になる。

今回のMITライセンスによる公開により、商用利用も含めた自由度の高い活用が実現した。たとえば企業が社内向けにカスタマイズしたり、独自のサービスとして再提供したりすることができる。

MicrosoftのAIプリンシパルリサーチエンジニアであるShital Shah氏もSNS(X)で次のようにコメントしている。

「Phi-4の正式なウェイトをHugging Faceで公開したことに対して、非常に大きな反響をいただいています。MITライセンスなので幅広い利用が可能です!」

これにより、より多くの研究者や開発者が省リソースで強力な推論ができるモデルを活用し、各種アプリケーションの実装スピードを高められると期待されている。

“小さくても高性能”の流れが加速か

近年、ChatGPTなど大規模モデルによる高度な自然言語処理が普及する一方、学習や推論にかかるコストの高騰が大きな課題となっている。Phi-4のように規模を抑えながらも強力な性能を発揮するモデルは、クラウドリソースの制約がある中小企業や研究機関にとって特に有益だ。

さらに、14億パラメータ規模から1000億パラメータ規模に及ぶ競合モデルの中でも、Phi-4は多方面のベンチマークで高スコアをマーク。大規模モデルに引けを取らない応答品質を狙うことで、“より軽く、より効率的”を志向するAI設計思想のトレンドを後押ししている。

セーフティとアライメントへの配慮

公開にあたりMicrosoftは、Phi-4に対してアライメント(モデルの安全性・公平性の確保)を徹底するためのプロセスを組み込んだと説明している。具体的には、監督付き微調整や直接的な嗜好最適化(DPO)などを行い、不適切な出力やバイアスの抑制に取り組んだ。

もっとも、実運用では開発者や企業側がアプリケーションに合わせて追加のフィルタリングを施すことが推奨されている。特に高リスク分野では、外部の認証済みデータやプロンプトガイドラインとの連携が望ましい。

AI業界へのインパクト

このPhi-4の公開は、OpenAIやGoogleといった大手プレイヤーがリードする大規模モデル偏重の流れに一石を投じる可能性がある。必要な計算資源を抑えつつ先端的な自然言語処理や推論ができることで、中規模の研究機関や企業にも高度なAI活用が手の届く選択肢となるからだ。

今後、Phi-4を活用したサービスや研究事例が増えることで、大規模モデルだけではない小型・高効率モデルの可能性がさらにクローズアップされていくとみられる。Microsoftによる公式ウェイト公開が起爆剤となり、オープンソース界隈を中心に新たなイノベーションの波が広がりそうだ。

参考)microsoft/phi-4 Hugging Face

Introducing Phi-4: Microsoft’s Newest Small Language Model Specializing in Complex Reasoning

監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。

「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

高セキュリティと低コストを実現するローカルLLM

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶