Microsoft、小型AIモデル Phi-4 を完全オープンソース化

AI活用ブログ

2025.01.112025.03.11

AI活用ブログ

Local-LLM Microsoft Azure Phi

OpenAIの新モデル「o3」シリーズなど、パートナー企業の大型モデルが次々と発表される中、Microsoftは独自ブランドの小型モデルに注力しています。その最新例が「Phi-4」です。この記事では、すでに一部で話題となっていたPhi-4について、紹介しましょう。

目次

Hugging Faceでウェイト公開されたPhi-4とは？
1. 商用利用も可能
小型モデル「Phi-4」が注目を集める理由
ウェイトの完全公開とMITライセンスの意義
“小さくても高性能”の流れが加速
1. セーフティとアライメントへの配慮
まとめ：AI業界へのインパクト

Hugging Faceでウェイト公開されたPhi-4とは？

Phi-4は、Microsoftが2024年12月13日に発表した最新の小規模言語モデル（SLM）で、パラメータ数は140億です。

MicrosoftがこのほどHugging Face上で公式のウェイトをMITライセンス付きで公開しました。Phi-4は、日本語を含む多言語に対応しており、Azure AI Foundryを通じて利用可能です。

商用利用も可能

Phi-4は、Microsoft Research License Agreement（MSRLA）の下で提供されていましたが、2025年1月からはMITライセンスで提供されるようになり、商用利用や改変、配布が可能となりました。

今後、研究者や開発者はPhi-4を活用して、さまざまなアプリケーションやサービスの開発に取り組むことができます。

小型モデル「Phi-4」が注目を集める理由

Phi-4は、わずか140億パラメータという比較的コンパクトな規模ながら、多くの大規模モデルに迫る高い推論能力を実現しています。

数学的推論やマルチタスク言語理解の分野で優れた性能を示し、とくに以下の点で注目を浴びています。

数学系ベンチマーク（MATHやMGSMなど）で80％超をマーク
GoogleのGemini ProやGPT-4o-miniといった大規模モデルを上回る結果を示し、金融・エンジニアリング・科学分野など高度な算術・推論を要する場面で有用性が高いと評価される。
コード生成を評価するHumanEvalで高スコア
関数のコード生成タスクでも高い精度を発揮し、AIを活用したプログラミング支援で有望なモデルとされる。
高品質かつ多彩なデータで学習
9.8兆トークンに及ぶ大規模コーパスには、公開文書のほか、数学やプログラミングの教材データ、学術書やQ&Aデータも含まれる。これにより、汎用性と専門性のバランスがとれたモデルに仕上がっている。

元々Phi-4は、2024年12月にMicrosoftのAzure AI Foundryで先行リリースされ、限定的な研究ライセンスの下で利用が可能でした。

しかし高い性能が評判となり、「ウェイトを公開してほしい」という要望が強まっていました。

ウェイトの完全公開とMITライセンスの意義

AIモデルの真価は、その「ウェイト」──学習によって得られた数値パラメータ──が公開されるかどうかにかかっています。

ウェイトが公開されることで、研究者や開発者はモデルを再調整（ファインチューニング）したり、新たな用途に適応させたりすることが容易になります。

今回のMITライセンスによる公開により、商用利用も含めた自由度の高い活用が実現したと言えるでしょう。たとえば、企業が社内向けにカスタマイズしたり、独自のサービスとして再提供したりすることができます。

MicrosoftのAIプリンシパルリサーチエンジニアであるShital Shah氏もSNS（X）で次のようにコメントしている。

「Phi-4の正式なウェイトをHugging Faceで公開したことに対して、非常に大きな反響をいただいています。MITライセンスなので幅広い利用が可能です！」

これにより、より多くの研究者や開発者が省リソースで強力な推論ができるモデルを活用し、各種アプリケーションの実装スピードを高められると期待されています。

“小さくても高性能”の流れが加速

近年、ChatGPTなど大規模モデルによる高度な自然言語処理が普及する一方、学習や推論にかかるコストの高騰が大きな課題となっています。

Phi-4のように規模を抑えながらも強力な性能を発揮するモデルは、クラウドリソースの制約がある中小企業や研究機関にとって、とくに有益です。

さらに、14億パラメータ規模から1000億パラメータ規模に及ぶ競合モデルの中でも、Phi-4は多方面のベンチマークで高スコアをマークしています。大規模モデルに引けを取らない応答品質を狙うことで、“より軽く、より効率的”を志向するAI設計思想のトレンドを後押ししています。

セーフティとアライメントへの配慮

公開にあたりMicrosoftは、Phi-4に対してアライメント（モデルの安全性・公平性の確保）を徹底するためのプロセスを組み込んだと説明しています。

具体的には、監督付き微調整や直接的な嗜好最適化（DPO）などを行い、不適切な出力やバイアスの抑制に取り組みました。

もっとも、実運用では開発者や企業側がアプリケーションに合わせて追加のフィルタリングを施すことが推奨されています。とくに高リスク分野では、外部の認証済みデータやプロンプトガイドラインとの連携が望ましいです。

まとめ：AI業界へのインパクト

このPhi-4の公開は、OpenAIやGoogleといった大手プレイヤーがリードする大規模モデル偏重の流れに一石を投じる可能性があります。必要な計算資源を抑えつつ先端的な自然言語処理や推論ができることで、中規模の研究機関や企業にも高度なAI活用が手の届く選択肢となるからです。

今後、Phi-4を活用したサービスや研究事例が増えることで、大規模モデルだけではない小型・高効率モデルの可能性がさらにクローズアップされていくとみられます。Microsoftによる公式ウェイト公開が起爆剤となり、オープンソース界隈を中心に新たなイノベーションの波が広がりそうです。

参考）microsoft/phi-4　Hugging Face

Introducing Phi-4: Microsoft’s Newest Small Language Model Specializing in Complex Reasoning

ChatGPTやDeepSeek、GeminiなどAIについて何でも聞いてください

考え中…（5秒ほど） ...

タイトルとURLをコピーしました