ASI-EVOLVEがAI研究を自動化!データ・アーキテクチャ・アルゴリズムの最適化で人間を超える成果

AI活用ブログ
AI活用ブログ

「AIモデルの開発に、もうどれだけの時間と人材コストを費やしていますか?」

今回、SII-GAIR研究所が発表した新フレームワーク「ASI-EVOLVE」は、この課題を根本から変える可能性を秘めています。なんと、データ設計・アーキテクチャ・アルゴリズムの最適化を完全自律化し、人間のベースラインを18ポイントも上回る性能向上を達成したというから驚きです。

この記事でASI-EVOLVEについてわかりやすく解説していきます。



最近「社外に出せないデータで生成AIを使いたい」という相談をいただきます。ChatGPTの利用は社内で禁止されているそうです。セキュリティやコスト面が気になる企業には、社内のローカル環境で動かせる仕組みがあることはご存知ですか?
OpenAIのオープンなAIモデル「gpt-oss」も利用いただけます。

AI研究のボトルネックを打破するASI-EVOLVEとは

AI研究のボトルネックを打破するASI-EVOLVEとは
AI研究のボトルネックを打破するASI-EVOLVEとは

AI研究開発における最大の課題は、その反復プロセスに伴う莫大な人的コストです。従来のアプローチではデータキュレーション、モデル設計、アルゴリズム改良などの各段階で、熟練エンジニアの手作業が必要とされてきました。

しかし、今回紹介するSII-GAIR研究所が開発したASI-EVOLVEは、この「学習・設計・実験・分析」の全プロセスを自動化するエージェントシステムとして設計されました。ASI-EVOLVEなら、AI開発の3大基盤である「データ、アーキテクチャ、アルゴリズム」を横断的に最適化できます。

データ・設計の限界と自動化の必要性

現在のAI開発チームが探索できる設計空間は、理論的に可能な範囲のごく一部に過ぎません。なぜなら、大規模な実験を行うには以下のような制約があるからです。

  • 1回の実験にかかるGPU時間:数十〜数百時間
  • 人間の介入が必要な頻度:実験プロセス全体の70%以上
  • 獲得された知見の属人化:チームやプロジェクトを跨いだ知識共有が困難

これらの制約が、AIイノベーションの速度と規模を根本的に制限しています。とくにエンタープライズ環境では専任の研究チームを抱えられる組織が限られているため、多くの企業が最適化されていない標準AIモデルを運用せざるを得ない状況が続いていました。

ASI-EVOLVEの自律的研究プロセス詳細

ASI-EVOLVEは「知識の蓄積→仮説生成→実験→分析」の継続的なループを構築することで、人間の介入なしに研究プロセスを回します。その核心を支えるのが、以下の2つの主要コンポーネントです。

コグニションベース(知識基盤)

既存の文献から抽出したドメイン知識、ヒューリスティックス、既知の落とし穴などを事前に読み込むことで、探索プロセスを加速します。コグニションベースによって、最初のイテレーションから有望な方向性へと自律的に方向づけを行うことが可能になります。

アナライザー(分析モジュール)

実験から得られる多次元のフィードバック(トレーニングログ、ベンチマーク結果、効率トレースなど)を処理し、実践可能な洞察と因果分析に変換します。さらに、以下の補助モジュールがフレームワークを完成させています。

  • リサーチャーエージェント:過去の実験結果をレビューし、新しい仮説を生成
  • エンジニアコンポーネント:実際の実験を実行し、効率的なリソース配分を管理
  • データベース:コード、研究動機、生の結果、分析レポートを永続的に保存

実証実験で示された驚異的な性能向上

データ・設計の限界と自動化の必要性
データ・設計の限界と自動化の必要性

研究チームは、ASI-EVOLVEの性能を検証するために大規模な実証実験を実施しました。その結果は、まさに驚異的なものでした。

データキュレーションの最適化

大規模な事前学習コーパスに対してカテゴリー別クリーニング戦略を設計するタスクでは、ASI-EVOLVEはデータサンプルを検査し、HTMLアーティファクトやフォーマットの不一致といった品質問題を自律的に診断しました。

その結果、3Bパラメーターモデルにおいて、AIがキュレーションしたデータで訓練したモデルは、生データで訓練したモデルに比べて平均4ポイント近くスコアが向上しました。とくに知識集約型タスクでの向上が顕著で、MMLU(大規模マルチタスク言語理解)ベンチマークでは18ポイント以上の性能向上を記録しています。

ニューラルアーキテクチャ設計

1,773回の自律的な探索ラウンドを通じて、ASI-EVOLVEは105種類の新しい線形アテンションアーキテクチャを生成し、高効率な人間設計ベースラインであるDeltaNetを凌駕する成果を達成しました。

強化学習アルゴリズム設計

複雑な数学的推論ベンチマーク(AMC32、AIME24)において、競合するGRPOベースラインを上回る新しい最適化メカニズムを発見しました。とくに「予算制約付き動的半径」という手法を考案し、ノイズの多いデータでのトレーニングを効果的に安定化させることに成功しています。

エンタープライズAI開発への応用の可能性

ASI-EVOLVEの自律的研究プロセス詳細
ASI-EVOLVEの自律的研究プロセス詳細

エンタープライズ環境では、オープンソースモデルのプロプライエタリデータへのファインチューニングや、アーキテクチャ・アルゴリズムの小幅な変更など、既存システムの継続的な最適化が常に求められています。ASI-EVOLVEの真価は、こうした日常的な最適化タスクにこそ発揮されます。

このフレームワークでは、企業が独自のドメイン知識をコグニションレポジトリに統合し、自律ループが内部AIシステムに対して反復処理を行うことが可能です。これにより、以下のようなメリットが期待できます。

  • 手動エンジニアリングのオーバーヘッドを最大70%削減
  • 人間設計ベースラインを上回る性能を達成可能
  • 組織内の知識を系統的に保存・継承する基盤の構築

オープンソース化と今後の展望

研究チームは既にASI-EVOLVEのコードをオープンソースとして公開しており、開発者やプロダクトビルダーが基礎フレームワークを自由に利用できる環境を整えています。そのため、今後はより多くの組織がAI研究の自動化を実現できるようになるでしょう。今後の展望としては、以下のような発展が期待されています。

  • マルチモーダルAIシステムへの応用拡大
  • より複雑な科学発見タスクへの適用
  • 企業固有のワークフローへの統合深化

ASI-EVOLVE:まとめ

ASI-EVOLVEは、AIがAI自体を革新する「AI-for-AI」研究の新たな基準を確立しました。これにより、AI研究開発は人間中心の手動プロセスから、自律的な知性増幅システムへのパラダイムシフトを迎えることになるでしょう。

ローカルLLMならMicrocosm – マイクロコズム
自社データを漏らさない、ローカル環境で動く最先端の生成AIお困りですか ?✓ 生成AIで顧客データを活用したいがデータ漏洩は大丈夫?✓ 入力データは生成AIの学習に利用されるのでは?ローカルLLMとは?ローカルLLMに関して音声で理解したい…

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする
監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。
「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

タイトルとURLをコピーしました