AlibabaのQwen3.7-Plus:低価格でマルチモーダルAI、閉鎖APIで企業向け

AI活用ブログ
AI活用ブログ

導入前の問い

「最新のAIは高額で、導入に時間とコストがかかる」と聞くと、まるで未来のテクノロジーに対して敷居が高すぎると感じる方も多いのではないでしょうか。実際、2025年にAIサービスの平均月額利用料は約¥50,000を超え、企業規模に関わらず導入のハードルが高くなっています。しかし、Alibabaが発表したQwen3.7-Plusは、テキスト・画像・動画を統合したマルチモーダルAIを1Mトークンあたりわずか$0.4(入力)+$1.6(出力)で提供し、従来のQwen3.7-Maxを60%低価格に抑えています。こんな低価格で多機能を実現できるのは、単なる価格競争を超えたビジネスモデルの進化を示唆しています。

導入前の問い
導入前の問い

最近「社外に出せないデータで生成AIを使いたい」という相談をいただきます。ChatGPTの利用は社内で禁止されているそうです。セキュリティやコスト面が気になる企業には、社内のローカル環境で動かせる仕組みがあることはご存知ですか?
OpenAIのオープンなAIモデル「gpt-oss」も利用いただけます。

1. Qwen3.7-Plusとは?低価格でマルチモーダルAIを実現

Qwen3.7-Plusは、テキストだけでなく画像・動画も入力できるマルチモーダル大規模言語モデルです。従来のQwen3.7-Maxはテキスト専用であるのに対し、Qwen3.7-Plusは「画像認識」「動画解析」「UIスクリーンショット解析」など、企業が直面する実務に直結するタスクを一括で処理可能です。さらに、1Mトークンあたり$2.0の総コストで、同等の機能を持つ他社モデル(例:MiniMax-M3が$1.5、Gemini 3.1 Flash-Liteが$1.75)よりもわずかに低価格で提供されます。

1. Qwen3.7-Plusとは?低価格でマルチモーダルAIを実現
1. Qwen3.7-Plusとは?低価格でマルチモーダルAIを実現

料金体系は次の通りです。

  • 入力: $0.40 / 1Mトークン
  • 出力: $1.60 / 1Mトークン
  • 総コスト: $2.00 / 1Mトークン

この価格は、同じ処理量を持つ他社の大型モデル(GPT-5.4が$17.5、Claude Opus 4.8が$30.0)に比べて大幅に抑えられており、企業のAI導入コストを劇的に削減できる可能性があります。

2. マルチモーダル性能とベンチマーク結果

実際の評価では、Qwen3.7-Plusはマルチモーダルタスクで高いパフォーマンスを示しています。以下のベンチマークを参照ください。

2. マルチモーダル性能とベンチマーク結果
2. マルチモーダル性能とベンチマーク結果
  • Terminal Bench 2.0-Terminus: 70.3(DeepSeek-V4-Pro Max 67.9、Gemini-3.1 Pro 63.5を上回る)
  • ScreenSpot Pro: 79.0(GPT-5.4 67.4、Claude-Opus-4.6 49.5を大きく上回る)

これらのスコアは、ターミナル操作や画面解析といった実務に直結する領域で、従来のテキスト専用モデルをはるかに上回る性能を持つことを示しています。

3. 『preserve_thinking』で長期対話を継続する仕組み

AIエージェントが長期的にタスクを遂行する際に直面する最大の課題は「状態の消失」です。Qwen3.7-Plusは「preserve_thinking」パラメータを導入し、内部の推論ロジック(Chain-of-Thought)を次の対話に継承します。これにより、以下のようなメリットが得られます。

  • 複数ステップにわたるタスクで、前回の推論結果を再利用できる。
  • 計算リソースの節約:同じ推論を再度実行する必要がなくなる。
  • タスクの一貫性が向上し、エラー率が低減。

この機能は、テクノロジー業界全体で「Extended Thinking」や「Encrypted Reasoning Pass-Back」と同様の概念として認識されていますが、Alibaba独自の実装によってAPIレベルで簡単に利用できる点が特徴です。

4. エンタープライズでのコストメリットと導入シナリオ

エンタープライズ向けの導入メリットは、主に以下の3点に集約されます。

① 高頻度タスクのコスト削減

Qwen3.7-Plusは入力処理が$0.40/1M、出力が$1.60/1Mと設定されており、同じタスクを大規模言語モデルで処理する場合と比べて約60%のコスト削減が可能です。

② マルチモーダル機能でUI/UX自動化を実現

画像・動画解析を組み込めるため、UIテスト自動化、ビジュアル検索、動画要約など、従来は専門のツールが必要だった領域を1つのAPIで統合できます。

③ スケーラブルなAPI設計

OpenAI互換のエンドポイントを備えているため、既存のインフラにほぼ手間なく組み込むことができます。さらに、キャッシュ機能により頻繁に参照されるデータの読み込みコストを$0.04/1Mへと低減でき、長期にわたる自動化ワークフローでの実務コストをさらに削減します。

実際の導入シナリオとしては、以下が挙げられます。

  • 社内開発環境の自動テストフローに組み込み、UI変更時の回帰テストを高速化。
  • 動画監視システムでの異常検知・要約機能を追加し、監視チームの負荷を減らす。
  • 大量のレポート作成を画像付きで自動生成し、営業資料作成時間を短縮。

5. 閉鎖APIとオープンソースからの変化:ライセンスとコンプライアンス

Qwen3.7-Plusは、従来のオープンソースモデルとは異なり、閉鎖APIで提供されます。これに伴う主なリスクとメリットは次のとおりです。

  • メリット
    ① クラウドベースの管理により、ハードウェア投資や保守コストを削減。
    ② データの安全性が確保され、企業のセキュリティポリシーに合わせてAPIアクセスを制御可能。
  • リスク
    ① ローカルにモデルをデプロイできないため、データ主権を厳格に求める企業(例:医療・防衛)では利用制限が生じる可能性。
    ② API経由でのデータ送信が必要なため、通信費やレイテンシが増大。

オープンソースモデルのメリットとしては、ローカルでの実行・カスタマイズが可能であり、データ主権を完全に保つことができる点があります。しかし、クラウドベースの閉鎖APIは、即時に高性能を利用できるという利点が大きく、特にデータセンターの稼働コストを抑えたい企業にとって魅力的です。

総じて、Qwen3.7-Plusは「低価格・高性能・マルチモーダル」という三拍子が揃ったAIサービスであり、閉鎖APIであっても、企業のデータ戦略と導入コストを慎重に検討すれば、非常に有力な選択肢となるでしょう。

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする
監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。
「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

タイトルとURLをコピーしました