意外にもOpenAIのOperatorは後れを取る展開に
「ホテルの予約、どこのサイトを見ればいいんだろう…」
「商品の価格比較に何時間も使ってしまった」
こんな経験をお持ちの方は多いのではないでしょうか。ウェブ上での情報収集や予約作業は、ビジネスパーソンの貴重な時間を奪う大きな要因となっています。
そんな中、これらの作業を自動化する「ブラウザ操作型AIエージェント」が続々と登場し、注目を集めています。業界大手OpenAIの「Operator」は月額200ドル(約3万円)という高額な料金設定ですが、実は英国のスタートアップConvergenceが提供する月額20ドル(約3,000円)の「Proxy」の方が優れたパフォーマンスを見せているのです。この意外な展開から、AIツール選定の新たな判断基準が見えてきました。
月額20ドルのAIが月額200ドルのOpenAIを上回る衝撃

現在、ブラウザ操作型AIエージェントの主要プレイヤーは以下の通りです:
- OpenAI「Operator」:ChatGPT Pro向け(月額200ドル)
- Convergence「Proxy」:無料版(1日5回まで)と有料版(月額20ドル)
- Google「Project Mariner」:プレビューテスト中
- Anthropic「Computer Use」:アップデート予定
- Microsoft「OmniParser V2」:オープンソース
- ByteDance「UI-TARS」:開発者向け
- Browser-Use:カスタマイズ可能な開発者向けツール
実際のテストでは、以下のような興味深い結果が得られました:
レストラン予約タスク
- Operator:
- 「ロマンティックなレストラン」を探した後に予約可能時間を確認。空きがない場合、代替案を提示できず。
- Proxy:
- OpenTableで「ロマンティック」と「予約可能時間」を同時に検索。より高評価のレストランも提案。
【商品価格検索タスク】
- Operator:
- YubiKey 5C NFCの価格をAmazonで検索するのに手間取る
- Proxy:
- 迅速に該当商品を特定し、価格情報を提示
ニュースサイト分析タスク
- Operator:
- 「most popular」セクションを無限にスクロール。古い記事を誤って選択。
- Proxy:
- トップページの主要記事を効率的に抽出・要約。
この性能差の秘密は、Proxyが採用している「Generative Tree Search」という技術にあります。これは、ウェブ上での行動結果を予測し、最適な選択肢を見つけ出す独自のAIモデルです。643の実世界タスクによるベンチマークテストでも、Proxy(88%)がOperator(87%)をわずかに上回っています。
企業での活用方法と課題
企業での活用については、以下のような可能性が期待されています:
- バーチャルアシスタント業務の自動化
- RPAツールとの連携による業務効率化
- Deep Researchなど他のAIツールと組み合わせた高度な調査業務
ただし、以下の課題も残されています:
- CAPTCHA対応(現状は人間による入力が必要)
- ログインが必要なサイトへのアクセス制限
- 一部サイトによる自動ブラウジングのブロック
2025年は、これらの課題解決と実用化が進むターニングポイントとなりそうです。特に企業では、具体的なユースケースに基づいた検証と導入が始まることが予想されます。