「調べたいことがあるけれど、ネット上の情報を集約するのは大変」と感じたことはありませんか?
本記事では、OpenAIの新機能「ChatGPT Deep Research」が、複雑なリサーチ作業をいかに効率化し、信頼できる情報を得るための一助となるのかを解説します。
OpenAIが発表した新機能「Deep Research」とは
OpenAIは、既存のChatGPTに新たなAIエージェント「ChatGPT Deep Research」を追加しました。これは、金融や科学、政策、エンジニアリングなどの専門領域において、より詳細かつ正確なリサーチが必要な場面を想定して開発された機能です。
家電や家具といった高額な買い物の情報収集にも役立つとされ、単なる要約以上に多角的な情報ソースへのアプローチが可能になります。
深いリサーチが可能になる理由
「Deep Research」は、複数のWebサイトやユーザーがアップロードしたファイル、さらにはスプレッドシートなどを同時に横断して調査を行う設計になっています。これにより、欲しい情報だけでなく関連するデータにもアクセスし、より精度の高い分析レポートを作成できるようになるのが最大の特徴です。
利用方法と提供形態
現時点では、ChatGPT Proユーザーが1か月あたり100クエリの上限で利用可能となっており、今後はPlusやTeam、Enterprise向けにも順次拡大される予定です。
さらに、ProやPlusなどの有料ユーザー向けにはクエリの制限枠が今後大幅に拡大される見通しです。現時点では地域による制限があり、イギリスやスイス、欧州経済領域(EEA)などのユーザーに対する正式な公開時期は未定とされています。
Deep Research 使い方の流れ
- Webブラウザ版のChatGPTで「Deep Research」を選択
- 調べたい内容(クエリ)を入力し、必要に応じてファイルやスプレッドシートを添付
- 調査に5~30分ほどかかる場合があるため、完了通知を待つ
- テキスト形式で結果が返ってくる(将来的には画像やグラフの埋め込みにも対応予定)
(事例)ChatGPTが日本の企業で使われている割合
「ChatGPTが日本の企業で使われている割合をリサーチしてください」とリサーチをお願いしたところ、1~2回ぐらいの質疑応答があったうえで、リサーチをしてくれました。
o1 Proモデルでは動かなかったのですが、o3-mini-highモデルでDeep researchができました。
リサーチのタスクを開始すると、24の情報源からデータを収集して、調査してくれました。
精度向上のカギ「o3モデル」とは
OpenAIが新たに発表した「o3」と呼ばれる推論特化モデルを活用することで、深いリサーチの実行を可能にしています。o3モデルは、ブラウザでのウェブ検索やPythonを用いたデータ分析を頻繁に行う実務ベースのタスクを想定し、強化学習(Reinforcement Learning)によって鍛え上げられました。
これにより、ネット上の膨大なテキストだけでなく、画像やPDFの解析、さらにはユーザーがアップロードしたファイルの内容までもトータルに把握して、根拠となる情報を引用付きで提示できるようになっています。
「Humanity’s Last Exam」のテスト結果
OpenAIは「Humanity’s Last Exam」という非常に難度の高い専門分野テストでDeep Researchの精度を検証しました。
結果として26.6%の正解率をマークし、他社のモデルやOpenAI自身の過去モデルを大きく上回りました。ただし、数字自体はまだ「余裕の合格点」というわけではなく、今後の精度向上が期待されるところです。
Model | 正解率 (%) |
---|---|
GPT-4o | 3.3 |
Grok-2 | 3.8 |
Claude 3.5 Sonnet | 4.3 |
Gemini Thinking | 6.2 |
OpenAI o1 | 9.1 |
DeepSeek-R1* | 9.4 |
OpenAI o3-mini (medium)* | 10.5 |
OpenAI o3-mini (high)* | 13.0 |
OpenAI deep research** | 26.6 |
* テキストのみを扱うモデル
** ブラウジング+Pythonツールを使用
このデータからもわかるように、AIが自ら必要な情報を探索し、適切に引用しながら正確性を高めていくという「deep research」のアプローチは既存モデルにはない強みを発揮していると言えます。
GPT-4oとの違い
同じChatGPTシリーズのGPT-4oは、マルチモーダルかつリアルタイムな対話に優れたモデルです。
一方、「deep research」は時間をかけて綿密なリサーチを行い、各情報ソースを明確に引用しながらレポートをまとめる点で大きく異なります。複雑な背景知識や多面的な検証が必要な場合には「deep research」がより適しているといえるでしょう。
懸念点と今後の展望
AIの出力はしばしば「幻覚(ハルシネーション)」と呼ばれる誤りを含むことがあり、特に専門性の高い分野では誤情報が大きなリスクにつながります。OpenAIは、Deep Researchによる出力をすべて引用元付きで提供し、思考プロセスのサマリも提示することで信頼性を高めるとしていますが、それでも過度の信頼は禁物です。
また、ChatGPTの通常のウェブ検索機能でも誤答や曖昧な回答が少なくないため、ユーザー側の追加確認や検証は欠かせません。一方で、Googleが数か月前にほぼ同名のAIリサーチ機能を発表しており、今後はAIによる深いリサーチサービスの競争が激化する可能性があります。
ChatGPT Deep Research まとめ
複雑な情報を一度に整理し、信頼度の高いアウトプットを得るための「ChatGPT Deep Research」は、特定の業界や研究領域だけでなく、大型家電や車の購入などにも活用できる可能性があります。
今後のロールアウト拡大や機能強化、さらに画像やグラフなどの視覚的な要素の対応が進めば、これまで膨大な時間を要してきたリサーチプロセスに変革をもたらしそうです。とはいえAIの特性上、最終的な判断や検証は人間の知見が欠かせません。今はまだ発展途上の段階にあるからこそ、慎重かつ賢明に活用する姿勢が求められています。