ChatGPT DeepResearchのシステムカードとは?

AI活用ブログ
AI活用ブログ

人工知能による調査といえば、単純な検索や情報の要約のイメージが強いかもしれません。しかし、OpenAIの最新機能「ディープリサーチ」は、そんな常識を覆す可能性を秘めています。

この記事では、2025年2月に公開されたシステムカードの分析から、ディープリサーチの実力と安全対策について掘り下げます。

30分で1万6000語以上のレポートを自動生成し、科学論文をレビューする——そんな未来のような機能は、あなたの仕事や研究をどう変えるのか。同時に、プライバシーや誤情報リスクはどう管理されているのか。AI時代の情報収集について考える上で、避けて通れない最新動向をお伝えします。

今なら助成金活用で最大75%OFFと大変お得にご利用いただける、AI・ChatGPT活用研修サービスがご好評をいただいています。ご興味のある方は以下のリンクから、助成金の活用方法やサービス内容が分かる資料をダウンロードいただけます。

AI・ChatGPT活用研修サービスの紹介資料ダウンロードはこちら(無料)

システムカードとは?

システムカードは、AIシステムの内部動作や意思決定プロセスを説明するドキュメントです。ユーザーがAIの仕組みを理解し、信頼できるようにするために作られ、AIの構成要素やデータ使用、決定の根拠などを透明に示すことを目的としています。

ディープリサーチとは何か?

OpenAIが2025年2月26日に利用者を拡大したディープリサーチは、ChatGPTに統合されたAIエージェントで、ユーザーが指定したトピックについて詳細な調査を自動で行います。その特徴は、単なる検索エンジンとは一線を画す高度な機能にあります:

  • 5〜30分かけてウェブを自律的に閲覧
  • テキスト、画像、PDFを解釈・分析
  • Pythonコードをサンドボックス環境で実行
  • 引用付きのレポートを自動生成

これにより、科学文献レビューや財務報告書の分析といった、通常であれば時間のかかる作業を大幅に効率化できます。現在はChatGPT Proプラン(月額200ドル)向けに提供され、月120クエリまで利用可能で、2月26日からPlus、Team、Enterpriseユーザーにも拡大されました。

リサーチをしているChatGPT

気になる安全性:システムカードが明かすリスク対策

高度な自律性を持つAIツールであるがゆえに、ディープリサーチには様々なリスクが伴います。OpenAIのシステムカードでは、以下のリスク領域とその対策が詳細に記載されています。

プロンプトインジェクション対策

悪意のある指示によってAIの動作を操作する「プロンプトインジェクション」に対しては、特別な訓練が施されています。評価では、事前の対策では攻撃成功率が4.04%〜18.52%あったものの、追加対策後はほぼ0%にまで低下しました。

禁止コンテンツと幻覚への対応

違法・有害コンテンツについては、ブロックリスト、出力分類器、各種フィルター、そして人間による監視を組み合わせた対策が取られています。レッドチーム(脆弱性を見つけるための専門チーム)による評価では、59.2%のケースでGPT-4oより安全という結果が出ています。

また、AIの「幻覚」(実在しない情報の生成)については、検索結果への依存度を高め、情報源へのリンクを提供することで対策。「PersonQA」というベンチマークでは、幻覚率が0.13とGPT-4o(0.30)より良好な結果となっています。

プライバシー保護とコード実行の安全性

個人情報の保護については、専用の訓練と継続的な監視によって対応。評価指標では事後対策により0.96(事前は0.69)まで改善されています。

またPythonコードの実行については、インターネット接続のないサンドボックス環境で行われるため、セキュリティリスクが最小化されています。

意外な強み:複雑なタスクでの優れたパフォーマンス

興味深いのは、「Humanity’s Last Exam」というベンチマークでディープリサーチが26.6%というスコアを達成し、DeepSeekのR1(9.4%)やGPT-4o(3.3%)を大きく上回っている点です。これは複雑な多段階タスクでの優れた能力を示唆しています。

また、サイバーセキュリティ分野のCTF(Capture The Flag)コンテストのような問題では、ウェブブラウジングあり条件で、高校レベルで92%、プロフェッショナルレベルでも70%という高い成功率を達成しています。

残る課題:バイアスと権威ある情報源の区別

一方で、課題も残されています。特にバイアスについては、「BBQ」評価において曖昧な質問への精度が0.63(GPT-4oの0.97と比較して低い)というスコアが報告されています。

また、権威ある情報源と噂や不確かな情報の区別が難しいという課題も指摘されています。初期のフィードバックでは、文献レビューや複雑な研究タスクには有用である一方、情報の省略による誤情報リスクも懸念されています。

展望:研究と業務の未来を変えるか

システムカードの分析からは、ディープリサーチが特に科学者や研究者にとって強力なツールとなる可能性が見えてきます。文献調査の時間を大幅に短縮し、複数の情報源を横断的に分析できる能力は、研究プロセスを根本から変える可能性を秘めています。

同時に、情報の正確性や偏りについては継続的な改善が必要であり、OpenAIも「継続的な評価と改善」を約束しています。いずれにせよ、AIによる高度な調査機能は、私たちの情報収集や分析の方法を大きく変えることになりそうです。

参考)OpenAI DeepResearchのシステムカード

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする
監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。
「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

Chat Icon
タイトルとURLをコピーしました