OpenAI 再次突破 AI 研究领域,推出全新「Deep Research」功能,让 ChatGPT 具备独立执行多步骤网路调查的能力。这项技术能在短短数十分钟内,完成原本需耗费数小时的人工作业,堪称研究领域的一大革新。
Table of Contents
ToggleChatGPT 的最新「研究型 AI 代理」登场
「Deep Research」是 OpenAI 旗下的新型 AI 代理,它能够独立为使用者执行深入研究。你只需输入一个查询,ChatGPT 便会浏览、分析并综合数百个网路来源,产出详尽的研究报告,达到专业研究分析师的水准。
这项功能由即将推出的 OpenAI o3 模型支援,特别针对网页浏览与数据分析进行最佳化,让 AI 能够更精准地搜寻、理解、分析来自网路的庞大文本、图像及 PDF,并根据新发现的资讯即时调整搜寻方向。
迈向 AGI:AI 独立产生新知识的关键一步
OpenAI 表示,「Deep Research」不仅是提升 ChatGPT 研究能力的一环,更是朝向人工通用智慧 (AGI) 的重要进展。知识综合能力是创造新知识的基础,而这项技术的推出,代表 AI 已经开始具备自动生成科学研究的潜力。
为何打造 Deep Research?满足高端知识需求
这项新功能主要针对需要高精度研究的专业人士,如金融、科学、政策制定者和工程领域的从业人员,让他们能快速获取详尽且可靠的资讯。此外,对于精明的消费者而言,它也能提供个性化的购买建议,例如比较不同品牌的汽车、家电或家具。
「Deep Research」的每项输出都附有完整的引用来源和思路摘要,方便用户查证。它特别擅长发掘小众且不直观的资讯,省去使用者自行浏览大量网站的时间。
如何使用 Deep Research?
在 ChatGPT 内,选择 「Deep Research」模式,输入你的查询,例如「全球串流媒体市场竞争分析」或「最适合通勤的自行车推荐」。你还可以上传文件或试算表,以提供更多背景资讯。
当研究开始后,侧边栏会显示执行步骤与引用来源,整个过程约需 5 至 30 分钟。在此期间,你可以暂时离开或处理其他任务,待研究完成后会收到通知。最终输出会以报告的形式呈现,未来还将加入嵌入式图像、数据视觉化等分析内容,以提升资讯的清晰度与可读性。
相比一般的 GPT-4o,「Deep Research」更适用于需要深入探索、精准引证的专业研究,确保产出的不仅是快速摘要,而是可作为正式工作文件的完整分析报告。
Deep Research 的运作方式
该功能透过端对端强化学习 (Reinforcement Learning) 训练,专注于高难度的网页浏览与推理任务。它能规划并执行多步骤研究流程,在需要时回溯修正,确保资讯完整。
核心功能包含:
- 浏览使用者上传的档案
- 透过 Python 工具绘制图表并反复调整
- 内嵌来自网站的图片与生成的图表
- 直接引用来源,确保资讯可信度
AI 研究能力的全新标竿:Deep Research 表现超越前代模型
人类最后测试(Humanity’s Last Exam)
在涵盖 100 多个领域(如语言学、火箭科学、生态学)的专家级考题中,「Deep Research」模型创下 26.6% 的准确率,显著超越 OpenAI o1,并在 化学、人文社会科学、数学 领域取得最大进步。GAIA 公开基准测试
在 GAIA(评估 AI 在现实问题中的表现)测试中,Deep Research 取得最佳成绩(SOTA),并登上外部排行榜榜首。该测试涵盖三种难度,考验 AI 的 推理、多模态理解、网页浏览与工具使用能力。专家级任务测试
内部评估显示,专业领域的专家认为「Deep Research」能自动完成 数小时的手动调查工作,显著提升研究效率。
局限性与改进方向
虽然「Deep Research」带来前所未有的能力,但仍存在一些限制,包括:
- 偶尔出现错误资讯或推理错误,但比现有 ChatGPT 模型发生频率低
- 辨别权威资讯的能力仍待提升,可能无法完全过滤谣言
- 信心校准能力有限,无法准确表达不确定性
- 格式与引用可能会有小瑕疵,且研究启动可能需要较长时间
随著使用量的增加,这些问题预计会持续改善。
谁可以使用 Deep Research?
目前,这项功能计算需求极高,因此优先提供给 ChatGPT Pro 用户,每月最多可查询 100 次。接下来,Plus 和 Team 用户 也将获得存取权,最终再向 企业版 开放。
此外,OpenAI 计划推出更快、更具成本效益的小型模型版本,确保所有付费用户都能享有更高的查询次数上限。
未来将让 AI 执行更多实际任务
「Deep Research」目前已在 ChatGPT 网页版上线,预计一个月内推出行动版与桌面应用程式。目前它能存取开放网页与上传文件,未来将扩展至 付费订阅内容与内部数据库,使研究结果更加深入与个人化。
更长远来看,OpenAI 计划将「Deep Research」与 「Operator」(可执行现实世界任务的 AI 代理)结合,实现更强大的 AI 代理体验,让 ChatGPT 不仅能执行 线上研究,更能代替用户完成 实际操作,为未来的 AI 自动化应用奠定基础。
风险提示
加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。
文章声明:以上内容(如有图片或视频亦包括在内)除非注明,否则均为谈天说币原创文章,转载或复制请以超链接形式并注明出处。