OpenAI-的深度研究-人工智能驱动的文献综述的实际测试
OpenAI 的深度研究:人工智能驱动的文献综述的实际测试
原文:
towardsdatascience.com/deep-research-by-openai-a-practical-test-of-ai-powered-literature-review/
“对机器学习和能耗的最新进展进行全面的文献综述。 [...]”
使用这个提示,我测试了自 2 月底以来集成到 OpenAI o3 推理模型中的新深度研究功能,并在 6 分钟内完成了一项最先进的文献综述。
此功能超越了正常的网络搜索(例如,使用 ChatGPT 4o):研究查询被分解和结构化,互联网被搜索以获取信息,然后对这些信息进行评估,最后创建一个结构化、全面的报告。
让我们更深入地了解一下。
目录
OpenAI 的深度研究是什么?你可以用它做什么?
深度研究是如何工作的?
如何使用深度研究?——实际案例
深度研究功能的挑战和风险
最终思考
你可以在哪里继续学习?
1. OpenAI 的深度研究是什么?你可以用它做什么?
如果你拥有 OpenAI Plus 账户(每月 20 美元的计划),你可以访问深度研究。这为你每月提供 10 个查询。通过 Pro 订阅(每月 200 美元),你可以扩展对深度研究的访问,并获得 GPT-4.5 的研究预览,每月提供 120 个查询。
OpenAI承诺我们可以使用来自公共网络的数据进行多步骤研究。
持续时间:5 到 30 分钟,具体取决于复杂程度。
以前,此类研究通常需要数小时。
它旨在处理需要深度搜索和彻底性的复杂任务。
具体的用例是什么样的?
-
进行文献综述:对最先进的机器学习和能耗进行文献综述。
-
市场分析:根据当前市场趋势和评估,为 2025 年的公司创建最佳营销自动化平台的比较报告。
-
技术与软件开发:调查用于人工智能应用开发的编程语言和框架,并进行性能和用例分析。
-
投资与财务分析:基于最近的报告和学术研究,对人工智能驱动的交易对金融市场的影响进行研究。
-
法律研究:对欧洲与美国的数据保护法律进行概述,包括相关裁决和最近的变化。
2. 深度研究是如何工作的?
深度研究使用各种深度学习方法对信息进行系统性和详细的分析。整个过程可以分为四个主要阶段:
1. 研究问题的分解和结构化
在第一步,工具使用自然语言处理(NLP)方法处理研究问题。它识别最重要的关键词、概念和子问题。
此步骤确保 AI 不仅从字面上理解问题,而且从内容上理解。
2. 获取相关信息
一旦工具已经结构化研究问题,它就会专门搜索相关信息。深入研究使用内部数据库、科学出版物、API 和网页抓取的混合。这些可以是如 arXiv、PubMed 或 Semantic Scholar 等开放获取数据库,也可以是如《卫报》、《纽约时报》或 BBC 等公共网站或新闻网站。最后,任何可以在线访问且公开可用的内容。
3. 数据分析与解释
下一步是让 AI 模型将大量文本总结成紧凑且易于理解的答案。Transformers 和注意力机制确保了最重要的信息被优先考虑。这意味着它不仅仅是对找到的所有内容进行总结。同时,还会评估来源的质量和可信度。通常使用交叉验证方法来识别错误或矛盾的信息。在这里,AI 工具会将几个来源相互比较。然而,在 Deep Research 中确切如何进行以及有哪些标准尚不公开。
4. 生成最终报告
最后,生成并显示最终报告。这是使用自然语言生成(NLG)完成的,以便我们能够看到易于阅读的文本。
如果在提示中请求,AI 系统会生成图表或表格,并将响应适应用户的风格。报告末尾也会列出主要来源。
3. 如何使用 Deep Research:一个实际例子
在第一步,最好使用其中一个标准模型来询问如何优化提示以进行深入研究。我已经用以下提示与 ChatGPT 4o 做了这个:
*“优化此提示以进行深入研究:
进行文献检索:对机器学习和能耗的最新研究状态进行文献检索。”*
4o 模型为 Deep Research 功能建议了以下提示:

作者截图
工具随后问我是否可以澄清文献综述的范围和重点。因此,我提供了以下一些额外的说明:

作者截图
ChatGPT 随后返回了澄清并开始研究。
同时,我可以看到进度以及更多来源逐渐被添加。
经过 6 分钟后,最新的文献综述已完成,包括所有来源的报告都可供我查阅。
Deep Research Example.mp4
4. 深度研究功能的挑战和风险
让我们来看看研究的两个定义:
“对某一主题的详细研究,特别是为了发现新信息或达到新的理解。”
“研究是一种创造性和系统性的工作,旨在增加知识存量。它涉及收集、组织和分析证据,以增加对某一主题的理解,其特点是对控制偏差和错误的来源具有特别的关注。”
这两个定义表明,研究是对某一主题的详细、系统性的调查——旨在发现新信息或达到更深入的理解。
深度研究功能基本上在某种程度上满足了这些定义:它收集现有信息,分析它,并以结构化的方式呈现。
然而,我认为我们还需要意识到一些挑战和风险:
-
表面性的危险:深度研究功能主要是为了高效地搜索、总结并以结构化的形式提供现有信息(至少在当前阶段是这样)。这对于概述研究来说绝对很棒。但深入挖掘呢?真正的科学研究不仅超越了简单的复制,而且对来源进行了批判性的审视。科学也依赖于生成新知识。
-
研究和出版中现有偏见的强化:如果论文有显著的结果,它们更有可能被发表。“非显著”或矛盾的结果则不太可能被发表。这被称为发表偏差。如果 AI 工具现在主要评估被频繁引用的论文,它就会强化这一趋势。罕见或不太普遍但可能重要的发现就会丢失。可能的解决方案是实施一种加权源评估机制,同时考虑那些被引用较少但相关的论文。如果 AI 方法主要引用那些被频繁引用的来源,那么不太普遍但重要的发现可能会丢失。大概,这种效应也适用于我们人类。
-
研究论文的质量:虽然很明显,学士学位、硕士学位或博士学位论文不能仅仅基于 AI 生成的科研成果,但我所关心的问题是大学或科研机构如何处理这一发展。学生只需一个简单的提示就能获得一份扎实的研究报告。大概,这里的解决方案必须是对评估标准进行调整,以给予深入反思和方法论更大的权重。
最终思考
除了 OpenAI,其他公司和平台也集成了类似的功能(甚至在 OpenAI 之前):例如,Perplexity AI 引入了一个独立进行和分析搜索的深度研究功能。同样,Google 的 Gemini 也集成了这样的深度研究功能。
该函数为你提供了一个关于初始研究问题的非常快速的了解。目前(从 2025 年 3 月开始),OpenAI 本身将其限制性描述为该功能仍处于早期阶段,有时会将事实错误地加入答案中或得出错误的结论,并且难以区分权威信息和谣言。此外,它目前无法准确传达不确定性。
但可以假设这个功能将进一步扩展并成为研究的有力工具。如果你有更简单的问题,最好使用标准的 GPT-4o 模型(带或不带搜索),你将立即得到答案。
你可以在哪里继续学习?
想要更多关于技术、Python、数据科学、数据工程、机器学习和人工智能的技巧和窍门?那么请定期在我的 Substack 上接收我最受欢迎文章的总结 — 精选且免费。

浙公网安备 33010602011771号