OpenAI的新Deep Research agent承诺通过自主浏览互联网、分析响应和提供任何主题的综合文件来改变用户在线收集数据的方式。
这家人工智能公司展示了其通过处理从滑雪购买建议到高级生物学论文的各种任务的能力。
但这不是穷人的选择。OpenAI将访问权限限制在每月支付200美元的Pro用户。
高价格背后有原因:"这需要大量计算能力和时间,但这是第一个可以执行如此广泛的复杂有价值任务的人工智能系统,"Sam Altman在推特上写道。
是的,这并不完全正确。市场上已经有几个选择几个月了。
从像AI Scientist这样的开源项目到像Gemini's Deep Research这样的闭源项目,用户已经能够利用人工智能进行复杂的研究一段时间了。
那些不愿支付高价的人和那些有创意的人可以以更低的成本或免费获得类似甚至更好的结果。
以下是我们为注重预算的人选择的一些顶级选择:
谷歌没有等待OpenAI采取行动。该科技巨头于12月向Gemini高级用户推出了Deep Research,价格为每月20美元。
对于这个价格,Gemini用户可以访问Gemini Ultra、Gemini的Deep Research Agent、2TB的云存储以及构建个人代理或"宝石"的能力,类似于OpenAI的GPTs。
"Deep Research使用人工智能代表您探索复杂的主题,并以全面、易读的报告向您提供结果,这是Gemini如何更好地应对复杂任务以节省您时间的首次预览,"该公司在一份官方公告中说。
与OpenAI的限制性方法不同,谷歌完全放弃了查询限制。虽然OpenAI计划将Plus用户限制在每月10次查询,Pro用户限制在100次,但Gemini用户可以无限制地进行研究请求。
这意味着谷歌的工具以10%的成本提供10倍的价值。
Decrypt测试了该工具,研究过程与OpenAI的方法相似。用户输入主题,就像使用ChatGPT一样获得研究计划。但Gemini用户必须在让人工智能在网上自由搜索之前调整计划,而OpenAI的方法只是在研究之前向用户提出几个问题。
在来源方面,Gemini采取了谨慎的态度。我们的测试显示,该模型一贯偏向于权威的科学出版物和可靠的新闻媒体,而不是较小的网站或博客。
研究过程需要一些时间,通常需要几分钟,因为代理根据其计划浏览了数十个网站。
例如,我们要求该模型对Nvidia Jetson Nano进行一些研究。3分钟内,它浏览了40个网站,并提供了一份6页的报告,内容包括该技术的工作原理、潜力、一些最重要的竞争对手以及其他信息。
使用谷歌而不是OpenAI的一大优势是Gemini深度集成了谷歌的生态系统。用户可以将研究直接导出到谷歌文档,使得基于人工智能的发现更容易构建。(尚未与谷歌套件中的其他工具如表格集成。)
总的来说,这个研究代理和NotebookLM可能是谷歌提供的最大隐藏利益之一。
You.com可能不是世界上最知名的人工智能网站,但也不容小觑。
这家成立4年的初创公司得到了令人印象深刻的科技投资者阵容的支持,在人工智能驱动的搜索引擎领域建立了自己的声誉,与Perplexity竞争。
它还没有成为独角兽,但也不远了。You.com的母公司SuSea Inc.在最近一轮融资中筹集了5000万美元,使其估值从7亿美元增加到9亿美元。
You.com在2024年11月率先推出了研究代理,成为人工智能公司中的佼佼者。
"使人工智能能够分析每个查询高达200个来源并采用博士级研究方法代表了人工智能进行研究的一种转变,"该公司在一份官方声明中表示。"我们将人工智能设想为一名勤奋的学生,在撰写最终论文之前完成自己的功课。"
它的研究助手采取了一种简化的方法。与OpenAI的有条不紊的计划阶段或谷歌可调整的研究大纲不同,You.com直接切入主题。
用户输入查询,模型就会立即交付结果,有时只需几秒钟,但从未超过几分钟。相比之下,OpenAI演示中显示的结果表明,其研究代理需要几分钟才能做出回应,其中一个实例需要近25分钟才能提供简报。
这种注重速度的方法也有权衡。You.com的报告通常只有2-3页,比其竞争对手更短,但足够密集,为进一步研究提供了坚实的基础。该平台提供3次免费每日使用,之后用户必须切换到其他模型。
简化的过程使You.com成为研究项目的理想起点。虽然它可能无法与OpenAI或谷歌的产品相匹敌,但它证明了昂贵的订阅并非进行有效人工智能研究协助的必要条件。
总之:You.com是唯一一个向用户提供免费人工智能研究代理的大型平台,这是一个非常不错的选择。
是的,这个来自中国,也不完全是一个代理,但对于愿意付出额外努力的用户来说,这可能是一个不错的变通方法。
OpenAI的旗舰推理模型缺乏网络浏览功能。Deepseek的R1填补了这一空白,成为唯一具有内置互联网访问能力的推理模型。
我们可以利用这一点来生成全面和详细的研究,而且是免费的。
这种设置需要更多的用户输入,但可以提供令人惊讶的强大结果。
首先,通过简单地单击文本框中相应的按钮来激活Deep Reasoning以启用R1,这是一个关键步骤,因为默认的Deepseek V3更侧重于创造性任务,类似于GPT-4o而不是OpenAI o1。
启用了网络搜索和推理功能后,只需要向模型提供详细的搜索指令,最好是以研究计划或一组指南的形式。
我们尝试使用Deepseek进行研究,发现它非常透明。R1实时显示了它的工作和思维过程。
可以观察到它分解查询、概述方法和解释某些信息为什么重要。这种窥视幕后的能力可以帮助研究人员实时微调他们的指令,并了解模型数字大脑中发生的情况。
初始输出与You.com的范围相匹配 - 一份简洁的报告,有良好的来源。
但R1的真正力量体现在后续查询中。深入探讨特定部分,要求更多技术细节或初学者友好的解释,总的来说,引导模型朝着研究的方向发展。
您可以与模型进行迭代,并要求它持续深入特定主题,而不是等待半个小时才能得到一份报告,并让它再次进行全面研究。
在我们的测试中,一份初始的3页报告被扩展到了25页以上的事实准确和相关内容,全部都在我们研究的主题范围内。
虽然需要更多的手动指导,而不是点击即用的替代方案,但Deepseek R1证明了有效的人工智能研究协助并不需要每月订阅。
值得一提的还有:除了这些主要参与者,还有一些其他工具在人工智能研究领域开辟了自己的利基市场。Beago AI和Perplexity Pro通过关注后续问题而获得了关注,帮助用户发现研究主题的意外角度。您可能会查看一个名为Agent Laboratory的开源解决方案,这是约翰斯·霍普金斯大学和AMD之间的合作。
由Josh Quittner和Sebastian Sinclair编辑
文章声明:以上内容(如有图片或视频亦包括在内)除非注明,否则均为谈天说币原创文章,转载或复制请以超链接形式并注明出处。