okex欧易交易所封面图

okex欧易交易所

okex欧易交易所是国内最大的数字货币交易所,现在注册永久免20%手续费!

官网注册

Anthropic,一家由前 OpenAI 成员创立的人工智能公司,推出了首个可以产生常规输出或可控"推理"的 AI 模型,用于解决更棘手的问题。

Anthropic 表示,这个名为 Claude 3.7 的新型混合模型将使用户和开发者更容易处理需要直觉输出和循序渐进思考相结合的问题。"用户对模型行为有很大控制权——可控制思考时长,并在推理和智能与时间、预算之间进行权衡,"Anthropic 的 AI 平台产品负责人 Michael Gerstenhaber 说。

Claude 3.7 还配备了一个新的"草稿本",可以显示模型的推理过程。类似的功能在中国 AI 模型 DeepSeek 中很受欢迎。它可以帮助用户了解模型如何处理问题,从而修改或完善提示。

Anthropic 研究产品负责人 Dianne Penn 表示,当与调节模型"推理"能力的功能结合使用时,草稿本会更加有用。例如,如果模型难以正确分解问题,用户可以要求它花更多时间处理。

前沿 AI 公司越来越注重让模型"推理"解决问题,以提高其能力和扩大用途。率先推出聊天机器人 ChatGPT 的 OpenAI 公司,在 2024 年 9 月首次推出了名为 o1 的推理 AI 模型。OpenAI 随后推出了更强大的 o3 版本,而竞争对手 Google 也为其 Gemini 模型推出了类似的"Flash Thinking"功能。但与 Claude 3.7 不同,用户必须在这些模型之间切换才能访问推理功能。

常规模型和推理模型的区别,类似于诺贝尔经济学奖获得者 Michael Kahneman 在 2011 年著作《思考,快与慢》中描述的两种思维方式:快速直觉的系统 1 思维,以及更缓慢深思熟虑的系统 2 思维。

支撑 ChatGPT 的 LLM 模型可以即时响应提示,产生出色而连贯的输出,但可能无法回答需要循序渐进推理的问题,包括简单的算术。

如果 LLM 被指示制定并遵循计划,它可以模拟深入推理。但这种技巧并不总是可靠的,模型通常难以解决需要仔细规划的问题。OpenAI、Google 和现在的 Anthropic 都在使用一种称为强化学习的机器学习方法,让最新的模型学会生成指向正确答案的推理。这需要从人类那里收集解决特定问题的额外训练数据。

Penn 表示,Claude 的推理模式获得了商业应用方面的额外数据,包括编写和修复代码、使用计算机以及回答复杂的法律问题。"我们改进的领域是[...]技术主题或需要长时间推理的主题。我们的客户对将我们的模型部署到实际工作负载中表现出很大兴趣。"

Anthropic 表示,Claude 3.7 在解决需要循序渐进推理的编码问题方面特别出色,在一些基准测试(如 SWE-bench)上的表现优于 OpenAI 的 o1。该公司今天发布了一款名为 Claude Code 的新工具,专门针对这种 AI 辅助编码。

"该模型在编码方面已经很出色了,"Penn 说。"但对于可能需要非常复杂规划的情况,比如分析一家公司的大型代码库,额外的思考会很有帮助。"

The End

文章声明:以上内容(如有图片或视频亦包括在内)除非注明,否则均为谈天说币原创文章,转载或复制请以超链接形式并注明出处。

上一篇 下一篇

相关阅读