人工智能公司过去曾以行业领导者OpenAI为衡量标准。但现在情况已经不同了。如今,中国的DeepSeek已经成为行业的领跑者,成为了其他公司要超越的目标。
周一,DeepSeek颠覆了人工智能行业,在华尔街造成了数十亿美元的损失,同时也引发了人们对一些美国初创公司和风险投资实际效率的质疑。
现在,两家新的人工智能巨头已经加入战局:位于西雅图的Allen人工智能研究所和中国的阿里巴巴,他们都声称自己的模型与DeepSeek V3相当或更好。
总部位于美国的Allen人工智能研究所以发布了一个更为温和的视觉模型Molmo而闻名,如今推出了一个新版本的Tülu 3,这是一个免费的开源大型语言模型,拥有4050亿个参数。
阿里巴巴在农历新年期间推出了Qwen 2.5-Max,这是一个训练于超过20万亿个令牌的大型语言模型。基准测试显示,Qwen 2.5-Max在编码、数学、推理和常识等多个关键领域优于DeepSeek V3。
总的来说,这三个模型的发布为开源人工智能领域带来了重大推动。DeepSeek已经证明,利用Qwen的架构,开源人工智能可以以更低的成本与拥有巨额资金的科技巨头匹敌。而Qwen 2.5-Max的推出则进一步提高了这一标准。
The End
文章声明:以上内容(如有图片或视频亦包括在内)除非注明,否则均为谈天说币原创文章,转载或复制请以超链接形式并注明出处。