专家解读/开源AI比闭源AI仅落后6个月
图:在去年“香港国际创科展”上,专香港生成式人工智能研发中心展示的家解仅落AI发明成果吸引参观者驻足了解。
全球AI圈又领教了一回“神秘的读开东方力量”。1月20日,源A月最开放的91直播appDeepSeek官宣其最新AI推理模型DeepSeek R1。比闭源多位业内人士指出,专DeepSeek此次最大的家解仅落贡献,是读开向世界展示了快速、低成本实现o1同等模型能力的源A月可能性。清华大学计算机科学与技术系副教授刘知远表示,比闭源“东方力量”其实就是专t666y回家的路工程创新加持下的追赶能力。在算力吃紧的家解仅落情况下,DeepSeek打了一场以少胜多的读开仗。
R1怎么能如此便宜?源A月新加坡南洋理工大学计算机学院助理教授刘子纬表示,算力达到一定量级的比闭源情况下,可以通过工程创新把性能差距抹平。在堆算力的路线进入瓶颈后,DeepSeek选择了在底层算法、训练模式和数据三个层面进行了工程迭代。基于混合专家模型、注意力机制等方面的创新,R1做到了“用50次运算达成别人做100次运算的效果”,效能提升明显。而在抛弃监督学习后,计算资源的需求也大幅减少。
芯片禁运难遏中国AI发展
多位业内人士表示,DeepSeek真正的价值,在于展示了工程实践和理论创新之间的平衡点,开创了一条符合现实算力约束的技术迭代道路。“R1说明开源AI仅落后于闭源AI不到6个月。”在刘知远看来,GPT阶段也就是2023年初的时候,OpenAI模型发布之后,国内团队需要一年的时间才能赶上。但是到了文生视频模型Sora,以及后来的GPT-4o和o1,国内的追赶时间缩短到半年以内。“DeepSeek的阶段性成果释放了一个信号,那就是通过芯片禁运等方式来遏制国内AI发展难以行通。这就是开源的力量。”刘知远说。\中国新闻周刊
本文地址:http://www.51liezheng.com/news/09a5399937.html
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。