开云体育
DeepSeek-V3悄然登场重塑AI行业规则引发硅谷反思开云体育
在一个几乎没有预兆的情况下,中国人工智能初创企业DeepSeek于周一低调推出了其最新模型DeepSeek-V3-0324。此举不仅震惊了行业,更让业界对硅谷传统模式再次产生疑问。
DeepSeek-V3拥有6850亿个参数,已经在AI存储库HuggingFace上线,且随即获得MIT许可证,意味着其可以被自由使用于商业用途。根据AI研究员AwniHannun的测试,这款新模型在苹果高端计算机MacStudio上可以以每秒20个token的速度运行,挑战了长期以来“只能依赖庞大数据中心”的共识,展现了在消费级硬件上也能实现强大AI能力的潜力。
值得一提的是,DeepSeek的发布带有几分神秘色彩:没有白皮书,也没有预热宣传,仅仅在更新的ReadMe文件中透露信息,这与硅谷的一贯商业手法形成鲜明对比。相较于“闭源”商业模型ClaudeSonnet所需每月20美元的费用,DeepSeek更是完全开源,供任何人免费下载和使用,标志着它将推动一场“AI普惠”运动。
技术方面,DeepSeek-V3引入了多项创新,例如“专家”模块,即在特定任务中仅激活370亿个参数,显著降低了计算负担。此外,多头潜在注意力(MLA)和多标记预测(MTP)的结合也大幅提升了模型生成内容的速度,达到了惊人的80%效率提升。
这一进展对整体AI行业来说,意义重大。它不仅降低了大模型的能耗与计算成本,更可能动摇华尔街对顶级模型基础设施投资规模的假设。同时,中国AI行业对开源的共识也为其快速发展提供了动力,缩短了与国际顶尖对手的距离。分析人士预测,在DeepSeek的影响下,其计划于4月发布的R2模型,或将与OpenAI的GPT-5正面较量,引发中美两国AI发展思路的直接碰撞。
总而言之,DeepSeek-V3的突然涌现不仅是一款新技术的发布,而是一次对硅谷商业模式的挑战与反思,让我们拭目以待在这一波深度AI浪潮下,行业将如何演进。返回搜狐,查看更多