开云体育
回到两年前大部分投资人仍然会错开云APP下载过DeepSeek
开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!一整个春节,全网的科技话题一直都是DeepSeek,哪怕是饭桌上不聊两句都显得与时代脱钩,“仅为美国大模型训练成本二十分之一”,“我用DeepSeek春节期间赚了二十万”,“某某国家开始禁用DeepSeek”等等热点新闻。一时之间,DeepSeek不再是一个大模型公司,而是变成了“争气机”“争国运的初创企业”。
当然也不只是中文互联网圈饱受追捧,外网也差不多,此前因为DeepSeek R1的发布,英伟达在市值损失总额上创下了股市历史上最糟糕的一天,跌幅达17%,相当于6000 亿美元。Meta 的首席执行官马克·扎克伯格承认从他们身上学到了一些东西:“他们做了许多创新性的尝试,我认为我们仍在消化其中的一些成果。此外,还有一些进展是我们希望能在自己的系统中实现的。”
向来嘴毒不留情面的马斯克在夸赞DeepSeek之后,也只是质疑DeepSeek的训练成本应该没有那么低,随后DeepSeek的团队在外网直播解析训练成本构成,并随时欢迎马斯克先生派审计团队入驻。
特朗普的AI顾问有AI沙皇之称的Sacks表示,DeepSeek之所以成了全球新闻,主要是因为两点:第一,这是家中国公司而不是美国公司,因此带有中美竞争的意味;第二,它是家开源模型公司,所以引起了开源和闭源的争论。去掉任何一点,可能都不会引起这么大的轰动。
此外,Sacks还强调如果几周前你问业内大多数人,“中国在 AI 模型上落后多久?”他们会说 6 到 12 个月;而现在我觉得他们可能会说只有 3 到 6 个月,因为 O1 是四个月前发布的,而 R1 与之相当。这无疑提前了人们对中国在 AI 方面赶上来的预期。
简单来说,DeepSeek R1未必全面强于OpenAI O1,但已经构成了让Sam足够紧张的竞争力,计划将ChatGPT Plus用户成本降至10美元,这样的事情对于OpenAI来说还是第一次。所以DeepSeek是OpenAI强有力的竞争对手,这点应该是毋庸置疑的,至于终局是不是,没有人知道答案。
早在2023年初,开源模型Llama的发布,曾经引起一阵“羊驼家族”小模型的热潮,这些从Llama中蒸馏出来的小模型,在一些性能上不输于基础大模型,而且能精简到装入PC和手机。当时谷歌内部已经有人发出警告,我们没有护城河,OpenAI也没有。但是Sam等人仍然坚持认为当前的任务是提高算力上限,AI还远未到拐点,现在他们还这么说。
从行业发展规律来讲,过高的投入成本只会变成无限军备竞赛,把商业应用落地的时间拖的无限远,“缩放定律”对大模型的影响已经是明摆的事,科技巨头虽然仍在争抢算力但并不等于大模型训练上他们还愿意投入无限子弹。
去年OpenAI发布的一系列模型,很好的诠释了什么叫做“200%的投入换来不足10%的提升”,这个账显然是算不过来的。于是正常的商业逻辑就应该是大幅降低成本并稳步提升性能。所以出现“低成本高性能的创新”就应该是当下最正确的方向,但这个创新并不好做并非谁都可以,所以DeepSeek的出现才足以让所有科技巨头们紧张。
有业内人士指出,大模型训练是一个相当复杂的软硬一体的工程,而 DeepSeek 几乎重新设计了绝大部分关键组件:MLA,GRPO,DeepSeekMoE,DualPipe,FP8混合精度,R1-Zero,MTP 等等。范围之广,密度之大,非常震撼。所以这并非只是使用较低的硬件和软件成本复现OpenAI O1的故事,这是一个重复造轮子的故事,其难度可能不亚于零基础发布GPT-3,因此才能不使用英伟达CUDA平台。
笔者看到很多人在介绍DeepSeek的时候,都喜欢说这是一家来自杭州不足百人的初创公司,好像是突然从土里长出来一鸣惊人似的。梁文峰几乎一下子变成了“中国的乔布斯”、“中国的马斯克”,成为多数人的学习对象。
梁文峰曾经在接受采访时表示,幻方某种程度上增强了我们对技术驱动型创新的信心,但也不都是坦途。我们经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实我们做了16年。
同样DeepSeek也不可能是土里长出来的,比较有戏剧性的是恰恰是幻方量化发展不顺利,才开始自己做大模型。
2022年左右,量化基金被政策持续打压,幻方管理规模也持续缩减。而梁文锋在创立DeepSeek前除了接触过VC外,因为手握大量的GPU算力集群,再加上梁文锋自己的钱,曾想通过投资入股、找云厂商合作等方式,将手中富裕的算力“用出去”,还为此招了两个人专门做战投,看了大量包括低空等在内的科技项目,但幻方的结论是,“外面能做的,自己也能做”,多数项目“意思不大”,最终“一个也没投”。后来基于梁文锋技术理想主义的情怀,在2023年DeepSeek应运而生。
幻方做AI,大手笔始于2019年。公司投入自有资金近2个亿在其自研的深度学习训练平台“萤火一号”;两年后“萤火二号”的投入差不多10个亿。所以幻方才有一直大规模买卡的动力和需求。根据半导体分析师 Dylan Patel 的估计,DeepSeek 大约有 50,000 个 Hopper 芯片。具体来说,他说他们有大约 10,000 个 H100、10,000个 H800 和 30,000 个 H20。
按道理来说作为国内为数不多拥有“英伟达核心万卡以上”的企业,完全可以像其他大公司一样,按照OpenAI的公开训练路径去复现和微调,一样可以成为国内不错的大模型公司。但梁文峰显然不这么觉得,我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。
客观来看,就算是幻方拥有英伟达万卡以上足够训练大模型,但是显卡是有寿命的,在使用三五年之后其功效会大大降低,在中美地缘加剧的大背景下,再想持续购买英伟达高性能显卡几乎是不可能的事。那么路就剩下一条,在足够低成本的情况下去做训练研发,那一切几乎都要推倒重来,只有从头思考费更多的功夫才有可能另辟蹊径。
DeepSeek在圈外的爆火始于这个春节,但在圈内至少去年上半年开始就已经小有名气了。2024年5月,当DeepSeek V2发起一场价格战时,硅谷一些人已经敏锐地感到一股“来自东方的神秘力量”开始出现,但并没有引起太多的关注。直到DeepSeek在一个月内接连发布V3 和R1,才以美国AI巨头暴跌万亿美元的惨剧,宣告美国前沿闭源大模型对AI定价权的崩溃,才进入了中美两极竞争的时代。
最近有一些嘲笑国内VC错过DeepSeek的文章得到了广大网友的认同,实话说,如果能让他们回到两年前,他们还是会错过。两年前的DeepSeek并没有什么特质值得他们重仓,除了万卡这个稀缺又不绝对的特质,国内的VC这几年一直处于资产荒的境地,LP的要求不再只是好项目,还要求安全退出期不能太长,既要又要之下好项目怕是也要被逼疯。所以梁文峰早期接触一些VC之后,就毅然决定暂不接受外部投资。
这也不仅仅是国内创投环境太变态,美国硅谷那边的情况也差不多,AI早已经走过了早期投入阶段,要变现要商业化落地才是当下唯一的政治正确。2023年下场做AI在行业内已经稍晚,2024年我们已经看到了国内外出现了一些并购初创AI的案例。在这个阶段做AI需要有破釜沉舟的勇气,资本不给力是才是正常现象,不需过多苛责。
但当DeepSeek已经名满天下的时候,能够融到更多的钱才是最正确的事。有人说DeepSeek应该属于国家,动用国家的力量来维系,但国家的力量也不可能无限投入,谁也无法保证后续一直成功。至于国资投入道理也是一样的,回报怎么算,损失怎么计算。AI目前仍然属于高风险高投入的项目,用创投行业相对成熟的投资退出机制来运作,才有可能长期运营。梁文峰并不拒绝资本介入,但过度商业化和干涉科研创新氛围是他所不能接受的,相信成名之后的DeepSeek大概率会有合适的投资方。
投中网指出,“现在DAU飙涨到2000万,流量来得如此迅猛,已经明显承接不住。如果DeepSeek只是开发模型,不做应用,那没问题,但做了应用,现在每一天都要花几百甚至上千万出去,必须考虑服务器、网络资源之类的问题。另外,已经跑通了单点,现在要去scale up,scale up也是要花钱的。
纵使梁文峰已经是百亿身价投资大佬,一直用自己的钱去做大模型也是不可持续的,商业化和科技平权的理想主义有时候也可以不冲突。
当DeepSeek来过之后,OpenAI 的急迫感已经迫使他们开始放大招了。2月13日,OpenAI CEO Sam通过一则推文透露了该公司的诸多重要动作。其宣布未来几周将发布GPT-4.5,即Orion模型,也是最后一个非思维链模型。之后OpenAI的任务将是统一o系列模型和GPT系列模型,未来几个月内将发布GPT-5。
去年OpenAI放了一年GPT-5的鸽子,在DeepSeek的刺激下终于要来了,这固然是好消息,但对其他同行来说,AI将迎来加速的一年,上有OpenAI卷上限,下有DeepSeek卷成本。某些混榜单的大模型怕是不好过了。
面对DeepSeek近期带来的冲击,大部分公司所谓的调整也只是接入DeepSeek大模型,开始做竞品研究。未来该怎么卷,过去的投入怎么调整,恐怕大部分人都没想明白,能够专注具体场景做模型微调的公司并不多,或许并购才是一些初创企业的出路。
当大家发现做AI并不需要很多钱,很多大模型公司的估值恐怕要经历几轮大的波动。一时之间AI行业已经迎来了史上最艰难的时刻,高投入难以说服投资人,卷应用场景又被巨头压一头,大量免费同质化的应用把AI付费的空间也急剧压缩。
如果这个时间你还要去做AI,那就要考虑清楚自己有多强的差异化竞争能力,如果只是借助DeepSeek这样的开源工具去做付费内容,那么你要考虑的就变成了创意和效率驱动,这是一个古老的生意,并不怕未来AGI的抹掉生存空间。当你投身AI创业之前,要想想自己离开AI是否还有创业的能力,AI只能做赋能而不是“青蛙变王子”。返回搜狐,查看更多