开云体育官方DeepSeek正在杀死国产大模型

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

开云体育官方DeepSeek正在杀死国产大模型

2025-06-02

浏览次数：次

返回列表

　　开云体育[永久网址:363050.com]成立于2022年在中国，是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网，欢迎注册体验！

开云体育官方DeepSeek正在杀死国产大模型

　　中国创业公司的3年存活率，大约是10%，AI创业公司只会更低，DeepSeek的出现，加速了国产大模型公司的生死战。短短的两年半，从“百模大战”到“十模共生”，就连被给予厚望的大模型“六小虎”，其中两虎已经宣布退出基模的研发。国产大模型公司之间的竞争相当惨烈，并且还没有到终局，本文就来聊一聊，近期对大模型产业的观察与思考。

　　人工智能科学家吴恩达，曾提出Agent的四个核心要素：反思、工具调用、规划和多智能体协作。比如，一个电商 Agent 能根据用户需求自动比价、生成购物清单、跟踪物流；一个医疗 Agent 能分析病例、辅助诊断、制定治疗方案，等等。而 Agent 的核心能力“反思”，本质上则是依赖大模型的推理和深度思考能力。

　　2025年被称为Agent元年，各种 Agent 已遍地开花，从钉钉智能客服，到字节的扣子空间，再到百度心响App，以及刚刚融资5亿的Manus。 Agent 兴起不仅仅是一个趋势，更是基础大模型能力达到一个临界值的标志。只有大模型具备了足够强的理解、推理和决策能力，才能支撑起现实世界中的各种应用场景。同时这也意味着，基础大模型开始从研究、炫技阶段，迈入可用、产业化的新阶段。

　　李开复曾公开表示，最终基础大模型公司可能也就2-3 家，其实道理很容易理解，基础大模型是典型的技术密集、资本密集、数据密集型行业，壁垒极高，马太效应非常明显。训练一个顶尖大模型，动辄需要上万张高性能GPU，数月乃至更久的训练时间，海量的优质数据，以及顶尖的算法科学家团队。这样的投入，堪比“军备竞赛”，小玩家根本上不了牌桌。这一特点也基本注定基础大模型的终局 ---- 只会留下极少数的基础大模型“ 寡头 ” 。

　　根据K 哥的观察以及行业内的普遍共识，目前国内基础大模型第一梯队玩家，大致有以下几家：

　　阿里的通义大模型布局全面，通义系列模型从 0.5B 到 110B 全尺寸覆盖，阿里 Qwen 系列已开源 200 余个模型，全球下载量超 3 亿次， Qwen 衍生模型数超 10 万个，已超越美国 Llama 成为全球最大的开源模型，开发者生态规模仅次于 Hugging Face 。这种 “开源获客 - 商业版变现” 的模式，跟安卓系统的生态逻辑，有异曲同工之妙：通过免费开源吸引开发者、建立技术品牌影响力，再通过企业版、定制化服务盈利。

　　比如，淘宝用通义千问优化推荐算法，有效提升用户转化率；夸克推出的 AI 作业助手，覆盖 K12 教育场景。更关键的是，阿里云未来三年投入 3800 亿建设 AI 基础设施，自研的“光系列” 芯片和液冷数据中心，为模型训练提供了底层保障，让大模型成为水电煤一样的基础设施，也让自己的全栈技术布局，成为别的企业难以逾越的护城河。

　　火爆出圈的 DeepSeek ，则是凭借惊艳的工程创新，在大模型江湖杀出一条独特血路。它搞出降秩 KV 矩阵，搭配混合专家架构，参数数量直接砍掉约 60%，算力消耗大幅削减，训练成本低至行业头部模型的 1/10。还有它的 GROP 算法强化学习，跳过传统 SFT 微调，用 “模糊思考 + 精确证明” 的训练套路，让数学、代码生成任务上表现无可挑剔，在 LMSYS Org 榜单夺魁。

　　更具前瞻性的是 DeepSeek 的开源策略，不仅构建起了以中国为圆心的全球 AI 生态，还在其他公司追求“更大更强” 之际，用自己的技术实力和战略眼光开辟了 “更省更快” 的新赛道，直接“颠覆” API 定价，把 AI 服务从高端“奢侈品” ，变成大众用得起的 “日用品”。

　　字节的 AI 战略带着鲜明的 “张一鸣烙印”：低调布局，却步步精准。张一鸣作为“一把手”，亲自挂帅 AI 战略，整合超千人的顶尖 AI 科学家军团。而抖音、今日头条等旗下产品，每天产生的海量视频数据，更为其多模态模型提供了充分的“养料”。

　　一个典型案例是 “豆包 AI 助手” 的迭代：初期只是简单的聊天机器人，如今已能根据用户输入的文字生成短视频脚本、自动剪辑视频，甚至通过分析用户表情推荐内容。这种 “流量 + AI” 的闭环，让字节的模型训练拥有天然优势。此外，字节在视频生成、实时交互等领域的技术突破，也在一步步重新定义和拓展 “内容创作”的边界。

　　百度是国内最早布局大模型的公司之一，文心大模型已经迭代到 ERNIE 4.0 版本。其核心优势在于“搜索 + 大模型”的深度融合。比如，用户搜索 “如何煮咖啡”，文心大模型不仅能给出步骤，还能生成对应的视频教程、推荐咖啡豆购买链接。这种 “内容 + 服务” 的一体化能力，让百度在 To C 场景中占据先机。网盘、文库、地图等国民级应用，几乎都用AI重新做了一遍，而且商业上的表现格外亮眼，是国内第一批找到PMF的AI产品。

　　此外，百度还在努力破圈，实现大模型的落地应用。比如，在工业领域，百度与三一重工合作探索设备智能化维护。在政务场景中，百度依托文心大模型为某地区打造 “政务云脑”，提升服务效率等。这家老牌大厂正持续发力，努力为自己在A I时代扳回一城。

　　除了以上四家大模型公司，国内AI 圈还有一批极具潜力的“后浪”在奋力追赶，试图在基础模型或其核心能力上实现突破，成为下一个“ DeepSeek ”。

　　背靠清华大学知识工程实验室，智谱 AI 带着浓浓的 “学院派” 基因。它的 GLM 系列模型在中文问答、代码生成领域表现优异，其所坚持的 “开源+ 闭源”双轮驱动策略，更是捷报频传。

　　开源方面，智谱 2025 年大手笔开源多款模型，吸引全球开发者挖掘潜在问题、贡献优化思路，模型性能也因此一路飙升；闭源商业化同样风生水起，2024 年中标 32 个政府及企业项目，揽金 1.29 亿元。在金融、医疗、政务等 20 多个行业里，智谱的模型都成了核心生产力工具。

　　智谱的发展如同它的定位，2G/2B 业务齐头并进，一边扎根政府项目，助力数字政务升级；一边帮企业智能客服、智能办公，全方位提升效率，让自己的生态更完整，发展更稳健。

　　在多模态赛道尤其是音视频领域， MiniMax 绝对是不容忽视的存在。其自研的语音大模型能够生成媲美真人的、富有情感的语音，在社交、游戏、教育等场景有巨大潜力。在视频生成上也同样出色，输入文字脚本，几秒钟就能渲染出特效炫酷、剧情紧凑的短视频，极大降低成本。 MiniMax 推出的AI社交应用“星野”、AI助手“海螺AI ”等产品，也展现了其将技术快速产品化的能力。

　　此外，创始人闫俊杰曾是商汤科技副总裁，对技术和商业都有着极为深刻理解。在当前短视频、直播带货火爆全网，对音频特效、视频内容自动化生产需求井喷的市场环境下，带领 MiniMax 和各大短视频平台、音频内容创作社区深度合作，为创作者持续输送 “弹药”，在垂直赛道越跑越快，一骑绝尘。

　　月之暗面专注长文本处理与数学推理，这堪称知识密集型场景的硬核需求。比如，在学术研究领域，长篇文献综述撰写，它能梳理海量文献脉络，精准提炼关键观点；在金融风控领域，又能靠它分析长篇财务报告、挖掘隐藏风险点，给出量化评估建议。

　　Kimi 在数学推理等领域也展现出不俗的实力，其推出的 k0-math 数学推理模型在多个基准测试中表现优异，并在中考、高考、考研及 MATH 等基础数学测试中的表现超越了 OpenAI 的 o1-mini 和 o1-preview 模型。

　　阶跃星辰成立短短两年，就推出 22 款自研基座模型，其中 16 款多模态模型，占比超 7 成，被称为 “多模态卷王” 。它坚持理解生成一体化路线，这种技术远见，完美契合当下 AI 从多模态融合迈向一体化的大趋势。阶跃的多模态模型不仅在国内外权威榜单上频频夺冠，更是和产业界展开了深度融合，比如和 OPPO 手机合作 “一键问屏” 功能，用户长按手机界面，就能智能检索屏幕内容相关信息；和智元机器人携手，为具身机器人装上 “智慧眼睛”，精准识别环境、灵活规划行动路径。

　　此外，阶跃星辰的商业化之路也走得非常扎实，比如茶百道接入它家 Step-1V 多模态理解大模型，实现智能巡检、AIGC 营销，门店运营效率大幅提升，也让阶跃星辰收获了更多的付费用户。

　　从当年的“百模大战”，到后来的 “ A I六小虎 ”，再到如今的 “新基模五强” ，为什么短短两三年的时间，就有那么多红极一时的 A I企业，或出局或“ 泯然众人矣” ？一个极为重要原因就是：有些企业只懂烧钱做技术，不懂赚钱做商业。

　　如上文提到的，大模型是资本密集型、人才密集型、数据密集型行业。但仅仅有钱、有人、有数据，就能成功吗？未必。商业的本质是创造价值并获取价值。技术再先进，如果不能转化为用户愿意买单的产品或服务，不能形成可持续的商业模式，最终也只是昙花一现。这就像“必要条件”和“充分条件”的关系，钱、人、数据是必要条件，但成功的商业化才是充分条件。

　　所以我们会看到，无论是 OpenAI 与微软的深度绑定，通过Azure 云服务和Copilot系列产品变现；还是国内的阿里、百度、字节，依托自身的云服务和丰富应用场景推动大模型落地，都体现了“技术+场景+商业”的闭环逻辑。而这也恰恰暗合了商业达尔文主义：能活下来的一定是踩中时代节奏、满足市场刚需、又能实现商业模式自洽的企业，而不会是技术浪漫主义者，或A I理想主义者。

　　最后，中国或许真的不需要几十上百家公司，都去卷基础大模型。这既不经济，也不高效。少数几家巨头在基础模型层面持续投入，提供稳定、强大、且成本可控的“AI底座” 就足够了。更多的创新和机会，应该在于应用层，在于如何利用大模型，结合行业Know-how ，解决实际问题，创造真正的商业价值。

　　特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

　　4人进8强随着萨巴2-0、斯瓦泰克2-1 郑钦文死亡半区：2大苦主全赢

　　生于1992年的她，追求低级趣味，严重违反党的工作纪律、生活纪律，构成严重职务违法并涉嫌贪污犯罪

　　兰博基尼车主撇开代驾小哥酒驾进车库，却因赖账5元被举报，交警：吊销驾照并罚款

　　山东20254夏季合格考【地理/历史/化学/生物/信息技术】试题参考（附PDF下载）

上一篇：AMD总裁苏姿丰：DeepSeek推动中国人工智能革命的关键力量开云体育官方

下一篇：开云APP下载精彩回顾｜科技行业迎来DeepSeek时刻：AI应用加速带来的影响、机遇与挑战

首页

关于我们

开云体育

产品展示

留言板

咨询研究

联系我们

开云体育NEWS CENTER

开云体育官方DeepSeek正在杀死国产大模型