开云体育
开云体育官方DeepSeek正在杀死国产大模型
中国创业公司的3年存活率,大约是10%,AI创业公司只会更低,DeepSeek的出现,加速了国产大模型公司的生死战。短短的两年半,从“百模大战”到“十模共生”,就连被给予厚望的大模型“六小虎”,其中两虎已经宣布退出基模的研发。国产大模型公司之间的竞争相当惨烈,并且还没有到终局,本文就来聊一聊,近期对大模型产业的观察与思考。
人工智能科学家吴恩达 , 曾提出Agent的四个核 心要素:反思、工具调用、规划和多智能体协作。 比如,一个电商 Agent 能根据用户需求自动比价、生成购物清单、跟踪物流;一个医疗 Agent 能分析病例、辅助诊断、制定治疗方案 ,等等 。 而 Agent 的核心能力“反思”, 本质上 则是 依赖大模型的推理和深度思考能力 。
2025年被称为Agent元年, 各种 Agent 已 遍地开花, 从钉钉智能客服,到字节的扣子空间,再到百度心响App,以及刚刚融资5亿的Manus。 Agent 兴起 不仅仅是一个趋势,更是基础大模型能力达到一个临界值的标志。 只有 大模型具备了足够强的理解、推理和决策能力,才能支撑 起现实 世界中的各种应用场景 。同时这 也意味 着 , 基础 大模型 开始从 研究 、 炫 技 阶段,迈入 可用、 产业化的新阶段。
李 开复 曾 公 开表示, 最终基础大模型公司可能也就2-3 家,其实道理很容易理解, 基础大模型是典 型的技术密集、资本密集、数据密集型行业,壁垒极高,马太效应非常明显。 训练一个顶尖大模型,动辄需要上万张高性能GPU,数月 乃至更久的训练时间,海量的优质数据,以及顶尖的算法科学家团队。这样的投入,堪比“军备竞赛”,小玩家根本上不了牌桌 。 这 一特点 也 基本 注定 基础 大 模型 的 终局 ---- 只会留下极少数的基础大模型“ 寡头 ” 。
根据K 哥的观察以及行业内的普遍共识,目前国内 基础大模型 第一梯队玩家 ,大致 有以下几 家:
阿里的通义大模型布局全面,通义系列模型从 0.5B 到 110B 全尺寸覆盖, 阿里 Qwen 系列已开源 200 余 个 模型,全球下载量超 3 亿次, Qwen 衍生模型数超 10 万个,已超越美国 Llama 成为全球最大的开源模型 , 开发者生态规模仅次于 Hugging Face 。 这种 “开源获客 - 商业版变现” 的模式,跟 安卓系统 的生态逻辑,有异曲同工之妙 : 通过免费开源吸引开发者、建立技术品牌影响力,再通过企业版、定制化服务盈利。
比如, 淘宝用通义千问优化 推荐算法, 有效 提升用户转化率 ;夸克推出的 AI 作业助手,覆盖 K12 教育场景 。更关键的是,阿里 云未来 三年投入 3800 亿建设 AI 基础设施,自 研 的“光系列” 芯片和液冷数据中心,为模型训练提供了底层保障,让大模型成为水电煤一样的 基础设施,也让自己的 全 栈 技术布局 ,成为别的企业难以逾越的 护城河 。
火爆出圈的 DeepSeek ,则是 凭借惊 艳的工程创新,在大模型江湖杀出一条独特血路。它搞出降 秩 KV 矩阵,搭配混合专家架构,参数数量直接砍掉约 60%, 算力消耗 大幅削减,训练成本低至行业头部模型的 1/10。还有它的 GROP 算法强化学习,跳过传统 SFT 微调,用 “模糊思考 + 精确证明” 的训练套路,让数学、代码生成任务上表现无可挑剔,在 LMSYS Org 榜单夺魁。
更具前瞻性的是 DeepSeek 的开源策略 , 不仅 构建起 了 以中国为圆心的全球 AI 生态,还在其他公司 追求“更大更强” 之际 , 用自己的技术实力和战略眼光开辟了 “更省更快” 的新赛道,直接“颠覆” API 定价 , 把 AI 服务从高端“奢侈品” , 变成大众用得起的 “日用品”。
字节的 AI 战略带着鲜明的 “张一鸣烙印”: 低调布局,却步步精准。张一鸣 作为“一把手”, 亲自挂帅 AI 战略,整合超千人的顶尖 AI 科学家军团。 而 抖音、今日头条等 旗下 产品 , 每天产生的海量视频数据, 更 为其多模态模型 提供了充分 的“养料”。
一个典型案例是 “豆包 AI 助手” 的迭代:初期只是简单的聊天机器人,如今已能根据用户输入的文字生成短视频脚本、自动剪辑视频,甚至通过分析用户表情推荐内容。这种 “流量 + AI” 的闭环,让字节的模型训练拥有天然优势。此外 ,字节在视频生成、实时 交互等 领域的技术突破, 也 在 一 步步 重新定义 和拓展 “内容创作”的边界。
百度是国内最早布局大模型的公司之一,文心大模型已经迭代到 ERNIE 4.0 版本。其核心优势在于“搜索 + 大模型”的深度融合 。比如, 用户搜索 “如何煮咖啡”,文心大模型不仅能给出步骤,还能生成对应的视频教程、推荐咖啡豆购买链接。这种 “内容 + 服务” 的一体化能力,让百度在 To C 场景中占据先机。网盘、文库、地图等国民级应用,几乎都用AI重新做了一遍,而且商业上的表现格外亮眼,是国内第一批找到PMF的AI产品。
此外,百度还在努力破圈,实现大模型的落地应用。比如, 在工业领域,百度与三一重工合作探索设备智能化维护。在政务场景中,百度依托文心大模型为 某地 区打造 “政务云脑”, 提升服务效率 等 。这家老牌大厂正持续发力,努力 为自己 在A I时代扳回 一 城。
除了以上四家大模型公司 ,国内AI 圈还有 一批极具潜力的“后浪”在奋力追赶,试图在基础模型或其核心能力上实现突破,成为下一个“ DeepSeek ”。
背靠清华大学知识工程实验室,智谱 AI 带着浓浓的 “学院派” 基因。它的 GLM 系列模型在中文问答、代码生成领域表现优异, 其所 坚持 的 “开源+ 闭源”双轮驱动 策略, 更是捷报频传。
开源方面, 智谱 2025 年大手笔开源 多款模型,吸引全球开发者挖掘潜在问题、贡献优化思 路,模型性能也因此 一路飙升; 闭源商业化 同样 风生水起,2024 年中标 32 个 政府及企业项目,揽金 1.29 亿元。在 金融、医疗、政务等 20 多个行业里,智谱的模型都成了核心生产力工具。
智谱的 发展如同它的定位 ,2G/2B 业务齐头并进,一边扎根政府项目, 助力数字政务升级; 一 边帮企业智能客服、智能办公,全方位提升效率, 让自己的生态更完整,发展 更稳健。
在多模态赛道尤其是音 视频领域, MiniMax 绝对是 不容忽视的 存在。 其自 研 的语音大模型能够生成媲美真人的、富有情感的语音,在社交、游戏、教育等场景有巨大潜力。在视频生成上 也同样出色 ,输入文字脚本,几秒钟就能渲染出特效 炫 酷、剧情紧凑的短视频,极大降低成本。 MiniMax 推出的AI社交应用“星野”、AI助手“海螺AI ”等产品,也展现了其将技术快速产品化的能力。
此外, 创始人闫俊杰 曾是商汤科技副总裁,对技术和商业都有着极为深刻理解。 在 当前 短 视频、直播带货火爆全网,对音频特效、视频内容自动化生产需求井喷的市场环境下, 带领 MiniMax 和各大短视频平台、音频内容创作社区深度合作,为创作者持续输送 “弹药”,在垂直赛道越跑越快 ,一骑绝尘 。
月之暗面专注长文本处理与数学推理,这堪称 知识密集型场景的硬核需求。 比如,在学术研究领域 ,长篇文献综述撰写,它能梳理海量文献脉络,精准提炼关键观点; 在 金融风控领域 , 又能靠它 分析长篇财务报告、挖掘隐藏风险点,给出量化评估建议。
Kimi 在数学推理等领域也展现出不俗的实力 , 其推出的 k0-math 数学推理模型在多个基准测试中表现优异,并 在中考、高考、考研及 MATH 等基础数学测试中的表现超越了 OpenAI 的 o1-mini 和 o1-preview 模型。
阶跃星辰 成立短短两年,就推出 22 款自 研 基座模型,其中 16 款多模态模型,占比超 7 成 ,被 称为 “多模态卷王” 。它坚持理解生成一体化路线,这种技术远见,完美契合当下 AI 从多模态融合迈向一体化的大趋势。 阶跃的 多模态模型 不仅 在国内外权威榜单上频频夺冠, 更是和产业界展开了深度融合,比如 和 OPPO 手机合作 “一键问屏” 功能, 用户长按手机 界面,就能智能检索屏幕内容相关信息;和智元机器人携手, 为具身机器人 装上 “智慧眼睛”,精准识别环境、灵活规划行动路径。
此外, 阶跃星辰 的商业化之路也走得非常扎实,比如 茶百道接入它家 Step-1V 多模态理解大模型 ,实现智能巡检、AIGC 营销,门店运营效率 大幅提升, 也 让 阶跃 星辰 收获了 更多 的 付费用户 。
从当年的“百模大战”,到后来的 “ A I六小虎 ”,再到如今 的 “新基模五强” ,为什么短短两三年的时间,就有那么多 红极一时的 A I企业,或出局或“ 泯 然众人矣” ?一个极为重要 原因 就 是: 有些企业 只懂烧钱做技术,不懂赚钱做商业。
如上文提到的, 大模型是资本密集型、人才密集型、数据密集型行业 。 但 仅仅有钱、有人、有数据,就能成功吗?未必。商业的本质是创造价值并获取价值。技术再先进,如果 不能转化为用户愿意买单的产品或服务,不能形成可持续的商业模式, 最终也只是昙花一现。这就像“必要条件”和“充分条件”的关系,钱、人、数据是必要条件,但成功的商业化才是充分条件。
所以 我们 会 看到,无论是 OpenAI 与微软的深度绑定,通过Azure 云服务 和Copilot系列产品变现;还是国内的阿里、百度、字节,依托自身的 云服务 和丰富应用场景推动大模型落地,都体现了“技术+场景+商业”的闭环逻辑。 而这也恰恰 暗合了 商业达尔文 主义:能活下来的一定是踩中 时代节奏 、满足市场刚需、 又能实现商业模式 自洽的企业 ,而不会是技术浪漫主义者,或A I理想主义者 。
最后 ,中国或许 真的 不需要几十上百家公司 , 都去 卷基础 大模型 。 这既不经济,也 不 高效。少数几家巨头在基础模型层面持续投入,提供稳定、强大、且成本可控的“AI底座” 就足够了。更多的创新和机会,应该在于应用层,在于如何利用 大模型,结合行业Know-how , 解决实际问题, 创造真正的商业价值。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
4人进8强 随着萨巴2-0、斯瓦泰克2-1 郑钦文死亡半区:2大苦主全赢
生于1992年的她,追求低级趣味,严重违反党的工作纪律、生活纪律,构成严重职务违法并涉嫌贪污犯罪
兰博基尼车主撇开代驾小哥酒驾进车库,却因赖账5元被举报,交警:吊销驾照并罚款
山东20254夏季合格考【地理/历史/化学/生物/信息技术】试题参考(附PDF下载)