开云体育

18岁中国少年一战封神!英伟达市值蒸发4万亿他才是幕后操控者开云体育

2025-11-18
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!世界顶级科学期刊《Nature》的封面上首次出现了一篇关于大模型的论文,而作者栏中一个名字的通信地址赫然标注着“上海建平中学”。

  18岁的涂津豪,以高中生的身份参与研发的DeepSeek-R1模型,不仅登上了学术巅峰,更掀起了一场全球AI行业的巨浪。

  涂津豪的成长轨迹颠覆了传统“学霸”的叙事。 在上海建平中学国际部,他的成绩并不突出,身边围绕着众多天才学生,但他对AI的兴趣从高中阶段就开始萌芽。

  建平中学开设的人工智能课程和AP课程,为他的探索提供了土壤。 数学综合实践课采用AI辅助教学,帮助学生进行数学建模和工程设计,这让他开始深入思考AI的工作路径。

  2024年,涂津豪迎来了第一个爆发点。 在阿里巴巴全球数学竞赛AI赛道中,他孤身一人击败了562支队伍,包括清华、北大等顶尖高校和字节跳动等科技巨头的团队。

  他的获胜策略让业内专家震惊:当其他团队让AI单打独斗时,他创建了一支“AI辩论队”。

  他让一个AI模型扮演“提议者”生成解题思路,另外几个AI模型充当“评审员”进行多轮质疑和挑刺。 方案需要经过反复修改,直到所有“评审员”找不到漏洞才能通过。

  这种方法后来被他命名为“Thinking Claude”,其核心是让AI模型之间进行多轮“自问-自答-自验证”,通过80多次迭代优化寻找最优解。

  涂津豪对AI的理解远超过同龄人。 在他看来,AI不应该只是一个搜索引擎,而应该具备独立思考的能力。 这种理念促使他开始研究如何让AI展现出更接近人类的推理过程。

  他的突破来自对OpenAI o1模型的深入分析。 涂津豪发现,在o1前时代,思维链与人类真正想要的思考过程存在较大差距,模型只是模仿预训练中看到的推理路径。 而在o1后时代,思维链发生了变化,更接近人类思考时的“意识流”。

  于是,他写出了第一版思维链提示词,然后将其输入Claude,让模型自行思考改进方案。 经过80多次迭代优化,甚至用完了Team版账号的对话额度,最终打造出了“Thinking Claude”。

  这一提示词让Claude 3.5展现出类似o1模型的思维链能力,在GitHub上开源后迅速斩获1.5万星。

  业内评价称,其展现的深度推理能力几乎可与OpenAI秘密研发的o1模型抗衡。 更令人惊讶的是,OpenAI工程师团队耗费大量资源研发的技术,被一个18岁少年通过提示词工程实现了类似效果。

  2025年初,涂津豪获得了在DeepSeek实习两个月的机会,恰逢团队正在研发推理模型R1。 尽管实习时间短暂,但他的贡献却至关重要。

  他将自己研发的思维链方法融入奖励机制,显著提升了模型的推理准确性。 最终开源的DeepSeek-R1仅花费30万美元,使用的是低端显卡,性能却堪比那些耗资千万的项目。

  英国《金融时报》指出,DeepSeek挑战了人工智能产业的核心信念,即更强大的硬件才是推动人工智能发展的关键。

  摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek展示了一条高效训练的新途径。

  DeepSeek-R1的API服务定价为每百万tokens仅需1元,成本约等于Llama 3-70B的七分之一,GPT-4 Turbo的七十分之一。 这种极致的成本控制能力,让全球科技界震惊。

  这篇论文的技术细节显示,R1在训练过程中实验了三种技术路径:直接强化学习、多阶段渐进训练和模型蒸馏。 其中R1首次证明了直接强化学习的有效性。

  这就像面对同一道题目,大模型同时多次进行回答,系统给每个答案打分,依照“高分奖励低分惩罚”的逻辑循环,最终得出更具优势的推理路径。

  在国外大模型排名榜单Arena最新测评中,R1在全类别大模型中排名第三,在风格控制分类中与OpenAI o1并列第一。

  DeepSeek-R1的横空出世对全球科技格局产生了立竿见影的影响。 在硅谷,几乎每个人都在谈论DeepSeek。

  最直接的影响体现在资本市场。 DeepSeek-R1正式上线后,英伟达等美国科技公司市值单日蒸发约4万亿美元。

  这一现象背后的逻辑很清晰:DeepSeek证明,通过算法优化而非单纯依赖算力堆砌,同样可以达到顶尖性能。

  加利福尼亚大学伯克利分校教授亚历克斯·迪马基评价,DeepSeek的技术路线揭示了达到顶尖性能未必需要天文数字投入,“这对硅谷的烧钱竞赛无异于釜底抽薪”。

  ChatGPT据报道需要1万台英伟达的图像处理器处理训练数据,而DeepSeek称仅用2000台图像处理器就取得了类似结果。

  扎克伯格在一档播客节目中坦言,DeepSeek技术非常先进。 他表示,中国“正在全力冲刺”,担心这个开源模型会被全世界广泛使用,影响到美国科技行业的领先地位。

  DeepSeek采取的开源策略,可能是其对行业最深远的影响。 通过开放技术细节和训练方法,DeepSeek为全球研究者赋能。 英伟达资深科学家吉姆·范称赞DeepSeek是“非美国公司践行OpenAI初心”的典范。

  高盛集团认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。

  这种开源模式也面临着挑战。 如何保护知识产权和维护开源社区秩序是需要解决的问题。

  但不可否认的是,DeepSeek的成功代表了一种全新的发展方向,通过算法优化而非单纯依赖算力和数据量来提升模型性能。

  高中毕业后,涂津豪没有选择常春藤名校,而是前往威斯康星大学麦迪逊分校深造。 这个选择体现了他对AI研究的独特理解。

  威斯康星大学麦迪逊分校在逻辑验证系统领域全美第一,数据库、编程语言、操作系统等AI底层核心领域也都排名全美前三。该校实验室24小时对本科生开放,为像他这样的学生提供了无限探索可能。

  涂津豪的成长轨迹几乎涵盖中国AI产业所有关键节点:从阿里巴巴全球数学竞赛夺冠,到DeepSeek核心研究,再到腾讯混元实习。 他的成功证明,在AI领域,天赋和热情比传统学历背景更加重要。

  如果答案是肯定的,未来AI创新是会更加民主化,还是会导致新一轮的垄断与割裂?热点观察家返回搜狐,查看更多

搜索