开云体育
DeepSeek登上医学顶刊:两篇Nature Medicine论文评估DpSk在医疗领域开云APP下载
2025 年 1 月 20 日,中国杭州的初创公司深度求索(DeepSeek)发布了一款大语言模型(LLM)——DeepSeek-R1,这是一个部分开源(训练数据未公开,因此并非完全开源)的“推理”模型,其能够以与 OpenAI 于 2024 年年底发布的最先进的专注于“推理”的大语言模型 ChatGPT-o1 相近的水平解决一些科学问题。
更重要的是,DeepSeek-R1 的训练成本远低于美国科技巨头们开发的主流大语言模型,DeepSeek-R1 的高性能与超低成本引起了全世界科学界的惊叹。
DeepSeek 是一款新推出的大语言模型(LLM),旨在提升推理能力,但其在医疗领域的表现尚未得到评估。
在这项研究中,西奈山伊坎医学院 Xueyan Mei 团队等评估了三款大型语言模型——DeepSeek-R1、ChatGPT-o1 和 Llama 3.1-405B 在执行四项不同医疗任务方面的能力:回答美国医师执照考试(USMLE)中的问题、基于文本的诊断和管理案例进行解读和推理、根据 RECIST 1.1 标准对肿瘤进行分类,以及对多模态的诊断影像报告进行总结。
总的来说,这项研究突显了 DeepSeek-R1 大语言模型在医疗应用方面的潜力,并指出了一些需要改进的地方。
大语言模型(LLM)正在不断改变医疗应用领域。然而,像 ChatGPT-4o 这样的专有模型在临床应用方面面临重大障碍,因为它们无法在医疗机构内部署,从而不符合严格的隐私法规。
近期,诸如 DeepSeek 之类的开源大语言模型取得的进展提供了一个很有前景的替代方案,因为它们能够在拥有先进信息技术基础设施的医院里,对本地数据进行高效的微调。
通过涵盖常见和罕见疾病的 125 个具有充分统计效力的患者病例,研究团队发现,DeepSeek 的表现与专有的大型语言模型相当,在某些情况下甚至更优。
这项研究表明,开源的大言模型能够提供一条可扩展的途径,用于安全的模型训练,从而在符合数据隐私和医疗保健法规的前提下,实现现实世界中的医疗应用。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。