王小川直言医疗AI“假货泛滥”!百川新模型幻觉率低至2.6%,两周免费开放

Ai资讯2周前发布 大国Ai
208 0 0

摘要: 2026年1月22日,百川智能发布新一代循证增强医疗大模型Baichuan-M3 Plus,其医学事实性幻觉率降至2.6%,达到全球最低水平。该模型首创“证据锚定”技术,能将每一句医学结论精确对应到原始文献证据,匹配准确率超95%。百川智能CEO王小川在发布会上直言当前医疗AI领域“假的东西太多”,并宣布推出“海纳百川”计划,面向服务医务工作者的机构长期免费开放API,同时新模型在发布后两周内完全免费,旨在加速AI医疗在中国的普及与信任建立。


技术突破:从“六源循证”到“证据锚定”,构建可信医疗AI白盒

医疗大模型的“幻觉”问题,即生成虚假或不准确信息,一直是阻碍其临床落地的核心障碍。行业报告显示,当前大模型平均医学知识问答准确率仅为82%,输出内容中存在部分幻觉。在严肃的医疗场景中,任何错误推断都可能导致严重后果。

百川智能此次发布的Baichuan-M3 Plus,正是针对这一痛点进行了深度攻关。模型延续并深化了其独有的“六源循证范式”,即在训练和推理过程中,确保每一条建议都参考权威医学文献、临床指南、病例数据库、专家共识、药品说明书、医学影像等六类数据源,从源头保证建议的权威性。

王小川直言医疗AI“假货泛滥”!百川新模型幻觉率低至2.6%,两周免费开放

更关键的创新在于其首创的“证据锚定”技术。不同于行业中常见的简单列出参考文献,该技术通过引入独立的“引用奖励模型”,对错误或不匹配的引用进行明确惩罚,强制模型只能在“确实有证据支持”的空间中进行推理与生成。最终实现的效果是,模型生成的每一句医学结论,都能精确锚定到原始论文或指南中的具体证据段落,并可被直接定位和核验,结论与证据的匹配准确率超过95%。这相当于将AI的诊疗辅助过程从“黑箱”转变为“白盒”,极大增强了决策的透明度和可解释性,而这正是医疗AI获得医生信任的关键。

基于这些技术,M3 Plus在严肃医疗问答中的事实性幻觉率被降低至2.6%,不仅低于目前行业标杆Open Evidence,更相较GPT-5.2大幅下降超30%,达到了新的全球SOTA水平。

成本与普及:API价格降70%并长期免费,王小川称愿年“烧”1亿推动行业

技术突破之外,落地成本是另一个现实门槛。王小川认为,只有当成本足够低,AI才可能进入临床辅助和医学教学等高频场景。为此,百川在工程层面进行了大幅优化。

通过采用MoE(混合专家)架构、模型量化以及升级版的投机解码等技术手段,M3 Plus的API调用成本较上一代模型下降了70%。更为激进的是,百川宣布了“海纳百川”计划:将该循证增强医疗大模型以API形式,免费开放给所有中国的医疗服务机构,适用场景限定于临床辅助决策和医学教育。此外,新模型在发布后的两周内将完全免费向用户开放。

对于免费策略背后的考量,王小川算了一笔经济账:“要是全部临床医生都使用AI,我们觉得一年的成本也就是1亿左右。” 他进一步指出,中国有约500万医学工作者,推动AI普及所带来的行业变革价值远高于此成本。免费开放API的战略本质,是认识到直接向医院或医生收费的商业模式在中国难以成立,因此选择先推动普及率,从医生端逐步化解产品的信任问题。

行业反思:王小川回应热点争议,呼吁去伪存真良性竞争

发布会上,王小川不仅展示了技术,更对当前医疗AI行业的生态提出了尖锐批评。他直言,中国医生对AI工具的接纳度远低于美国(美国医生使用率达45%),并非因为模型能力不足,而是与国内医疗系统现状和行业风气有关。

一方面,中国医生工作强度极高,日均接诊量远超海外同行,导致“没有时间好好地使用和验证AI产品”。另一方面,他批评医疗AI领域“假的东西太多了”,缺乏求真的状态,真正有技术突破的产品反而难以快速建立信任。他呼吁行业应进行良性竞争,更真实地表达技术进展,否则就会充斥“皇帝的新衣”。

针对此前张文宏医生关于“拒绝在病历系统引入AI,担心影响年轻医生成长”的观点,王小川也做出了正面回应。他认为,患者利益应置于首位,现有“AI+医生”模式已在多个场景显示出优于单纯依靠医生的潜力。若因担忧影响医生成长而限制有益技术的应用,“本质上就是将当下的患者作为医生成长的成本”。他同时提出,如果担心医生能力退化,可以调整AI使用方式,例如让AI作为年轻医生的实时提醒与校验工具。

关于AI医疗的责任边界,王小川明确了当前合规路径:在医生使用时,AI可以给出诊疗建议供医生参考决策,最终责任由医生承担;但直接面向患者时,AI不能提供诊断结论,仅起辅助决策作用。这为医疗大模型的安全应用划定了红线。

未来展望:医疗AI落地加速,可信与实用成竞争关键

百川M3 Plus的发布,是近期医疗AI赛道热度攀升的一个缩影。国内外多家巨头和创业公司相继在此领域布局。然而,行业的共识正在形成:影响医疗AI落地的关键,远不止于模型性能参数。

如何构建像“证据锚定”这样的可信技术体系,打破“黑箱”;如何像“海纳百川”计划那样降低使用门槛,解决数据隐私与安全挑战;如何在与医院、医生的深度协作中打磨场景化应用(例如,有医院已利用AI实现手术全流程的智能化管理与辅助决策)——这些要素比单纯发布模型更为关键,也更考验企业的长期投入和产业理解。

王小川预测,能够进行表达、察言观色的AGI级别AI医生,有望在三年内实现。而当下,通过技术求真与生态共建,解决“幻觉”与“信任”难题,正是医疗AI从“可用”迈向“可靠”、从演示走向规模化价值兑现的必经之路。


文章来源:本文综合自百川智能新品发布会信息及公开报道,包括新京报、《科创板日报》、界面新闻等,并结合了行业关于医疗大模型幻觉、数据治理与伦理规范的相关讨论。

© 版权声明

相关文章

暂无评论

none
暂无评论...