
在医疗AI领域,百川智能再次用技术打破边界,将医疗大模型的幻觉率压低至2.6%,并首创“证据锚定”技术,让AI的每一句医学判断都能被精确溯源。
2026年1月22日,百川智能正式发布新一代循证增强医疗大模型Baichuan-M3 Plus。这款模型在严肃医疗场景下的问答准确性与可靠性方面取得突破性进展,其事实性幻觉率降至2.6%,刷新了此前由M3模型刚刚创造的世界纪录,较GPT-5.2的同类指标大幅下降超过30%,并在关键指标上超越行业标杆OpenEvidencesohu.com+1。
官网入口与联系方式
- 官网:https://www.baichuan-ai.com
- 模型体验:开发者可申请限时15天的免费体验
- 合作申请:医疗机构可通过“海纳百川计划”申请长期免费使用
一、核心技术突破:从“说像不像”到“查是不是”
医疗大模型的核心价值不在于生成流畅的文字,而在于提供真实可靠的医学判断。Baichuan-M3 Plus通过两大技术创新,解决了医疗AI长期存在的“幻觉”与“不可信”问题。
1. 全球最低幻觉率:2.6%的精准度
- 六源循证技术:百川将M2 Plus模型已验证有效的六源循证范式,引入模型训练和推理过程,确保模型的每条建议都有专业医学证据支持。最终,M3 Plus的事实性幻觉降低到新的SOTA,仅2.6%,相较GPT-5.2大幅下降超30%sohu.com+1。
- Fact-Aware RL强化学习范式:M3首创的这项技术使底座模型在无工具的设定下,幻觉也能大幅降低到SOTA水平。通过将医学事实一致性作为核心训练目标之一,模型学会了“知之为知之,不知为不知”html5.qq.com。
2. 证据锚定技术:每句话都能精确溯源
当前行业中,大多数医疗AI支持“文献引用”,但存在两大问题:
- “张冠李戴”:引用编号存在,但文献内容对不上
- “内容冲突”:文献本身正确,但被引用的段落与结论并不匹配,甚至存在拼接、误读
Baichuan-M3 Plus首创的“证据锚定(Evidence Anchoring)”技术要求模型生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落。每一句判断,都能被逐字溯源、逐条核验sohu.com+1。
二、产品优势与性能表现
1. 性能对比:M3 Plus vs 主流模型
| 指标 | Baichuan-M3 Plus | GPT-5.2 | Open Evidence | 行业平均水平 |
|---|---|---|---|---|
| 幻觉率 | 2.6% | ~3.8% | ~3.5% | 5%-10% |
| 证据匹配准确率 | >95% | 未知 | 未知 | 40%-50% |
| API调用成本 | 较前代降低70% | 较高 | 较高 | 较高 |
| 开源状态 | 部分开源(M3) | 闭源 | 闭源 | 多为闭源 |
2. 实际应用场景
- 临床辅助决策:为医生提供实时、可核验的诊疗建议,减少误诊漏诊风险
- 医学教育:作为教学工具,帮助医学生和年轻医生理解医学证据链
- 患者咨询:为患者提供基于权威证据的健康信息,避免盲目网络搜索sina.com.cn+1
三、商业模式与行业影响
1. “海纳百川计划”:免费开放给医疗机构
百川智能宣布推出“海纳百川”计划,将全球最低幻觉的循证增强医疗大模型以API形式,免费开放给中国医疗服务机构。这项服务的成本最高可能达到1亿元左右sohu.com+1。
同时,M3 Plus的API调用成本较上一代模型大幅降低70%,所有开发者可申请限时15天的免费体验sohu.com+1。这一策略有望加速医疗AI的普及应用。
2. 对行业的影响
- 提升医疗AI可信度:通过技术手段解决医疗AI的“信任危机”,推动AI真正融入临床工作流
- 促进行业标准化:“证据锚定”技术可能成为医疗AI领域的新标准,推动行业向更加透明、可验证的方向发展
- 降低应用门槛:大幅降低的调用成本和免费开放策略,让更多医疗机构能够使用先进的AI技术
四、独特见解与深度分析
1. 医疗AI的核心不是“像”,而是“是”
百川智能创始人兼CEO王小川在媒体沟通会上直言:“假的东西太多了”,真正有技术突破的产品反而难以快速建立信任qq.com。当前医疗AI领域存在大量“看似专业”的幻觉,表面看来专业性强,引用了论文、指南、药品说明书等来源,但实际内容错误率可能高达90%qq.com。
这种“看似专业”的幻觉,对于经验尚浅的医生或普通用户而言,潜藏的风险更为显著。M3 Plus通过“证据锚定”技术,将医疗AI从“说像不像医生”真正转向“查是不是正确”。
2. AI与医生的关系:协作而非替代
针对张文宏教授“拒绝在病历系统中引入AI、担心影响年轻医生成长”的观点,王小川做出了全面回应。他认为,患者利益应置于首位,当前“AI+医生”模式已显示出优于单纯依靠医生的潜力,符合医学发展规律qq.com。
“医生的成长不能以当下的患者作为成本。”医生也有幻觉,而目前AI的幻觉率其实比医生更低。在应用方法上,若担心医生能力因AI而退化,可调整使用方式,例如让AI辅助年轻医生,在诊疗过程中提供实时提醒与校验qq.com。
3. 技术突破背后的团队构成
百川与其它通用大模型公司的一个核心区别是,他们拥有一支专业的专职医生团队。这个团队的成员拥有丰富的一线医疗经验,有曾在国内三甲医院任职的医生以全职身份加入百川,此外百川还与合作的医院建立了深度协作,有医生长期驻场,提供医学指导qq.com。
这种“工程师+医生”的复合团队结构,是百川能够深入理解医疗场景需求、开发出真正符合临床要求的AI产品的关键。
五、常见问题解答
Q1:Baichuan-M3 Plus与之前的M3模型有何不同?
A:M3 Plus在M3的基础上进一步降低了幻觉率,从3.5%降至2.6%,并首创了“证据锚定”技术,使结论与证据的匹配准确率超过95%。同时,M3 Plus的API调用成本较前代模型降低了70%sohu.com+1。
Q2:“证据锚定”技术如何保证医学结论的准确性?
A:“证据锚定”技术要求模型生成的每句医学结论都必须精确对应到原始论文或指南的具体证据段落。百川将“证据锚定”作为独立训练目标,引入Citation Reward Model,对错误引用进行明确惩罚,让模型只能在“确实有证据支持”的空间中推理与生成eastmoney.com。
Q3:医疗机构如何申请使用M3 Plus的免费API?
A:医疗机构可以通过百川智能官网的“海纳百川”计划申请长期免费使用。百川智能将面向所有为医务工作者提供服务的机构免费开放M3 Plus的API接口sina.com.cn+1。
Q4:M3 Plus是否完全开源?
A:M3 Plus本身并未开源,但百川智能已于1月13日开源了其基座模型Baichuan-M3,该模型在HealthBench中位列全球第一,表现超越了OpenAI最强模型html5.qq.com。开发者可以在Hugging Face和GitHub上获取M3的开源代码和模型权重。
随着Baichuan-M3 Plus的发布,医疗AI正在从“可用”走向“可信”。通过将幻觉率压低至2.6%并首创“证据锚定”技术,百川智能为医疗AI树立了新的标杆。这不仅是一次技术突破,更是对整个医疗AI行业的一次深刻变革——让AI真正成为医生可信赖的助手,让患者能够安心地依赖AI提供的健康建议。
数据评估
本站大国Ai提供的Baichuan-M3 Plus都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由大国Ai实际控制,在2026年1月23日 下午5:07收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,大国Ai不承担任何责任。
相关导航


GPT‑5.1

ChatGPT Pulse:AI如何从被动应答转向主动关怀?

GLM-4.5

Claude 4.1

GPT-4o

GPT-OSS

