摘要: 2026年6月22日,百川智能联合清华大学发布新一代医疗增强大模型Baichuan-M4,以68.6分登顶OpenAI医疗评测HealthBench全球第一,事实性幻觉率降至3.3%创行业新低。该模型在问诊、记忆、循证、调度四大临床核心能力上全面超越GPT-5.5、Claude Opus 4.7等国际顶尖模型,标志着AI医疗从”会答题”迈向”会看病”的关键跨越。本文深度解析百川M4的技术突破与行业意义。
2026年6月22日,百川智能与清华大学研究团队联合发布新一代医疗增强大模型Baichuan-M4,直接刷屏科技圈。这款模型在HealthBench及其Hard、Professional三个榜单上同时位列世界第一,全面超越GPT-5.5、Claude Opus 4.7、DeepSeek-V4-Pro。
具体成绩单相当亮眼:
HealthBench综合得分68.6分,领先第二名GPT-5.5超过10分
Hard子集领先15.9分,在最考验复杂临床决策的评测中断层领先
事实性幻觉率3.3%,全行业最低——同口径下GPT-5.5为3.8%、Claude Opus 4.7为6.9%、DeepSeek-V4-Pro高达9.8%