对话王小川：“语言才是中轴，多模态不是主战场”

394 0 0

文章摘要

百川智能于1月13日正式开源新一代医疗大模型Baichuan-M3，该模型在全球权威医疗AI评测HealthBench中以65.1分的综合成绩位列第一，并在复杂决策能力测试HealthBench Hard上以44.4分夺冠。这一成绩首次在医疗领域实现对GPT-5.2的全面超越，同时以3.5%的幻觉率创下全球最低纪录。

Baichuan-M3的核心突破体现在三方面：强推理能力、低幻觉特性及端到端严肃问诊能力。通过升级强化学习系统，百川将半动态反馈机制演进为全动态Verifier System，使模型在复杂医学问题上的表现显著提升。在幻觉抑制方面，团队将医学事实一致性直接嵌入训练目标，重构了传统依赖外部工具的抑制范式。

端到端问诊能力是M3最具创新性的功能。传统模型需通过角色扮演模拟医生提问，而M3基于“SCAN原则”（安全分层、信息澄清、关联追问、规范化输出）实现了原生问诊逻辑的系统化。联合150多位医生开发的SCAN-bench评测体系，动态模拟从病史采集到确诊的全流程，结果显示其问诊能力已超过真人医生平均水平。

百川智能创始人王小川在沟通会上强调，医疗AI的未来增量在院外而非院内，核心是服务患者而非替代医生。他提出“医患权力让渡”理念，认为AI应帮助患者理解诊疗逻辑并参与决策。目前，搭载M3的医疗应用“百小应”已面向医患两端开放，支持问诊推演和医学知识普及。商业化路径上，百川计划通过To C服务包实现盈利，预计2026年上半年启动。

技术层面，王小川指出算法与评测体系比数据更重要。他反驳了“多模态是医疗AI主战场”的观点，认为语言模型才是智力核心，未来将发布医疗图像诊断模型作为补充。针对行业争议，他直言“数据至上”是伪命题，并举例Gemini的快速迭代证明技术驱动的可行性。

关于监管与责任边界，百川明确不触碰诊断红线，聚焦辅助决策和健康陪伴。王小川预判，随着AI明确自身能力边界，医患信任将逐步建立。团队正与儿童医院、肿瘤医院合作临床试验，并计划出海拓展市场。在病种覆盖上，优先布局儿科、慢病和肿瘤领域，目标是通过技术优势解决医疗资源分布不均问题。

（字数：798）