对话王小川:“语言才是中轴,多模态不是主战场”

AIGC动态2小时前发布 TMTPOSTAGI
55 0 0
对话王小川:“语言才是中轴,多模态不是主战场”

 

文章摘要


【关 键 词】 医疗大模型开源技术AI问诊低幻觉强化学习

百川智能于1月13日正式开源新一代医疗大模型Baichuan-M3,该模型在全球权威医疗AI评测HealthBench中以65.1分的综合成绩位列第一,并在复杂决策能力测试HealthBench Hard上以44.4分夺冠。这一成绩首次在医疗领域实现对GPT-5.2的全面超越,同时以3.5%的幻觉率创下全球最低纪录。

Baichuan-M3的核心突破体现在三方面:强推理能力、低幻觉特性及端到端严肃问诊能力。通过升级强化学习系统,百川将半动态反馈机制演进为全动态Verifier System,使模型在复杂医学问题上的表现显著提升。在幻觉抑制方面,团队将医学事实一致性直接嵌入训练目标,重构了传统依赖外部工具的抑制范式。

端到端问诊能力是M3最具创新性的功能。传统模型需通过角色扮演模拟医生提问,而M3基于“SCAN原则”(安全分层、信息澄清、关联追问、规范化输出)实现了原生问诊逻辑的系统化。联合150多位医生开发的SCAN-bench评测体系,动态模拟从病史采集到确诊的全流程,结果显示其问诊能力已超过真人医生平均水平。

百川智能创始人王小川在沟通会上强调,医疗AI的未来增量在院外而非院内,核心是服务患者而非替代医生。他提出“医患权力让渡”理念,认为AI应帮助患者理解诊疗逻辑并参与决策。目前,搭载M3的医疗应用“百小应”已面向医患两端开放,支持问诊推演和医学知识普及。商业化路径上,百川计划通过To C服务包实现盈利,预计2026年上半年启动。

技术层面,王小川指出算法与评测体系比数据更重要。他反驳了“多模态是医疗AI主战场”的观点,认为语言模型才是智力核心,未来将发布医疗图像诊断模型作为补充。针对行业争议,他直言“数据至上”是伪命题,并举例Gemini的快速迭代证明技术驱动的可行性。

关于监管与责任边界,百川明确不触碰诊断红线,聚焦辅助决策和健康陪伴。王小川预判,随着AI明确自身能力边界,医患信任将逐步建立。团队正与儿童医院、肿瘤医院合作临床试验,并计划出海拓展市场。在病种覆盖上,优先布局儿科、慢病和肿瘤领域,目标是通过技术优势解决医疗资源分布不均问题。

(字数:798)

原文和模型


【原文链接】 阅读原文 [ 9261字 | 38分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...