把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录

AIGC动态2小时前发布 QbitAI
52 0 0
把医疗AI禁锢在严肃区间:百川M3 Plus首创“证据锚定”,幻觉率2.6%刷新全球纪录

 

文章摘要


【关 键 词】 AI医疗循证增强幻觉率证据锚定成本优化

百川智能最新发布的循证增强医疗大模型Baichuan-M3 Plus在医疗AI领域取得重要突破。该模型通过独创的六源循证技术,将幻觉率降低至2.6%,创下全球最低纪录。这一突破性进展为AI在严肃医疗场景中的应用提供了更可靠的技术支持。

降低幻觉率是医疗AI面临的核心挑战。百川智能通过Fact-Aware RL技术和Citation Reward Model的创新应用,在模型训练阶段就建立了对医学事实的硬性约束。M3 Plus在OpenAI医疗评测集HealthBench上的表现超越了GPT-5.2 High,其3.5%的原始幻觉率已经达到行业领先水平。而经过六源循证技术增强后,幻觉率进一步降至2.6%,低于部分人类医生的平均误判率。

证据锚定技术是M3 Plus的另一项重大创新。针对医疗大模型中常见的”张冠李戴”和”内容冲突”问题,该技术要求模型输出的每一句关键医学判断都必须能锚定到原始文献的具体段落。这种结构性约束将行业平均引用准确率从40-50%提升至95%以上,从根本上改变了传统”先生成后引用”的模式。医生现在可以直接核查AI结论的原始证据支持,大大提高了使用的可信度。

成本优化同样被纳入关键考量。通过MoE架构优化、模型量化和Gated Eagle-3投机解码等技术,M3 Plus的API调用成本较上一代降低了70%。这种成本控制使得该技术更具实际应用价值,为大规模推广奠定了基础。

百川智能同步推出了”海纳百川”免费计划。该计划向医疗服务机构永久免费开放M3 Plus的API,旨在推动医疗AI技术的普惠应用。公司预计若全国500万医学工作者都使用该服务,年投入成本约1亿元,但认为这种投入对于降低医疗试错成本是值得的。

这些技术进步最终将惠及普通患者。随着证据锚定等专业能力在真实临床场景中的验证应用,医疗AI的可靠性提升将转化为医生决策的底气,进而改善整体医疗服务质量。百川智能期待通过这些创新,让AI真正成为医生可信赖的助手。

原文和模型


【原文链接】 阅读原文 [ 2570字 | 11分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...