标签:自动化评测
AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品
蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个专病循证能力评测框架GAPS(Grounding, Adequacy, Perturbation, Safety),旨在解决现有医疗AI评...
评测也很酷,Data Agent 自动化评测的三层框架与实战
在大模型技术快速发展的背景下,数据领域的应用如数仓开发、ChatBI问数和深度分析Agent等显著提升了效率,但如何科学评估这些应用的效果成为行业难题。字节跳...




