低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!

AI-Agent2个月前发布 QbitAI
460 0 0
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!

 

文章摘要


【关 键 词】 开源国产AISQL榜单数据智能金融科技

蚂蚁数科正式开源数据智能体关键技术Agentar-SQL系列,这一技术已在全球权威的BIRD-Bench NL2SQL评测基准上以81.67%的执行准确率和77%的执行效率双料登顶,超越了谷歌、亚马逊等国际科技巨头。此次开源不仅包含实时文本转SQL框架的全套资源,后期还将陆续开源数据库理解与挖掘、行业知识挖掘等关键技术,覆盖从意图理解到数据理解的全链路能力。

自然语言转SQL在实际落地中面临四大挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂SQL语句。蚂蚁数科的解决方案通过系统化工程方法,让AI真正赋能生产,在某头部城商行试运营期间,其工具的平均查询准确率超92%,较传统方案提升超3倍。

蚂蚁数科的AI发展路径与众不同,其CEO赵闻飙强调AI的真正价值在于深入产业一线解决实际问题。团队选择从金融行业这一数据门槛最高、合规要求最严的领域切入,克服了数据孤岛化、业务逻辑严谨和合规要求苛刻等挑战。最新数据显示,蚂蚁数科的服务已覆盖100%的国有股份制银行和超60%的地方性商业银行,并跻身IDC中国智能体开发平台领导者象限。

在宁波银行,蚂蚁数科的智能化决策系统打破了传统金融服务的知识孤岛,复杂问题回答准确率从68%跃升至91%,响应速度进入百毫秒级。上海银行推出的AI手机银行则以对话即服务为核心,重构了用户体验。这些成功实践为蚂蚁数科积累了可迁移的产业AI方法论,其能力已向城市交通、能源等领域延伸。

蚂蚁数科在商业模式上采取了按效果付费的创新方式,降低了中小机构应用AI的门槛和风险。截至今年,公司已与300家合作伙伴建立深度合作,共同服务超13000家终端客户。其技术方案还获得了国际市场的认可,服务了超百家海外金融机构,并入选香港金融管理局生成式AI沙盒项目。

原文和模型


【原文链接】 阅读原文 [ 2752字 | 12分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...