在近日举办的第二届 CCF 中国数据大会上,蚂蚁数科重磅宣布将开源其先进的数据智能体技术 ——Agentar SQL。这一技术的推出,让普通用户也能通过简单的日常语言来进行复杂的商业数据查询和分析,为企业的数字化转型提供了强有力的支持。
此次开源的首个产品是实时文本转结构化查询语言(Text-to-SQL)框架,旨在帮助开发者快速搭建数据查询方案,显著提升文本与数据库的交互效率。未来,蚂蚁数科还将陆续推出涵盖数据库理解、行业知识挖掘及实时多轮交互等多项技术,全面提升数据处理能力。
在某领先的城市商业银行试运营期间,Agentar SQL 的多个工具显示出超过92% 的查询准确率,比传统方案提升了超过三倍。更令人惊喜的是,蚂蚁数科的智能体技术在全球权威的自然语言转 SQL 评测基准 BIRD-SQL 中名列前茅,超越了 Google 等国际巨头,成为行业领跑者。

BIRD-SQL 评测的难度不容小觑,其数据集涵盖金融、电力和医疗等37个真实场景,任务复杂且数据量庞大,令其成为全球最具挑战性的 NL2SQL 测试之一。研究机构预计,到2025年,全球商业智能市场规模将达到474.8亿美元,而中国的市场也将迅速扩大,预计到2028年将达到17.9亿美元,年复合增长率将达到12.7%。
蚂蚁数科的技术负责人章鹏在大会上指出,NL2SQL 在实际应用中面临着理解人类口语模糊性、整合行业专业知识、解析复杂数据库结构以及生成准确 SQL 语句等多重挑战。因此,仅仅依靠简单的模型是远远不够的。
章鹏强调,要真正实现产业可用的 NL2SQL 及数据智能体技术,必须建立完整的能力体系。这包括对数据库的深入理解、智能体与用户的有效交互以及自我进化的能力。蚂蚁数科计划在未来不断开源更全面的能力模块,进一步推动智能数据分析的普及。
Agentar-Scale-SQL 的开源内容已经在 arXiv、GitHub 等多个平台发布,受到了开发者的广泛关注。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则