想象一下,一位对SQL语法一窍不通的市场专员,对着电脑输入一句“上个月华东区销量最高的产品是什么”,下一秒,系统就自动从庞大的企业数据库中精准抓取出结果。
这个过去看似“科幻”的场景,正随着一项关键技术的开源,加速走进现实。在第二届CCF中国数据大会上,蚂蚁集团旗下蚂蚁数科宣布,正式开源其数据智能体核心Agentar SQL的全套论文、代码、模型及使用指南。
简单来说,这次开源的核心是Text-to-SQL(文本转SQL)框架。它好比一个高级“翻译官”,能将业务人员用日常语言提出的问题,自动翻译成数据库能读懂的精密查询指令。这意味着,企业数据查询与分析的门槛被大幅降低,非技术背景的员工也能直接与数据对话,为企业数智化转型提供了一个更易用、更精准的智能基座。
商业世界里,数据驱动的决策往往意味着先机与利润。但数据沉睡在复杂的数据库中,调用它需要专业的“钥匙”——这正是许多企业数字化转型的痛点。蚂蚁数科此次将钥匙模版公开,无疑在拥挤的AI赛道中抛出了一枚“技术深水炸弹”。
其技术实力已有权威背书。今年9月25日,基于该技术的Agentar-Scale-SQL模型,在自然语言转SQL领域的国际顶级评测基准BIRD-SQL中登顶,超越了包括Google在内的众多国内外厂商。更值得注意的是,截至目前,该模型已在执行准确率与执行效率双榜上保持了超过两个月的全球第一位置。
光有榜单成绩还不够,实战才是试金石。据报道,在某头部城市商业银行的试运营中,Agentar SQL系列工具的平均查询准确率超过92%,相比传统查询方案提升了3倍以上。这样的表现,让技术从实验室论文走向真实业务场景具备了更强的说服力。
蚂蚁数科的开源并非“一锤子买卖”,而是一个分阶段的路线图。根据计划,2026年,该公司还将陆续开源数据库理解与挖掘、行业知识挖掘及实时多轮交互等技术框架,目标是构建覆盖从意图理解、业务理解到数据理解的全链路智能数据能力。
此举的商业意图颇为清晰:通过开源核心底层技术,吸引广大开发者和企业构建生态,共同做大“让数据更易用”的市场蛋糕。当基于Agentar SQL的应用在各个行业遍地开花时,蚂蚁数科在标准制定与生态影响力上的话语权也将随之巩固。这步棋,着眼的不只是当下,更是未来智能数据服务的整个棋盘。
当普通人用母语指挥数据库的时代加速到来,商业决策的节奏将被重新定义。而这次开源,或许正是那个关键的推动器。
