技术博客
衡石技术博客是一个围绕数据分析和BI领域提供丰富实用的技术文章、案例分析和实战经验的博客平台。

免费试用

全部

帮助手册

API文档

课堂中心

技术博客

白皮书

NL2SQL 与 NL2DSL 的技术对比:衡石科技 ChatBI 如何通过 DeepSeek 实现高效落地
作者:HENGSHI 时间:2025-02-27

在 ChatBI(基于自然语言交互的商业智能)的技术实现中,如何将用户的自然语言查询转化为结构化的数据查询语句是一个核心问题。目前,行业内主要有两种技术路线:NL2SQL(自然语言到 SQL)和 NL2DSL(自然语言到领域特定语言)。这两种技术路线各有优劣,但在实际落地中,衡石科技选择了 NL2DSL 作为 ChatBI 的实现方案,并通过 DeepSeek 大模型的技术优势,进一步优化了 NL2DSL 的实现路径。本文将从技术路线的角度,对比 NL2SQL 和 NL2DSL 的优劣,并结合衡石科技的实际经验,探讨为何 NL2DSL 成为 ChatBI 落地的优选方案。


一、NL2SQL 与 NL2DSL 的技术原理对比


  1. NL2SQL 的技术原理

NL2SQL 是一种直接将自然语言查询转化为 SQL 语句的技术。用户输入的自然语言问题会被大模型解析并生成相应的 SQL 查询语句,然后直接在数据库上执行。这种技术路线的优势在于,SQL 是一种通用的数据库查询语言,能够覆盖大多数数据查询场景。然而,NL2SQL 的实现路径较为复杂,需要大模型完成从自然语言到 SQL 的完整转换,包括表名、字段名、条件语句等的识别和生成。

  1. NL2DSL 的技术原理

NL2DSL 是一种将自然语言查询转化为领域特定语言(DSL)的技术。与 NL2SQL 不同,NL2DSL 不需要大模型直接生成 SQL 语句,而是将用户的问题转化为一种结构化的查询语言(如衡石科技自研的 HengshiQL),然后由 BI 平台根据 DSL 生成最终的查询语句。这种技术路线的优势在于,DSL 通常比 SQL 更加简洁,且能够更好地与 BI 平台的能力结合。

  1. 衡石科技的选择

衡石科技在 ChatBI 的技术实现中选择了 NL2DSL 作为优选方案。这一选择主要基于以下原因:

  • 准确率高:NL2DSL 只需要大模型完成自然语言到结构化查询的转换,其余步骤由 BI 平台完成,能够大幅提升查询的准确率。

  • 维护成本低:NL2DSL 不需要额外维护复杂的知识库文档,BI 平台在使用过程中已经自然沉淀了数据表的关联模型和指标库。

  • 性能优化:NL2DSL 的实现路径更加简洁,能够显著提升查询性能。


二、衡石科技如何通过 DeepSeek 优化 NL2DSL 的实现路径


  1. DeepSeek 的语义理解能力

DeepSeek 作为国内领先的大模型技术提供商,在自然语言处理方面具有显著优势。DeepSeek 能够准确理解用户的查询意图,并将其转化为结构化的 DSL 查询语句。例如,当用户提问“上个月销售额最高的产品是什么?”时,DeepSeek 能够准确识别“上个月”“销售额”“最高”等关键信息,并生成相应的 DSL 查询语句。

  1. HengshiQL 的语义层能力

衡石科技自研的 HengshiQL 是一种类似于微软 PowerBI DAX 的领域特定语言,具有简洁而强大的表达能力。通过将 DeepSeek 的语义理解能力与 HengshiQL 的语义层能力结合,衡石科技成功构建了一个高效、准确的 NL2DSL 实现路径。例如,在复杂的查询场景中,HengshiQL 能够将用户的问题拆解为多个子查询,并通过 BI 平台的能力生成最终的查询结果。

  1. 性能优化

在性能优化方面,衡石科技采用了固定 Workflow+Agent 兜底的技术框架。固定 Workflow 用于解决预设的数据查询场景,保证系统的准确性和可控性;Agent 则用于处理用户随机的、预设之外的问题,提升系统的自适应能力。通过这一框架,衡石科技成功平衡了 NL2DSL 的性能和灵活性。


三、NL2DSL 的优势:DeepSeek 如何提升准确率和性能


  1. 准确率的提升

NL2DSL 的优势在于,大模型只需要完成自然语言到结构化查询的转换,其余步骤由 BI 平台完成。这种分工明确的实现路径,能够大幅提升查询的准确率。例如,在衡石科技的 ChatBI 中,DeepSeek 只需要将用户的问题转化为 DSL 查询语句,BI 平台则根据 DSL 生成最终的查询结果。这种实现方式避免了 NL2SQL 中复杂的转换过程,显著降低了错误率。

  1. 性能的提升

NL2DSL 的实现路径更加简洁,能够显著提升查询性能。例如,在衡石科技的 ChatBI 中,用户的问题通常可以在几秒内得到响应,而 NL2SQL 的实现路径由于涉及复杂的转换过程,响应时间通常较长。此外,DeepSeek 的高性能特点,进一步提升了 NL2DSL 的查询效率。

  1. 维护成本的降低

NL2DSL 不需要额外维护复杂的知识库文档,BI 平台在使用过程中已经自然沉淀了数据表的关联模型和指标库。这种实现方式不仅降低了维护成本,还提升了系统的可扩展性。


四、未来技术优化方向:DeepSeek 如何进一步提升 NL2DSL 的表达能力


  1. 推理模型与混合专家模型的结合

未来,衡石科技计划通过推理模型与混合专家模型的结合,进一步提升 NL2DSL 的表达能力。例如,在处理复杂的数据分析问题时,系统可以通过推理模型进行问题拆解,并通过混合专家模型快速生成查询结果。这种多模型协作的方式,将进一步提升 NL2DSL 的性能和准确性。

  1. 动态知识库的引入

为了应对更复杂的业务场景,衡石科技计划引入动态知识库,进一步提升 NL2DSL 的表达能力。例如,在营销分析场景中,系统可以根据用户的查询意图,动态调用相关的营销知识库,生成更加精准的查询结果。

  1. 场景化优化

未来,衡石科技将针对不同的业务场景,进一步优化 NL2DSL 的实现路径。例如,在金融场景中,系统可以根据用户的查询意图,动态调用相关的金融知识库,生成更加精准的查询结果。


结语


通过 NL2DSL 的技术路线和 DeepSeek 的技术支持,衡石科技成功实现了 ChatBI 的高效落地。未来,随着推理模型与混合专家模型的结合,以及动态知识库的引入,NL2DSL 的表达能力将进一步提升,为 ChatBI 在更复杂业务场景中的应用提供强有力的支持。衡石科技将继续引领 BI+AI 的技术革新,为企业数据智能化的未来开辟新的可能性。


衡石注册banner.jpg


丰富的资源 完整的生态
邀您成为衡石伙伴

电话咨询:15810120570

公司邮箱:hi@hengshi.com

北京市海淀区西小口路66号中关村东升科技园B-2楼A301室

上海市黄浦区延安东路550号海洋大厦29楼2903室

广东省深圳市光明区光源五路宝新科技园4栋707号

扫码关注