对话帆软：大模型不是BI的“全能药”，BI也不是大模型的“低垂果实”

09-06 318阅读 0评论

脑子一热花几百万买个大模型，却看不到有什么事务价值，这或许是过早投入大模型的价值。

大模型厂商期望快速完成大模型商业化，必定要打造一批标杆场景和用例，让企业客户看到真实价值并为之买单。作为一家大数据BI（商业智能）和剖析渠道供给商，帆软很快就进入到了大模型厂商和企业客户的视野。

“咱们第一个想到的是常识库，第二个或许便是BI，企业客户提了许多需求，相似杂乱报表、BI等事务场景，大模型厂商自己搞不定，这也是为什么许多国内国外的头部大模型，都会自动来找帆软协作去打造场景。”帆软FineChatBI负责人翁林君表明。

实践上，这并不是AI第一次“侵略”BI，但却或许是影响最大、最深远的一次，在帆软看来，生成式 AI 的快速开展为 BI 产品带来了巨大的技能盈利，帆软坚持AI for BI 而不是 AI + BI。

“BI范畴必定不止于大模型，还涉及到数据衔接、图表烘托、核算引擎、权限办理等各种根底才能，没有大模型之前，BI也在用机器学习去处理一些问题，仅仅大模型是一个增强版的AI技能。别的，假如底层数据脏乱差，AI也很难用起来，数据办理很重要，外表是大模型，冰山之下是数据办理。”翁林君说。

大模型不是BI的“全能药”，BI也不是大模型的“低垂果实”。梦想大模型能一会儿改动BI产品的中心逻辑，以及BI很简单就可以被大模型塑造成标杆场景，都是不切实践的主意。

大模型之前，AI与BI的纠葛

迄今为止，BI产品的演进大致阅历了传统BI、灵敏BI、增强BI的进程。“传统BI”产品起源于上世纪八九十年代，代表性技能包含 SQL、OLAP 数据可视化等，用户的运用门槛十分高，能把 BI 用好的都是 DBA 和 MBA 的结合体，在一个企业界的占比不到1%。

随后，数据可视化技能VizQL 的出现，让一部分懂 OLAP 数据模型，一起具有必定的数据思维和事务了解的剖析师和事务部门的数据 BP 可以用“灵敏 BI”产品做自助剖析，用户的浸透率大幅提高到10%左右。

紧接着机器学习、深度学习等AI技能，从学术界蔓延至工业界，咨询机构Gartner 把该阶段的 BI 产品叫做“增强 BI”，中心理念是用 AI 技能去增强 BI 产品的才能，业界开端测验用这些技能去进一步下降 BI 产品的运用门槛，催生了前期的检索式/对话式 BI 产品。

帆软关于AI的情绪一直不温不火，此前也较少谈及AI，但据钛媒体App了解，帆软内部团队对AI做了一轮又一轮的验证，尤其在2019年前后，国内外厂商纷繁推出“问答式 BI”功用，帆软也开端探究“问答式 BI“产品化落地的可行性，成立了专项团队做产品化测验，并推出 FineAI 进行小范围验证。

其时的“问答式 BI”在技能上大都选用规矩解析或规矩解析+端到端（小）模型的方法来完成文本到 SQL 的转化，技能上的约束导致问答的召回和精度不行抱负。而且因为端到端（小）模型的跨场景泛化才能缺乏，就需求针对特定场景不断的添加语料，并从头练习模型来进步精度和召回，然后导致施行本钱变得难以承受。

如此，这就导致“问答式 BI”会面对目的辨认、查询成果的精度和根据场景定制化开发、布置的本钱之间不行谐和的对立，并终究沦为一个铺排，实践用起来的少之又少，用户的浸透率并没有得到大幅提高，因而帆软停止了“问答式 BI”产品的商场推广。

大模型BI，填补了一块商场空白

直到大模型的到来，其跨使命、跨场景的泛化才能，让业界看到了完成一个老练、能落地的“问答式 BI”产品的可行性。

“大模型的泛化才能很强，不需求针对每个数据集做独自练习，一起内嵌了海量常识，包含各行各业的数据剖析范畴常识，可以帮用户把事务问题拆解为剖析思路，很大程度上处理了曩昔小模型所不能处理用户侧和技能侧两个中心问题。”翁林君说。

回溯 BI 产品的开展前史，会发现有一条明晰的主线，便是不断的运用新技能下降数据剖析门槛，使之有更大的受众集体，和更广泛的运用场景。

详细到“AI For BI”的落地场景，大体可以分红两大类。一类是嵌入到原有产品流程中，去提高建立制造的功率。另一类是直接以对话为中心进口，去体系性地下降用户的运用门槛。

前者，帆软研发了“AI 小帮手”，详细包含公式生成、组件制造、数据修改、看板美化和剖析陈述五个功用，后者，帆软孵化了“对话式 BI”产品 FineChatBI。

“AI 小帮手的确可以在某些场景下提高剖析师的制造功率，但全体价值没有经过下降数据消费门槛，让更广泛的事务用户可以用起来的价值大。所以，本年咱们会要点投入 FineChatBI，方针是让更多的可以直接发挥数据生产力价值的事务用户用起来。”翁林君说。

从商场客户来看，BI需求可以依照两个维度区分，一是用户数据剖析才能，二是数据剖析的杂乱性，此前的BI产品首要瞄准了具有数据剖析才能的杂乱场景，如FineBI，而一些一线人员所需求的BI场景，往往事务不杂乱，可是用不起来专业的BI产品，此刻FineChatBI就正好供给给这类用户。

“两类产品满意客户不同场景的剖析需求，有些事务人员不是剖析师，也想做数据剖析，运用FineChatBI入手快、作用好，别的一些剖析师首要处理杂乱的BI需求。”翁林君表明

AI要用得起来，不能只靠大模型

大模型自身并不是BI的优势，在一个场景里边用好大模型才是，这需求明晰的场景规划、丰厚的数据预备、牢靠的基座模型。

在大模型到来之前，前一代的“对话式 BI”本质上是一个对话式/检索式取数东西，它的价值仅仅是让事务人员更简单的取到数据。新一代“对话式 BI”一方面运用 Text2DSL选用彻底可控的方法取到可信的数据，另一方面，运用大模型 hypothesis testing 常识和剖析思路生成才能补齐事务人员认知和才能上的距离。

“这便是为什么咱们把产品定位成对话式事务剖析东西，完成对话式的事务剖析，让事务人员可以真实用起来。以可信查数为根底才能，构建思路拆解、数据查询、反常检测、归因剖析、趋势猜测、陈述生成等整个剖析闭环。中心是要了解每种技能的鸿沟，把最合适的技能去处理正确的问题，而不是拿着锤子找钉子，啥都用大言语模型去处理。”翁林君说。

大模型赛道越卷，关于帆软这类做运用场景的公司越是利好。不同的大模型数据样本不同，最终收敛的方向不一样，不同的使命帆软会运用不同的模型，开源模型也是一个很好的选择，帆软这类企业可以很明确地定义出场景里边的问题，然后可以针对性地选择模型，对应预备数据，然后优化整个使命。

“尽管现在国内许多大模型都声称现已追平了GPT-4，但咱们测验下来最好的模型仍是GPT-4，大部分场景咱们会先用好的模型试验这个场景能做到什么程度，验证成功今后，咱们就会用开源模型结合数据练习”，翁林君如是表明。

在数据办理方面，不同于前几年大而全的中台热，帆软选用以用带建的方法做数据办理，大部分企业的中台建造跟不上需求改变，帆软用BI的需求反向推进数据办理，而且供给了一系列数据办理东西，贯穿数据从办理到出现的事务场景，端到端的驱动事务决议计划。

“大模型对BI职业影响将继续在两方面，其一，大模型作为一种技能盈利，可协助处理传统 BI 中难以处理的问题，一起下降数据剖析门槛，使更多用户可以参加其间。其二，大模型会浸透到数据全链路各个环节中，从数据收集、办理和运用等方面提高全体功率，然后完成BI职业全面晋级。”翁林君总结道。（本文首发于钛媒体APP，作者 | 张帅，修改 | 盖虹达）