千呼万唤始出来,百度GBI终于发布,体验地址:https://console.bce.baidu.com/ai_apaas/app/debugger/gbi/e5a2f884-744c-423b-ae31-c11172944ec4/123e4567-e89b-12d3-a456-426655440025
一、前言
百度GBI(Generative Business Intelligence)是一款生成式商业智能产品,具有强大的创新驱动功能。它集成了数据集成、智能分析等功能于一身,帮助企业快速发现新的商业机会和创新点。
百度GBI具有支持自然语言交互、跨数据库分析和专业知识学习三方面能力,将商业分析师十几天才能完成的数据分析工作缩短到分钟级。传统BI(商业智能)产品只有专业人士才能操作,而GBI能直接听懂业务人员问题,实时执行,快速得出结论。GBI提供便捷的接入方式,企业可以接入数据,对任意数据提问、分析,不再需要人工去跨数据库、跨表格分析。同时,GBI具备学习能力,企业可注入本行业专业知识,让它成为行业专家。实现无编程经验的普通用户也能“任意表,随便问”。
Excel作为一种广泛使用的数据处理和分析工具,在企业和组织中发挥着重要作用。然而,传统的Excel分析方法使用门槛较高、面临着诸多挑战。基于Excel的传统BI工具存在一些问题,如操作复杂、学习成本高、维护成本高等。此外,传统的BI工具通常只能提供固定的报表和分析功能,无法满足用户个性化的需求。
GBI可以通过理解自然语言指令,自动执行复杂的数据操作和分析任务。用户可以通过简单的自然语言查询,如“请告诉我前年销售额”,大语言模型就能理解并返回正确的数据。这种方式不仅提高了数据分析的效率,也降低了用户的学习成本。
二、数据准备及GBI基础配置
进入GBI其操作界面如下图,左侧区域上传待分析的excel,右侧区域为用户与大语言模型的问答交互区。 操作界面2.1 文件上传规则
文件上传规则:
- 可直接将文件拖拽火电点击“上传数据文件”按钮进行上传,当前系统支持.xls、.xlsx、.csv格式文件;
- 单次可上传1个文件;若多次上传则默认使用最后上传的文件;
- 单个文件内容不超过40列,1万行,文件大小不超过10MB;文件编码格式为UTF-8;文件需包含中文表头;
- 若文件中包含多个sheet,则默认使用第一个sheet。
2.2 原始Excel
待上传Excel文件记录了某日在何地上网使用了多少流量,含日期、手机号、流量使用地、流量共4列,具体数据如下图:
原始Excel数据
2.3 上传Excel
上传数据后系统自动识别了表名、列名、数据类型,识别准确率非常高。不得不说比前几天beta版增强了很多,让我们感受到了国内大语言模型领域日新月异的变化。数据上传后,GBI开始进行分析,如果没有问题可以看到成功提示。注:百度赠送了200次免费调用,详见页面底部“免费额度”。
点击“查看详情”可以看到上传成功的所有数据。
2.4 数据配置
点击“数据配置”可以参考/调整默认配置。如果数据量很大时,索引列作为查询条件会加快查询效率,手动把“日期”和“流量使用地”设置为索引。
在“知识”页,为GBI新增一个概念“流量超标”,流量超标是指流量的值大于6,这样GBI可以理解这个指标是什么,后续我们才能对专有名词“流量超标”进行查询。
2.5 应用设置
应用配置页面可以维护:应用名称/描述、模型配置(当前仅为EB 4.0)、对话管理等功能。三、GBI体验
3.1 问题:
- 5号几条数据,总流量是多少?
- 流量超标分别发生在哪天,使用了多少流量?
- 6号的“流量使用地”附近有什么大学?
3.2 验证GBI答案
让我们拭目以待GBI的超能力!
3.2.1 问题1答案
GBI给出的答案如下: 用Excel验证一下,第一题答对! 5日3条数据的总流量3.2.2 问题2答案
前面我们已经告诉LLM,“流量超标是指流量
的值大于6”,从Excel中我们可以看到是下面这条记录流量大于6。
恭喜你又答对了。
3.2.3 问题3答案:
6号的“流量使用地”附近有什么大学?这个问题是复合型问题,包括从GBI查询6号的“流量使用地”和查询附近有什么大学。很遗憾没有回答上来!
如果先问6号的“流量使用地”,GBI给出了正确的结果。
再使用通用大模型文心一言4.0询问“黑龙江哈尔滨学府路附件有什么大学”,这对文心一言4.0来说小菜一碟。粗体回复附近的大学有:黑龙江大学、哈尔滨理工大学、哈尔滨医科大学、哈尔滨师范大学等。
结束语
本文从百度GBI的视角探讨了利用大语言模型的自然语言理解和执行能力对Excel进行数据分析的方法。并探讨了大语言模型如何充当数据分析助手简化业务人员使用BI的门槛的方法。通过将大语言模型与Excel集成,我们可以构建一个更加智能、高效且用户友好的数据分析和可视化环境。
未来随着技术的不断进步和应用场景的不断拓展大语言模型在Excel处理中的应用将会越来越广泛,同时生成式BI的发展也将为业务人员提供更加便捷高效的数据分析和解读工具推动数字化转型的深入发展。
同时我们也注意到GBI和通用大语言模型能力的结合还待完善,毕竟其为刚刚出生的婴儿,随着工程师们的培育相信GBI一定会越来越好!
网友评论