美文网首页
宁波银行韦达:如何做好一个企业级数据分析平台?

宁波银行韦达:如何做好一个企业级数据分析平台?

作者: 观远数据Guandata | 来源:发表于2022-08-10 18:07 被阅读0次
  • 业务提了需求,科技部门听不懂,或者反馈的代码业务看不懂;

  • 接到业务需求后,科技部门测试、评估、实施流程走下来,黄花菜都凉了;

  • 科技部门加班加点,赶忙做完一套系统后,却发现根本不是业务想要的;

  • 最后大家合力好不容易做出一套适合业务的系统,后续却难以复用。

相信很多企业还停留在业务部提需求,科技部来实施的阶段,也或多或少地遇到以上问题。“如何让业务真正用起来?”这一难题,困扰在诸多企业心头已久。

对此,观远数据发布《2022企业级BI平台白皮书》,探寻让业务真正广泛、高频、活跃用起来的BI平台企业级能力建设方法论。

6月9日,观远数据邀请到波士顿咨询董事总经理陈果、宁波银行大数据智能分析平台负责人韦达、观远数据产品商业化负责人王璀,三位重磅嘉宾于线上直播间以各自不同的视角,分享了他们对于建设规模型企业BI平台的看法。

宁波银行韦达以“人人都是数据分析师”为理念与初心,分享了建立企业级数据分析平台的“三步走”历程,不能只让懂数据的人用起来,而是要争取让几乎每个人都用起来,让业务真正用起来

image.png

以下为宁波银行大数据智能分析平台负责人韦达的演讲实录:

各位朋友大家好!我是韦达,常调侃自己是一条“代码狗”,所以我今天分享的内容不会太复杂,说一些大家都听得懂的人话。同时我也希望keep real,真情实感地把我之前踩过的坑与大家分享。下面就让我以第一人称的视角,带大家感受下数据分析升级打怪的荆棘。

01

理念与初心:人人都是数据分析师

每个企业都有它自己的业务系统,比如银行里有办理贷款、存款的系统,商店超市有自己的收银系统,网店有自己的买卖系统,企业有客户管理系统和财务管理系统等等,这些系统每天都在产生数据。

image.png

那生产了数据之后呢?如果生产了数据却不用,简直就是暴殄天物,于是与数据生产平台相对应的数据分析平台应运而生。大量的数据在分析平台上进行融合,为领导提供决策助力。但这显然还不够,数据分析平台除了提供决策支持以外,还有一个很重要的作用是“回流”。什么意思呢?我举个例子,我们买东西输入收件地址,如果这个系统够智能的话,那我们只需要输入前半句,系统就会填充后半句。所以分析平台可以让我们的生产平台更智能,这是一个反哺与回溯,也是企业级数据分析平台的概念。

要做好数据分析,人比平台更重要,也就是数据分析师。企业在一开始做数据分析时,一般都是有几个零散的“野生数据分析师”,他们使用的数据分析工具差异非常大,有的用Excel,有的用各式各样第三方数据分析平台,有的自己写SQL。不仅所用的工具差异很大,他们的数据口径往往也是完全不同的,所以他们很难让自己的工作成果交换互通。

慢慢地,他们之间就会有交流,希望能够相互协作,偷点儿懒,这时候他们开始结盟,从“野生数据分析师”变成了“数据分析师联盟”。因为要偷懒,就需要有统一的分析平台。因为希望结果能够互用,就会尽量统一数据口径。这时候企业就会建立数据分析的部门,比如数据战略中心、数据治理中心,也有的叫战略服务部、数据咨询部等等。这样够了吗?到这个阶段为止,这些数据都是由专家产出,也就是我们常说的PGC模式(专家产生内容),这显然是不够的。大家现在看抖音,是不是发现它越来越智能,越来越懂你?这背后的核心其实就是UGC模式(用户产生内容),让用户自己去生产内容,这也是未来的趋势。

正如Gartner曾提出的“人人都是数据分析师”理念。要实现这一点,核心不仅仅是平台门槛足够低,还需要大量的工作来推进,包括培训数据分析师,培养数据分析的环境和理念,让更多人用起来。只有越来越多人用起来以后,数据才会更准确、更干净,更多的坑才会被碰到。同时,更多人用起来之后,数据分析的价值才能得到体现,让经验得到无限的分享,实现1+1>N的效果。

02

企业级数据分析平台建设“三步走”

那么如何做好一个企业级的数据平台呢?恰巧我就遇到了这个坑。

三年前我和静文等行内老师一起建立数据分析平台,从选型开始我们遇到了很多坑,最后也选择与观远携手进行了更深入的升级。

image.png

总的来说,整个建设过程分为三步走。第一步,我们需要把平台搭起来。第二步,让大家把平台用起来。第三步,要实现“人人都是数据分析师”的理念,不能只让懂数据的人用起来,而是要争取让几乎每个人都用起来,把数据分析人才培养起来。

从我们跟很多银行和软件厂商的交流中发现,宁波银行的风险部门是我目前看到的在所有银行的部门中使用数据分析人员占比最高的。我们有一半的人都是数据分析平台的活跃用户,并且有一半以上的人都是数据分析师,这个过程是非常艰难和艰辛的。我们认为完成了这三步之后,才配叫一个真正的企业级数据分析平台

03

第一步:把平台搭起来

简易:无代码“拖拉拽”

要想让更多人用起来,平台就一定要简易。数据分析平台是为了解决问题,而不是让整个公司变得越来越卷,不是为了做得花里胡哨。它的初衷一定是要能做出一些东西,比如智能分析报告,每天我的领导和同事们都需要这个报告,如果能够实现数据自动更新,那么就可以让人从繁杂的工作中解放出来,这是对用的人的价值。

对于做的人来说,其实银行里很多人并不是技术出身,那他需要什么?他需要一个无需使用SQL或者Python脚本,只需要无代码的拖拽就能获取他所需数据的平台。观远的平台其实就具备这样的功能。

智能:AI+BI,观远一小步,数据一大步

平台的核心一定是智能。Gartner在很多年前提出了增强分析(Augmented Analytics)的概念,最新又提出了自适应分析(Adaptive Analysis),包括以数据驱动的AI,这些都属于增强分析。非常有幸,我们跟观远的合作深入到了这一步。很多平台都标榜自己是AI+BI,但仅仅是把Python脚本和SQL脚本合并在一起,中间连接了一下,我认为这不叫AI+BI。观远真正把这一步打通了,可以说是“观远的一小步,数据的一大步”。

这里跟大家分享一个有趣的故事。当年我和观远的联合创始人兼首席数据科学家字节老师在一张餐巾纸上勾勒了新一代增强分析的框架。上一代的增强分析其实是模型的拆解,我们在这张餐巾纸上把我们认为的AI+BI最重要的四个方面定义出来。

image.png

第一个是析因。我们做分析时经常会点BI看板(dashboard),我们希望通过更少次数的点击就能找到背后的问题,降低数据门槛,提高分析深度。这一点我们其实是受到Tableau data explain的启发,但它的局限在于不能实现自动化替代人力,进行报表自动分析、自动下钻、自动联动。我们发现可以用Shapley Value进行代替,实现自动检测异常,并且把检测到的异常自动分析原因,甚至让数据自己开口说话。

第二个是分类。我相信人天生就会区别好的和坏的,分类的背后就是为了帮助我们分别好和坏。我们建立了评分卡,帮助我们去判断优质的机构、员工、客户。如果你想要判断结果更精准,请用XGB;如果你想更有解释性,还可以用逻辑回归,一键分析好坏。

第三个是预测。数据分析最大的敌人不是数据本身,而是时间。我们每一次数据分析本质都是在跟时间赛跑,如果你能早一步分析出来,早一步动手,早一步发现问题、趋势、原因,就能赢得先机。企业要准备存货,其实要预测销量;银行要准备贷款,那要预测整体的流动性规模有多大。我们希望大家把数据直接丢进去,系统就能直接生成预测结果。

第四个是关联,也就是similarity(相似性)。我举个例子,我最害怕的不是做AI项目,不是手拆一个贝叶斯模型,而是618到了该给老婆买什么?比如前段时间刚刚买了一个迪奥,那我是要给她买香奈儿还是什么?比如老婆刚买了某个色号的口红,那我下一个应该买哪个色号?所以,关联是真正能达到对相似的客户进行归类,并且把需要的东西推到合适的地方去。我们现在用聚类模型在做一些算法上的尝试,未来可能也会探索知识图谱等核心技术。相信在不久的将来,我们在观远的产品发布会上,就能让更多人享受到AI+BI的智能。

安全:数据可用而不可见

一个企业最不能容忍的是什么?就是老板不能容忍自己的财务把自己和员工的工资告诉别人,这样的信息是不应该在企业内被互相讨论和分享的。怎么才能做到这一点呢?这背后包含了资源隔离、权限隔离等多方面的内容。

我们跟观远开创性地做到了BI行业的数据脱敏,包括数据的自动识别、自动查询。下一个阶段将会引入联邦学习技术,这些探索的背后都是为了做到数据可用而不可见。

数据脱敏方面,很有幸参加到了观远的数据脱敏产品的整体设计中,我们做到了自动探测和自动处理。包括怎么自动发现这个数据是不是脱敏的,怎么自动地把这个数据一键处理掉,而不是增加很多的麻烦。甚至下一个阶段我们要进一步推广的是审计,数据脱敏到底有没有被看到,并且有没有被全部处理掉。

04

第二步:平台应用和数据治理

在平台应用和数据治理方面,前面陈果老师和观远的专家都分析得很透彻了。我想分享的一点是:数据分析一定是自上而下和自下而上的。自上而下就是当我在总部要给分支机构或部门下达指标时,一定要建立统一的数据口径和指标,并且设定核心的数据资产,我才能够指挥它。自下而上就是要让一线有自己的空间,让听得到炮火的人在战场上随机应变,所以一线可以自己去加工,在我们提供的核心数据基础上,真正做到定制化和区域化。

将在外令有所不受,真正把自上而下和自下而上,把总部和分支机构联合在一起的是数据分析的敏捷化。另外再强调一点,BI和数据分析的核心一定是希望它能做出决策,所以一定要产生闭环。所谓闭环就是我们要解决问题,把人解放出来。观远的移动端和大屏等很多能力都能支持这一点。

image.png

数据治理方面,技术层面包括ODS、DIM、DW、ADS等等。打个比方,我们把一个刚来的数据理解为一个刚买到的菜,是系统源表,也就是ODS;DIM是按主题拼接的维度表,也就是洗了切;DW是统计类指标表,相当于把切好的菜给串起来;ADS是应用结果表,也就是下锅做菜。以银行贷款来举例,现在监管都要查贷款资金的流向,我们看到的数据都是ADS或者DW层面的,已经到了我们最后的使用端。但无论从性能角度还是业务角度,我更希望一次性打通,看到哪些客户做了贷款,哪些资金是贷款,这样效率更优,口径也更准确。

05

第三步:数据分析人才的培养

我相信大部分企业还停留在业务部提需求,科技部来实施的阶段。之前有句玩笑话:“提需求,先跪下”。这种合作模式会存在三个问题。第一个问题是业务提了需求,科技部听不懂,或者反馈的代码业务看不懂。第二个是业务提完需求后,科技部还要实施、测试、评估,真正做完后黄花菜都凉了。甚至做的东西根本不是业务想要的,无法复用的,这是第三个问题。

要解决这些问题,就需要做到科技自创建,科技和业务形成联盟,并且持续运维。相当于业务和科技部形成一个legal,一起来做这件事情,毕竟授人以鱼不如授人以渔。科技部告诉业务人员应该怎么做,让他们自己做,而且业务不断地做就会持续不断涌现出创意,把他们的业务经验完全释放出来。

image.png

怎么样才能培养出数据分析师呢?这一步是最难的。我和行里的老师为我们行近千名员工建立了一套课程练习题、考试评优、积分考核体系,只有这套东西能真正形成循环,帮助数据分析落地。大家现在有种想法,觉得只要买了BI系统就完事了,但其实要发挥BI的价值是要让所有人都可以玩起来,把所有人都培养起来。观远的客户成功团队有非常成熟的培训和支持体系,大有可为。

仅仅只有商业分析就够了吗?我们走到今天这一步,我们的困惑是什么呢?商业分析只是初级,我们还需要中级和更高级。我个人理解中级分析有两层含义,一个是数据架构,也就是针对数据做处理;另一个是真正往AI方向走的,也就是算法工程师,他们可能一部分偏向科技,一部分偏向模型。大道至简,最后他们都会汇总成高级的数据科学家。

最后再多说一两句,我觉得核心关键是企业要有数据分析的氛围。有些企业是资源导向和关系导向的,他们未必认可数据和BI的价值。

“心如花木,向阳而生”。其实,无论企业处于何种阶段,我们又身处何地(何位),我们应该去相信数据的力量,相信数据分析的能力,始终有一股探究事物背后本质的冲劲,永远保持年轻,永远热泪盈眶,这才是真正能做好企业级数据分析的关键所在。

相关文章

网友评论

      本文标题:宁波银行韦达:如何做好一个企业级数据分析平台?

      本文链接:https://www.haomeiwen.com/subject/vhyawrtx.html