某平台的算法团队开发了一个识别商家是否是恶性商户的模型M1,希望通过这种算法改变之前通过用户识别和人工识别异常数据的方式,改变人力成本高并且速度慢的情况。
通过用户举报和人工识别的方式判断,平台上的恶性商户的比率为0.2%,记为P(E),那么良性商户就是P(~E)就是99.8%;利用M1模型检测后发现,在已经判定的恶性商户中,由模型M1判定为恶性商户的人数占比为90%,这是一个条件概率,表示为P(P|E)=90%,在已经判定的良性商户中,由模型M1判定为恶性商户的人数占比为8%,表示为P(P|~E)=8%。
通过模型监测后发现,经过M1模型检测后,通过用户举报和人工识别过的客户存在大量的误杀情况,这对平台商会的运营是极为不利的。
这个时候,就需要用新的方法来判断在M1模型判别某个商户为恶性商户时,这个结果的可信度有多高。
这里使用的还是贝叶斯模型,需要计算的是P(E|P),也就是当M1判别某个商户为恶性商户时,这个商户的确是恶性商户的概率,其计算公式是:
P(E|P)=P(P|E)*P(E)/[P(E)*P(P|E)+P(~E)*P(P|~E)]
通过以上分析,可以得到如下的计算数据:
通过计算,我们获得了当M1判别某个商户为恶性商户时,这个商户的确是恶性商户的概率是2.2%,这比之前判别的0.2%提高了11倍。
可能2.2%的概率并不高,但在实际情况下,被M1模型判别为恶性商户,说明这家商户做出恶性行为的概率是一般商户的11倍,是非常有必要进行进一步更高精度的方式做检查的,而更高精度的检查的成本是很高的,因此M1模型的使用能够大幅度节省成本。
Excel是使用最为广泛、最为便捷的办公软件,而且它的数据分析和挖掘功能功能十分强大,能够快速完成所有的数据清洗的过程,能够快速建立分析模型,并且快速运行得出结果,是做数据分析必备的工具。
下面是即将在我的小密圈里分享的120个Excel商业数据分析实战案例目录,欢迎看我个人资料联系我:
网友评论