Introduction
![](https://img.haomeiwen.com/i18668736/2a44940205bcbd10.png)
![](https://img.haomeiwen.com/i18668736/b3870063660d878f.png)
1. 有监督学习方式:LR,SVM, 神经网络
2. 混合的有监督学习方法
3. 通过聚类实现的半监督的学习方法
4. 传统图挖掘和监督学习的混合方法, 以下图为例
![](https://img.haomeiwen.com/i18668736/55b39071b222f3c9.png)
(前提1: 我们知道客户在欺诈伪冒场景中的好坏
前提2 : 部分已知商户的好坏)
![](https://img.haomeiwen.com/i18668736/cdbe39a955bd29a4.png)
![](https://img.haomeiwen.com/i18668736/4acfe368eb87ede9.png)
此处最重要的一点是变量X:
顾客的某个子集和商户的某个子集
有直接的,被观测到的是否发生伪冒或者欺诈行为
简单来说 就是:所有发生过伪冒欺诈的顾客扔进,发生过伪冒欺诈的商户扔进
变量X其实就为了构造MRF,对于X,X的元素指向了所有的客户和商户,但仅在商户和客户之间存在势函数
![](https://img.haomeiwen.com/i18668736/d23d9b9d62a98786.png)
![](https://img.haomeiwen.com/i18668736/db2d3a2ef8b9ae83.png)
详情见博客:https://blog.csdn.net/hohaizx/article/details/82868843
论文中提出两种概念 ,prob + potential
1. prob: 作者对商户伪冒概率的定义是: 商户卷入伪冒交易事件的概率,而并不是去定义商户的好坏概率
2. potential : 作者认为在伪冒场景中,商户是中立的(potential = 0.5)
但顾客会存在伪冒倾向(potential),且在二者关系的交易关系存在交易模式的伪冒倾向(顾客a在商户A中大额交易)。三者分别是独立的,但是一旦通过公式组合起来,便生成了“某商户卷入伪冒事件的概率”
![](https://img.haomeiwen.com/i18668736/8ee6209b0e9cd61d.png)
其中为交易边,softmax形式为
:是当前顾客
在当前商户
在当前交易类型
下的伪冒倾向权重(indicates hemophilic relation)
![](https://img.haomeiwen.com/i18668736/f13df554380703d3.png)
下述为节点的potential prob
依然 和
也是未知参数,需要做参数估计
对于顾客而言,如果当前(时刻)
,那么他的伪冒倾向(
) (下一次卷入伪冒案件中的potential)应该还是保持不变
, 这同样也是一种马尔可夫过程
对于商户而言,potential 都被设定为0.5
![](https://img.haomeiwen.com/i18668736/19ec7f1f6555f62b.png)
通过已标注的商户来进行上述未知参数的参数估计(估计用负样本进行极大似然估计就可以了)
![](https://img.haomeiwen.com/i18668736/df999470dfb0d972.png)
网友评论