不同类型网络 node embedding
1. 节点类型单一,边无属性
在这种类型的网络里,所有的节点类型是相同的,节点之间的边代表着节点与节点的关系,并没有其他属性。
网络类型代表:社交网络
在这种类型的网络里,利用node embedding抽取节点的隐形特征向量能够较好的保存原始数据中的大部分信息。
node embedding大致步骤:
- 利用random walk生成节点序列
- 找到相似节点
- 放进神经网络里进行多分类
将分类层扔掉,从上一层获取到节点的特征向量
2. 节点两类,边具有属性
在这种类型的网格里,所有的节点分为两类,节点与节点的关系只存在于不同类型的节点之间,边具有特定的属性,例如时间属性,数量属性等。
网络类型代表:金融投资网络
在这种类型的网络里,利用原先的node embedding的方法抽取节点的隐形特征向量可能会损失很大一部分的信息。因此,上面的node embedding的方法不能很好地应用到此类网络中。
投资图的node embedding
《learning node embeddings in interaction graphs》这篇论文研究了如何将投资图这样的二分网络进行node embedding
image.png
如上图所示,该网络是一个用户-股票的二分网络,网络中一种类型的节点是用户(投资者),另一种类型的节点是股票。节点之间的边的属性包括了bors(买进或是卖出),price(价格),amount(数量)等。
对于二分网络,根据时间顺序对两种不同类型的节点分别生成节点序列
预测建模大致步骤:
- 对于每一个投资者, 根据时间顺序,生成节点序列,并找到相似节点
对每一只股票,根据时间顺序生成节点序列,并找到相似节点
- 简化节点序列,即抛掉时间和属性
- 对简化后的两种类型的节点序别分别作node embedding
将进行了node embedding之后的投资者特征向量 x 和股票特征向量放在一起,对投资者是否会购买股票进行预测
完整方法
应用于四个不同的数据集,并与其它传统的方法相比较,得到的结果如下:
网友评论