美文网首页
学习笔记--(移动数据挖掘引言)

学习笔记--(移动数据挖掘引言)

作者: 吉林天师 | 来源:发表于2019-03-17 12:55 被阅读0次

移动数据挖掘的定义

        移动数据挖掘研究的是基于移动数据的数据挖掘算法。这些数据算法需要更多地利用移动数据特性,挖掘与这些特性有关系的模型。

研究发现,移动数据通常具有空间聚集效应,即人们总是在少数的几个地点(家,工作产所等)附近活动


移动数据

移动数据是移动轨迹集合,而移动轨迹可以简单地认为是移动记录的有序序列,可以是人的移动数据,也可以是其他的移动数据。他们数据量大,产生速率高

移动数据表示:(1)移动记录<time,location>,时间位置对;

                           (2) 停留点:带有位置、startTime、endTime 

                           (3)兴趣点

移动数据表示为

(1)用户地点访问二部图:图的顶点分为两个不相交的子集,表示用户集和地点集,二部图的边只存在于两个子集之间,表示用户访问了某个子集。边的权重表示访问的次数,用户之间和地点之间,则无边相连。

用矩阵表示如矩阵M,行为i,列为j

 【 3,2,4,5】

 【 5,6,4,3】

  【 1,2,7,5】

每一行对应每一个用户

每一列对应每一个地点

则 M[i,j] 对应二部途中的边权。i,依次是武侯祠,天府广场,磨子桥地铁站,j,依次是刘备,张飞,关羽。 

M[0,0] = 3,表示刘备去了武侯祠3次

M[2,2] = 5,表示关羽去了磨子桥地铁站5次;

由于每个用户只会访问一部分地点,因此这个矩阵是稀疏的

移动社交网络中的社交网是由顶点和边组成的图结构,顶点是用户,边表示永固之间的关系,

边表示亲密度,图就是加权网络,

边表示关系,单向关注,就是有向图,对应非对称稀疏矩阵;双向关注,就是无向图,对应

对称稀疏矩阵。由于用户的朋友数有限,因此社交关系图是稀疏方阵

社交网中的一度朋友表示该节点的直接邻居,二度朋友表示该节点的朋友的朋友

针对在线社交网络的研究,可以发现在线社交网络基本都是小世界网络,满足“小世界理论”。小世界理论是只人们和任何陌生人之家所间隔的人不会超过6哥。因而达到一定度之后,每个节点所关联的节点可能就会覆盖整个网络【24】


丰富的移动模式

直接收集:GPS

间接收集:利用出租车,公交车、飞机、火车等移动对象载体收集

高精度定位:全球卫星定位,

粗略定位:WiFi  和 基站

位置信息一般不会保存在移动对象的手中。基站数据在运营商手中

社交软件的签到收集:街旁网、Foursquare、Facebook


基于位置的智能服务费重要案例:

1.通过分析大量的历史活动轨迹数据或出行数据,为人们的日常出行和旅游给出合适的路线和兴趣点的推荐【62,140,155,157】

2.基于位置的社交网络数据,挖掘本地人和外地人涉猎区域上的差异性。从而帮助人们学习到本地的相关知识,比如利用北京本地人的生活经验,给来北京旅游的外地人推荐性价比较高的餐馆和酒店【138】

3.东京大学联合微软亚洲研究眼利用一百多万人三年的GPS轨迹、日本的自然灾害资料以及灾害的官方和新闻媒体报道,来分析建模在后人们的移动行为规律,从而生成并模拟灾后最优移动路线【116】

4.AirSage公司一般每天通过处理上百万收集用户的150亿条位置信息,为美国的100多个城市提供实时交通信息【112】

5.微软研究员提出T-Drive 系统【143】分析33000辆北京出租车的GPS轨迹,来帮助出行人员得出更优驾车路线

6.T-Finder 系统【146】,减少空载时间

7.Jana使用100多个国家的、超过200个通信运营商的、覆盖大约35亿人口的的基站连接数据,将其转换为移动轨迹,研究疾病的传播、城市发展、人类迁徙等问题【40】

8.UPS收集运输车辆的行驶轨迹信息,提供最佳行车路线,以减少油耗、降低故障【160】

9.传统行业的车险一般通过评估群体的平均风险来为车险定价,分析车辆出行时间、常见行驶地点和实际行驶过程,就可以个性化风险评估和车险定价


挑战

可拓展性

稀疏性

从稀疏的数据中去学习人们的日常生活模式和兴趣偏好就变得异常困难

        人们探索新地点的速率随着时间的增长而迅速减少。即当人们熟悉了周遭环境之后,便很少探索新地点,即使人们时刻分享其位置记录,这些记录也都是冗余的

群体性

群体智慧

异质性

移动数据的挖掘任务通常需要多个数据源共同支持

论点朔源:

[24] Reasoning About a Highly Connected World[M]  这是预览版的

[62]  joint geogragph-ical modeling and matrix factorization for point-of-interest recommendation [C]

[140] Exploiting geographical influence for collaborative point-of-interest recommendation

 [155]

[157]

[138]

[116]

[112]

[143]

[146]

[40]

[160]

相关文章

网友评论

      本文标题:学习笔记--(移动数据挖掘引言)

      本文链接:https://www.haomeiwen.com/subject/vmnymqtx.html