- 改善快速公交系统中的公交车流量:基于元胞自动机模拟的方法;
- 行动或反应:分析在线社区审核的主动策略;
- 大规模二部图的对抗表示学习;
- 基于冗余的分辨率和基于投影的层间耦合的多层网络模块化;
- 基于弹性的事后建筑检查优先级排序方法;
- Twitter上分享的关于MeToo运动的在线资源:帕累托原则;
- 面包屑:具有兴趣点注释的特征丰富的移动数据集;
- 通过社交媒体建模用户肖像;
- 社交媒体用户行为的跨平台建模;
- 模拟社会网络中的回声室和极化动态;
- 具有联合表示学习内容和连接的异常检测;
- 用于广义多任务学习的图星网络;
- 使用社交媒体数据建模食物受欢迎度依赖性;
- 自动发现网络生成过程族;
- 通过边添加实现K核最大化;
- 关键边识别:基于K-Truss的模型;
- 建模城市;
改善快速公交系统中的公交车流量:基于元胞自动机模拟的方法
原文标题: Improving the bus flow in a Bus Rapid Transit system: an approach based on cellular automata simulations
地址: http://arxiv.org/abs/1906.11916
作者: M.A. Uribe-Laverde, W.F. Oquendo-Patiño
摘要: 我们使用基于元胞自动机(CA)的新方法研究了快速公交(BRT)系统中的公交车流量,该方法适当地考虑了公交车的相互作用。该模型使用一个总线服务定量地再现固定和随机停留时间的总线排队行为。对于更多的公共汽车服务,我们的结果表明,公交车流量不仅很大程度上取决于公交车如何在服务中分配,还取决于公交车站在车站的物理布置方式。迄今为止,在常见的BRT优化方法中没有考虑后者的依赖性。通过使用遗传算法,我们可以找到总线分布,最大化站点上给定停靠布置的总线流量,并探索其与总线密度的演变。我们的结果提出了一套指导原则,可以应用于工作BRT系统以改善总线流量。
行动或反应:分析在线社区审核的主动策略
原文标题: To Act or React: Investigating Proactive Strategies For Online Community Moderation
地址: http://arxiv.org/abs/1906.11932
作者: Hussam Habib, Maaz Bin Musa, Fareed Zaffar, Rishab Nithyanand
摘要: Reddit管理员一般都在努力防止或遏制此类话语,其原因有以下几种:(1)少数人类管理员无法每天跟踪和回应数百万个帖子和评论;(2)担心由于以下原因导致的强烈反对禁止或隔离仇恨社区的行政决定。因此,正如我们的背景研究所示,行政行为(社区禁令和检疫)通常是针对媒体压力而作出的,这种压力是在一个社区内的攻击性话语中蔓延到现实世界中并带来严重后果的。在本文中,我们调查了积极主动调节Reddit的可行性 - 即主动识别有可能犯下以前导致其他社区禁令的犯罪风险的社区。主动审核策略有两个原因:(1)它们有可能缩小管理员需要监控仇恨内容的社区范围;(2)它们为管理员提供了支持管理决策和干预的科学依据。我们的工作表明,社区在其用户群和话语主题中不断发展,并且通常可以提前几个月预测演变为仇恨或危险(即被Reddit管理员认为可以被禁止)社区。这使得主动审核成为可能。此外,我们利用可解释的机器学习来帮助确定进入危险社区的最强预测因子。这使管理员能够深入了解处于危险或仇恨风险中的社区的特征。最后,我们大规模调查参与仇恨和危险的次级域名的影响以及社区禁令和隔离区对这些社区成员行为的有效性。
大规模二部图的对抗表示学习
原文标题: Adversarial Representation Learning on Large-Scale Bipartite Graphs
地址: http://arxiv.org/abs/1906.11994
作者: Chaoyang He, Tian Xie, Yu Rong, Wenbing Huang, Junzhou Huang, Xiang Ren, Cyrus Shahabi
摘要: 大规模二部图上的图表示是各种应用的核心,从社会网络分析到推荐系统开发。现有方法存在两个主要缺点:1。无法表征二分特定结构中节点特征的不一致性; 2.不支持大规模的二部图。为此,我们提出了ABCGraph,一种用于大规模二部图的无监督学习的可扩展模型。在其核心,ABCGraph利用所提出的二部图卷积网络(BGCN)作为编码器和对抗性学习作为训练损失,以无监督的方式学习来自两个不同域和二分结构中的节点的表示。此外,我们设计了一个级联架构来捕获二分结构中的多跳关系,并提高了可扩展性。对不同尺度的多个数据集进行的大量实验验证了ABCGraph与现有技术相比的有效性。对于真实世界的大型二部图系统的实验,快速的训练速度和低内存成本证明了ABCGraph模型的可扩展性。
基于冗余的分辨率和基于投影的层间耦合的多层网络模块化
原文标题: Modularity in Multilayer Networks using Redundancy-based Resolution and Projection-based Inter-Layer Coupling
地址: http://arxiv.org/abs/1906.12204
作者: Alessia Amelio, Giuseppe Mangioni, Andrea Tagarelli
摘要: 多层网络的模块化的通用版本,即多层模块化,由两个模型参数表征,即分辨率因子和层间耦合因子。前者对应于层特定相关性的概念,而层间耦合因子表示跨网络层的节点连接的强度。尽管有这种方法的潜力,但是可以任意选择两个参数的设置,而不考虑来自多层网络的拓扑以及可用的社区结构的特定特征。此外,多层模块化并非旨在明确地模拟层上的顺序关系,这对于动态网络而言是最重要的。本文旨在通过引入多层网络的新模块化公式来克服多层模块化的主要局限性。我们基于多层社区的层内和层间结构提供的信息,修改分辨率和层间耦合因子的作用和语义。此外,我们提出的多层模块化通常足以考虑网络层的排序及其对层耦合的约束。使用最先进的多层群落检测方法在合成和真实多层网络上进行实验。所获得的结果表明了所提出的模块化的意义,揭示了分辨率和层间耦合函数的不同组合的效果。这项工作也代表了开发多层网络中社区检测的新优化方法的起点。
基于弹性的事后建筑检查优先级排序方法
原文标题: A Resilience-based Method for Prioritizing Post-event Building Inspections
地址: http://arxiv.org/abs/1906.12319
作者: Ali Lenjani, Ilias Bilionis, Shirley Dyke, Chul Min Yeum, Ricardo Monteiro
摘要: 尽管在破坏性事件发生后可能出现各种各样的情况,但每个社区都可以做出选择,以提高其恢复能力或恢复能力。一个富有弹性的社区是一个准备好并因此可以吸收,恢复和适应破坏性事件的社区。恢复阶段的一个重要方面是通过事后建筑检查评估建筑环境中的损坏程度。在本文中,我们开发并演示了一种基于弹性的方法,旨在通过有限的信息支持有关检查优先级的快速事后决策。该方法使用社区中的建筑物库存的基本特征(建筑面积,楼层数量,构造类型和配置)来为每个建筑物分配特定于结构的脆弱性功能。对于具有给定地震烈度的事件,确定每个建筑物达到特定损坏状态的概率,并用于预测实际建筑状态和检查的优先级。损失的计算基于建筑物使用类别,估计的检查成本,错误决策的后果以及可能存在不必要的访问限制。其目的是为社区提供一种手段,使其能够根据其建筑物库存检查做出快速的基于成本的决策。我们将决策问题作为整数优化问题,试图最小化社区的预期损失。这种方法的优点在于:(i)简单,(ii)需要最少的库存数据,(iii)易于扩展,(iv)不需要大量的计算能力。在危险事件发生之前使用这种方法还可以为社区提供在事件发生之前规划和分配资源的手段,以实现社区所需的弹性目标。
Twitter上分享的关于MeToo运动的在线资源:帕累托原则
原文标题: The Online Resources Shared on Twitter About the #MeToo Movement: The Pareto Principle
地址: http://arxiv.org/abs/1906.12321
作者: Iman Tahamtan, Javad Seif
摘要: 在本文中,我们将研究Twitter用户关于MeToo主题标签(#MeToo)的信息共享行为,以及Pareto原则是否适用于包含此主题标签的推文中使用的域名和URL。 RStudio和Python用于检索和分析数据。结果表明,最常见的域名是twitter.com(47.20%),其次是nytimes.com(4.42%)和youtube.com(3.69%)。最常见的内容是最近的民意调查显示“男人害怕在#MeToo运动后指导女性”。域名表现出帕累托原则:8%的域名占Twitter上包含#MeToo的共享内容的80%。在考虑URL时,帕累托原则并不成立。本研究可以更好地了解人们依赖的在线资源来共享有关#MeToo运动的信息。
面包屑:具有兴趣点注释的特征丰富的移动数据集
原文标题: Breadcrumbs: A Feature Rich Mobility Dataset with Point of Interest Annotation
地址: http://arxiv.org/abs/1906.12322
作者: Arielle Moro, Vaibhav Kulkarni, Pierre-Adrien Ghiringhelli, Bertil Chapuis, Benoit Garbinato
摘要: 在本文中,我们介绍了面包屑,这是一个从洛桑市(瑞士)收集的移动数据集,来自81个用户的多个手机传感器(GPS,WiFi,蓝牙),为期12周。当前可用的移动性数据集限于通过低时空粒度的单个传感器获得的地理空间信息。此外,这种被动收集的数据缺乏关于兴趣点及其语义标签的地面实况信息。这些特征对于推动地理空间数据分析的可能性以分析细粒度的移动行为和运动模式至关重要。为此,Breadcrumbs为所有参与者的兴趣点提供了地面真相和语义标签。数据集还包含参与者之间的细粒度人口统计属性,联系人记录,日历事件和社交关系标签。为了证明地面实况注释的重要性,我们讨论了该数据集的几个用例。此外,我们比较了四种对比和广泛使用的无监督聚类方法,用于从地理位置轨迹中提取兴趣点。使用地面实况信息,我们对这些技术进行了详细的性能验证,并突出了它们的优点和缺点。鉴于移动数据源于个人参与活动的固有需求,缩小原始轨迹数据点与完整行程注释之间的差距至关重要。因此,我们使研究界可以访问面包屑,以促进有监督的人类流动学习方案的研究。
通过社交媒体建模用户肖像
原文标题: Modeling of User Portrait Through Social Media
地址: http://arxiv.org/abs/1906.12323
作者: Haiqian Gu, Jie Wang, Ziwen Wang, Bojin Zhuang, Fei Su
摘要: 如今,用户信息和社交行为的大量有用数据已经在互联网上积累,提供了在线描述用户个性特征的可能性。在本文中,我们提出了一种基于计算语言特征的心理建模方法,用于描述新浪微博(中国类似Twitter的微博服务)用户的五大人格特质及其与用户社交行为的相关性。据我们所知,这是第一个在新浪微博上调查个人资料信息,社会网络行为和个性特征之间潜在关系的研究。我们的结果展示了一种有效的建模方法,可以在没有客户中断的情况下理解社交媒体上用户的人口统计和心理肖像,这对于商业公司提供更好的个性化产品和服务很有用。
社交媒体用户行为的跨平台建模
原文标题: Cross-Platform Modeling of Users' Behavior on Social Media
地址: http://arxiv.org/abs/1906.12324
作者: Haiqian Gu, Jie Wang, Ziwen Wang, Bojin Zhuang, Wenhao Bian, Fei Su
摘要: 随着移动应用的蓬勃发展和普及,不同的垂直行业积累了丰富的用户信息和社交行为数据,这些数据是自发的,真实的和多样化的。然而,每个平台仅在某些方面描述用户的肖像,导致这些互联网足迹难以组合在一起。在我们的研究中,我们提出了一种建模方法来分析用户在不同社交媒体平台上的在线行为。收集了网易音乐和新浪微博共享的相同用户的结构化和非结构化数据,用于跨平台分析音乐偏好与其他用户特征之间的相关性。基于类型和情绪的音乐标签,通过用K-means方法计算他们收集的歌曲列表,形成了五组的类型集群和四组情绪集群。此外,在微博用户数据的帮助下,对音乐偏好(即体裁,情绪)和五大人物(BFP)与基本信息(如性别,居住地区,标签)之间的相关性进行了全面研究,全面建立起来。用户肖像与更精细的纹理。我们的研究结果表明,人们的音乐偏好可能与他们真实的社交活动有关。例如,生活在山区的人们通常喜欢民间音乐,而城市地区的人们更喜欢流行音乐。有趣的是,狗爱好者可能比猫爱好者更喜欢悲伤的音乐。此外,我们提出的跨平台建模方法可以适应其他垂直方向,提供在线自动方式,以更精确和全面的方式分析用户。
模拟社会网络中的回声室和极化动态
原文标题: Modeling echo chambers and polarization dynamics in social networks
地址: http://arxiv.org/abs/1906.12325
作者: Fabian Baumann, Philipp Lorenz-Spreen, Igor M. Sokolov, Michele Starnini
摘要: 最近,不同社交媒体在几个社会政治背景下量化了回声室和意见两极分化,引发了人们对错误信息传播和辩论开放的潜在影响的担忧。尽管努力越来越多,导致这些现象出现的动态仍然不明朗。在这里,我们提出了一个引入激演化现象的模型,作为一种强化机制,推动从适度的初始条件向极端观点的演变。在经验上受到社会互动动力的启发,我们认为代理人的特点是异质活动和同质性。我们分析地描述了全球共识与人口中新兴激演化动态之间的转变,这是社会影响力和所讨论主题的争议性的一个功能。我们将模型的行为与Twitter上的极化辩论的经验数据进行对比,定性地再现观察到的用户参与和意见之间的关系,以及基于交互网络的意见隔离。我们的研究结果揭示了可能存在于社交媒体中回声室和极化的核心的动态。
具有联合表示学习内容和连接的异常检测
原文标题: Anomaly Detection with Joint Representation Learning of Content and Connection
地址: http://arxiv.org/abs/1906.12328
作者: Junhao Wang, Renhao Wang, Aayushi Kulshrestha, Reihaneh Rabbany
摘要: 社交媒体网站正在成为政治的关键因素。这些平台易于操纵,以扭曲信息空间,使选民感到困惑和分散注意力。过去确定破坏性模式的工作主要集中在分析推文的内容上。在本研究中,我们共同嵌入来自用户发布的内容以及用户的关注者网络的信息,以无人监督的方式检测密集连接的用户组。然后,我们调查这些密集的用户子块以标记异常行为。在我们的实验中,我们研究与即将到来的2019年加拿大选举有关的推文,并观察一组密集联系的用户参与不同省份的地方政治,并表现出类似巨魔的行为。
用于广义多任务学习的图星网络
原文标题: Graph Star Net for Generalized Multi-Task Learning
地址: http://arxiv.org/abs/1906.12330
作者: Lu Haonan, Seth H. Huang, Tian Ye, Guo Xiuyan
摘要: 在这项工作中,我们提出了图星网(GraphStar),一种新颖的统一图神经网络结构,它利用消息传递中继和注意机制进行多个预测任务 - 节点分类,图分类和链路预测。 GraphStar解决了图神经网络面临的许多早期挑战,并在不增加模型深度或承担沉重的计算成本的情况下实现了非局部表示。我们还提出了一种新的方法来解决基于节点分类和文本分类作为图分类的特定主题情感分析。我们的工作表明,“星形节点”可以学习有效的图数据表示,并改进当前三种任务的方法。具体来说,对于图表分类和链路预测,GraphStar在几个关键基准上的表现优于当前最先进的模型2-5%。
使用社交媒体数据建模食物受欢迎度依赖性
原文标题: Modeling Food Popularity Dependencies using Social Media data
地址: http://arxiv.org/abs/1906.12331
作者: Devashish Khulbe, Manu Pathak
摘要: 主要社交媒体平台的普及使人们能够分享有关他们日常生活的照片和文字信息。关于共享信息的热门话题之一是食物。由于许多关于食物的媒体归因于特定的地点和餐馆,因此可以分析诸如各种美食的时空流行度的普及的信息。跟踪食品类型和零售地点在空间和时间上的流行度对企业主和餐馆投资者也很有用。在这项工作中,我们提出了一种方法,使用现成的机器学习技术,使用来自社交媒体,Google图像和Yelp的地理标记数据来识别某个地区菜肴类型的趋势和受欢迎程度。在调整时间之后,我们使用核密度估计来获得整个位置的热点,并使用贝叶斯网络模拟食品美食的依赖性。我们将纽约市曼哈顿区视为我们分析的位置,但该方法可用于任何具有社交媒体数据和零售业务信息的区域。
自动发现网络生成过程族
原文标题: Automatic Discovery of Families of Network Generative Processes
地址: http://arxiv.org/abs/1906.12332
作者: Telmo Menezes (CMB), Camille Roth (CMB)
摘要: 设计合理的网络模型通常需要学者们对网络形成的关键驱动因素形成先验直觉。通常,这些直觉得到网络演化过程选择的统计估计的支持,这将形成待开发模型的基础。最近引入了机器学习技术以帮助自动发现生成模型。这些方法可以更广泛地描述为“符号回归”,其中基本网络动态函数而不仅仅是参数通过遗传编程演化。本章首先旨在回顾这方面的原则,努力和新兴文献,这与创造人工科学家的想法非常一致。然后,我们的贡献更具体地旨在建立我们最近开发的方法[Menezes &Roth,2014],以证明可以通过类似的生成过程描述的网络家族的存在。换句话说,符号回归可用于根据其推断的基因型(就生成过程而言)而不是其观察到的表型(就统计/拓扑特征而言)对网络进行分组。我们的经验案例基于238个匿名的以自我为中心的Facebook朋友网络的原始数据集,进一步产生了对社会网络形成的见解。
通过边添加实现K核最大化
原文标题: K-Core Maximization through Edge Additions
地址: http://arxiv.org/abs/1906.12334
作者: Zhongxin Zhou, Fan Zhang, Xuemin Lin, Wenjie Zhang, Chen Chen
摘要: 衡量网络稳定性的一种流行模型是k核心 - 最大诱导子图,其中每个顶点至少有k个邻居。许多研究最大化了k-core中的顶点数量,以提高网络的稳定性。在本文中,我们研究边k核问题:给定图G,整数k和预算b,将B边添加到G中的非相邻顶点对,使得k核最大化。我们证明问题是NP难和APX难。在具有有效优化技术的通用图上提出了一种启发式算法。对9个真实数据集的综合实验证明了我们提出的方法的有效性和有效性。
关键边识别:基于K-Truss的模型
原文标题: Critical Edge Identification: A K-Truss Based Model
地址: http://arxiv.org/abs/1906.12335
作者: Wenjie Zhu, Mengqi Zhang, Chen Chen, Xiaoyang Wang, Fan Zhang, Xuemin Lin
摘要: 在社会网络中,用户之间关系的强度可以显著影响网络的稳定性。在本文中,我们使用k-truss模型来衡量社会网络的稳定性。为了识别关键连接,我们提出了一个新的问题,称为k-truss最小化。给定社会网络G和预算b,它旨在找到b边以进行删除,这可以导致G的k-truss中的最大边间断数。我们表明问题是NP难的。为了加速计算,开发了新的修剪规则以减小候选大小。此外,我们提出了一种基于上限的策略,以进一步减少搜索空间。在真实社会网络上进行综合实验,以证明所提出技术的效率和有效性。
建模城市
原文标题: Modeling cities
地址: http://arxiv.org/abs/1906.12342
作者: Marc Barthelemy
摘要: 城市是具有大量成分和代理人相互作用的系统,可被视为复杂系统的象征。对这些系统进行建模是一项真正的挑战,并引发了许多学科的兴趣,如定量地理学,空间经济学,地理学和城市化,以及最近的物理学。 (统计学)物理学通过提供能够理论和实证结果的工具和概念起着重要作用,我们将在城市的一些基本方面进行说明:表面积和人口的增长,空间组织和空间活动分配。我们将展示最先进的结果和模型,同时也提出我们仍然有部分理解的问题以及物理方法可能特别有用的问题。我们将结束这篇简短的回顾,讨论建立城市科学的可能性。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
网友评论