- 标签传播与简单模型的结合胜过了图神经网络;
- 用户冷启动推荐的项目选择问题;
- 通过对演化过程进行建模来嵌入动态属性网络;
- 异构图元;
- 图标签转变实现在线社会网络的抗扰动;
- 使用移动性数据分析第一波COVID-19浪潮之后的遏制策略;
- 随着时间的流逝,COVID-19推文的全球情绪分析;
- 超图中的随机游走和社区检测;
- 网络上多商品路由的最优传输;
- 全部都在(副)标题中了吗?扩展众筹研究中的信号评估;
- 大流行控制经济效果的启发式评估;
- 基于网络的意大利COVID-19流行预测;
标签传播与简单模型的结合胜过了图神经网络
原文标题: Combining Label Propagation and Simple Models Out-performs Graph Neural Networks
地址: http://arxiv.org/abs/2010.13993
作者: Qian Huang, Horace He, Abhay Singh, Ser-Nam Lim, Austin R. Benson
摘要: 图神经网络(GNN)是学习图的主要技术。但是,对于GNN为什么在实践中取得成功以及它们是否对取得良好业绩是必要的理解还很少。在这里,我们表明,对于许多标准的转导节点分类基准,通过将忽略图结构的浅层模型与两个简单的后处理步骤结合起来使用,我们可以超越或匹配最新的GNN的性能,而后处理步骤利用了标签结构:(i)“误差相关性”,它在训练数据中散布残余错误以纠正测试数据中的错误;以及(ii)“预测相关性”,它使对测试数据的预测变得平滑。我们称此总体过程为“正确和平滑(C&S)”,后处理步骤是通过从早期基于图的半监督学习方法对标准标签传播技术进行简单修改而实现的。我们的方法在各种基准上都超过或接近了最新GNN的性能,仅一小部分参数就将运行时间提高了几个数量级。例如,我们以137倍的参数减少和超过100倍的训练时间超过了OGB-Products数据集上最著名的GNN性能。我们方法的性能突显了如何将标签信息直接整合到学习算法中(就像传统技术一样),从而获得简单而可观的性能提升。我们还可以将我们的技术整合到大型GNN模型中,从而获得适度的收益。我们的OGB结果代码位于https://github.com/Chillee/CorrectAndSmooth。
用户冷启动推荐的项目选择问题
原文标题: The item selection problem for user cold-start recommendation
地址: http://arxiv.org/abs/2010.14013
作者: Yitong Meng, Jie Liu, Xiao Yan, James Cheng
摘要: 当新用户刚在网站上注册时,我们通常没有关于他/她的信息,即没有与项目的交互,没有用户的个人资料以及与其他用户的社交链接。在这种情况下,我们仍然希望我们的推荐系统可以在第一时间吸引用户,以便用户决定留在网站上并成为活跃用户。这个问题属于新用户冷启动类别,对公司的发展甚至生存至关重要。现有的有关用户冷启动建议的工作或者需要用户的额外努力,例如设置采访过程,或使用辅助信息[10],例如用户的人口统计信息,位置,社会关系等。但是,用户可能不愿意接受采访,因此冷启动用户的辅助信息通常不可用。因此,我们考虑一种纯冷启动方案,其中既没有交互作用也没有辅助信息,并且不需要用户付出任何努力。研究此设置对于初始化其他冷启动解决方案也很重要,例如初始化采访的前几个问题。
通过对演化过程进行建模来嵌入动态属性网络
原文标题: Embedding Dynamic Attributed Networks by Modeling the Evolution Processes
地址: http://arxiv.org/abs/2010.14047
作者: Zenan Xu, Zijing Ou, Qinliang Su, Jianxing Yu, Xiaojun Quan, Zhenkun Lin
摘要: 网络嵌入近来已成为将网络节点嵌入到低维向量中的一种有前途的技术。尽管相当成功,但大多数现有作品都集中在静态网络的嵌入技术上。但是实际上,有许多网络随着时间的流逝而发展,因此是动态的,例如社会网络。为理解决这个问题,开发了一个高阶的时空嵌入模型来跟踪动态网络的发展。具体来说,首先提出了一种主动感知的邻域嵌入方法,以在每个给定的时间戳提取高阶邻域信息。然后,进一步开发了嵌入预测框架来刻画时间相关性,其中使用注意力机制代替递归神经网络(RNN)来提高计算效率和建模灵活性。对来自三个不同区域的四个真实世界数据集进行了广泛的实验。结果表明,所提出的方法在动态链路预测和节点分类的任务上要比所有基线都大幅度提高,这证明了所提出方法在跟踪动态网络发展方面的有效性。
异构图元
原文标题: Heterogeneous Graphlets
地址: http://arxiv.org/abs/2010.14058
作者: Ryan A. Rossi, Nesreen K. Ahmed, Aldo Carranza, David Arbour, Anup Rao, Sungchul Kim, Eunyee Koh
摘要: 在本文中,我们介绍了图集到称为类型图集的异构网络的一般化。非正式地,类型化小图是小型类型化诱导子图。类型化图集将图集泛化为丰富的异构网络,因为它们明确刻画了此类网络中的高阶类型化连接模式。为理解决这个问题,我们描述了一种用于计算此类类型化graphlet发生次数的通用框架。所提出的算法针对不同类型的图小图利用了许多组合关系。对于每个边,我们计算几个类型化的小图,并利用这些计数以及组合关系,在o(1)恒定时间内获得其他类型的小图的精确计数。值得注意的是,所提出的方法的最坏情况下的时间复杂度与最著名的无类型算法的时间复杂度相匹配。另外,该方法适合于高效的无锁和异步并行实现。尽管没有现有的用于类型化图小图的方法,但是有一些工作集中在计算称为彩色图小图的不同且简单得多的概念上。实验证实,我们提出的方法比计算有色图子的简单概念的方法快几个数量级,并且空间效率更高。与这些方法在小型网络上花费数小时不同,所建议的方法在具有数百万个边的大型网络上仅花费数秒。值得注意的是,由于有类型的小图比彩色的小图(和无类型的小图)更通用,因此可以将各种有类型的小图的计数进行组合以获得更简单的有色的图小图的计数。提出的方法为类型化的图集带来了新的机会和应用。
图标签转变实现在线社会网络的抗扰动
原文标题: Anti-perturbation of Online Social Networks by Graph Label Transition
地址: http://arxiv.org/abs/2010.14121
作者: Jun Zhuang, Mohammad AI Hasan
摘要: 众多流行的在线社会网络(OSN)会将用户分类为不同的类别,并以相似的兴趣向彼此推荐用户。少数用户(所谓的微扰器)可能会执行某些类型的行为,从而严重干扰此类OSN分类器。 OSN管理员手动注释是一种潜在的解决方案。但是,手动注释不可避免地带来噪音。此外,此类干扰者不是Sybil用户,因此无法冻结其帐户。为了提高此类OSN分类器的鲁棒性,我们将此问题概括为图卷积网络(GCN)对节点分类任务的防御。现有大多数针对此任务的防御措施可以分为基于对抗的方法和基于检测的方法。基于对抗的方法通过训练对抗性样本来提高GCN的鲁棒性。但是,在我们的情况下,OSN管理员很难区分扰动者,因此我们不能在训练阶段使用对抗性样本。相比之下,基于检测的方法旨在检测攻击者的节点或边,并通过消除它们来减轻负面影响。但是,在我们的方案中,干扰者不是攻击者,因此无法消除。两种方法都不能解决上述问题。为理解决这些问题,我们提出了一种新颖的图标签转换模型,称为GraphLT,以通过基于动态条件标签转换转换节点潜在表示来提高OSN分类器的鲁棒性。大量的实验表明,GraphLT不仅可以在干净的环境中显著提高节点分类器的性能,而且还可以在图扰动之后以优于七个基准数据集上竞争方法的性能成功地对分类器进行补救。
使用移动性数据分析第一波COVID-19浪潮之后的遏制策略
原文标题: Containment strategies after the first wave of COVID-19 using mobility data
地址: http://arxiv.org/abs/2010.14209
作者: Martijn Gösgens, Teun Hendriks, Marko Boon, Stijn Keuning, Wim Steenbakkers, Hans Heesterbeek, Remco van der Hofstad, Nelly Litvak
摘要: 在应对COVID-19疫情时,政府面临着平衡公共卫生与经济的困境。流动性在这一难题中起着核心作用,因为人员流动既可以促进经济活动,又可以传播病毒。我们以区域之间旅行者数量的形式使用流动性数据,以扩展常用的SEIR模型以包括区域之间的流动性。我们根据决策者选择的单个参数来量化流动性和感染传播之间的权衡,并提出限制流动性的策略,以便在有效限制感染传播的同时,将限制降至最低。我们考虑了将国家划分为区域的限制条件,并研究了在这些区域内允许流动且不允许在这些区域之间流动的情景。我们提出启发式方法来近似这些区域的最佳选择。我们根据权衡评估获得的限制。结果表明,当感染高度集中时(例如在几个城市附近),我们的方法特别有效,这是由于超级传播事件在COVID-19的传播中起着重要作用。我们以荷兰为例演示我们的方法。当可获得流动性数据时,结果将更广泛地适用。
随着时间的流逝,COVID-19推文的全球情绪分析
原文标题: Global Sentiment Analysis Of COVID-19 Tweets Over Time
地址: http://arxiv.org/abs/2010.14234
作者: Muvazima Mansoor, Kirthika Gurumurthy, Anantharam R U, V R Badri Prasad
摘要: 冠状病毒大流行影响了正常的生活过程。世界各地的人们都对社交媒体表达了自己的观点和对这种风靡全球的现象的一般情感。社交网站Twitter在很短的时间内显示了与新型冠状病毒相关的推文前所未有的增长。本文介绍了与冠状病毒相关的推文的全球情感分析,以及不同国家/地区人们的情感如何随时间变化。此外,为了确定冠状病毒对日常生活的影响,我们删除了与在家工作(WFH)和在线学习相关的推文,并观察了情绪随时间的变化。另外,实现了各种机器学习模型,例如长期短期记忆(LSTM)和人工神经网络(ANN),用于情感分类,并确定了其准确性。还对一个数据集进行了探索性数据分析,该数据集提供了一些受灾最重的国家每天确诊病例数的信息,以比较情绪变化与自开始以来的病例变化之间的比较。这种大流行持续到2020年6月。
超图中的随机游走和社区检测
原文标题: Random walks and community detection in hypergraphs
地址: http://arxiv.org/abs/2010.14355
作者: Timoteo Carletti, Duccio Fanelli, Renaud Lambiotte
摘要: 我们提出了一个在超图上的随机游走过程的参数家庭,其中一个参数将步行者的动态偏向低或高基数的超边。我们表明,对于参数的每个值,生成的过程将在加权网络上定义其自己的超图投影。然后,我们通过考虑与每个随机行走过程相关的社区结构来探索它们之间的差异。为此,我们将马尔可夫稳定性框架推广到超图上,并在人工和真实世界的超图上进行测试。
网络上多商品路由的最优传输
原文标题: Optimal transport for multi-commodity routing on networks
地址: http://arxiv.org/abs/2010.14377
作者: Alessandro Lonardi, Enrico Facca, Mario Putti, Caterina De Bacco
摘要: 我们提出了一种基于最优运输理论的网络上最优多商品流的寻找模型。该模型依赖于求解动力学方程组。我们证明了它的平稳解等于推广一个商品框架的优化问题的解。特别是,它从在单商品情况下获得的最优性,尺度比例和相变方面概括了以前的结果。值得注意的是,对于合适的参数范围,最佳拓扑具有循环。这与单一商品的情况根本不同,后者在类似参数范围内,最佳拓扑是树。这一重要结果是柯克霍夫定律扩展到多商品案件的结果,该案件加强了不同商品通量之间的区别。我们的结果为最佳网络拓扑的性质和性质提供了新的见解。特别是,它们表明,循环可能是由于区分不同的流类型而产生的,并补充了先前的结果,在单商品情况下,循环是由于对源和汇施加动态规则或强制执行鲁棒性而产生的损坏。最后,我们为两个等效数值框架中的每一个都提供了一种有效的实现,这两个框架都实现了比基于梯度下降的标准优化方法更有效的计算复杂性。结果,我们的模型不仅是抽象的,而且可以有效地应用于大型数据集。通过研究巴黎地铁的网络,我们给出了具体应用的示例。
全部都在(副)标题中了吗?扩展众筹研究中的信号评估
原文标题: It's all in the (Sub-)title? Expanding Signal Evaluation in Crowdfunding Research
地址: http://arxiv.org/abs/2010.14389
作者: Constantin von Selasinsky, Andrew Jay Isaak
摘要: 结合CATA(计算机辅助文本分析)的众筹成功研究正在迅速进入大联盟(例如,Parhankangas和Renko,2017; Anglin等,2018; Moss等,2018),并且通常在理论上基于信息不对称,社会资本,信号传递或其组合。然而,目前探索众筹成功标准的论文未能充分利用可用信号的广度,并且只有极少数此类论文研究了技术项目。在本文中,我们比较并对比了企业家文本成功信号对此类支持者的实力。根据从Kickstarter收集的1,049个技术项目的随机样本,我们不仅评估了项目名称和描述中的文字信息,还评估了视频字幕中的文字信息。我们发现,合并字幕信息会增加各个模型所解释的方差,因此也会增加其对资金成功的预测能力。通过扩大信息领域,我们的工作将推动该领域的发展,并为更精细地研究众筹中的成功信号铺平道路,从而更好地理解人群中的投资者决策。
大流行控制经济效果的启发式评估
原文标题: Heuristic assessment of the economic effects of pandemic control
地址: http://arxiv.org/abs/2010.14452
作者: Xiang Niu, Christopher Brissette, Chunheng Jiang, Jianxi Gao, Gyorgy Korniss, Boleslaw K. Szymanski
摘要: 数据驱动的风险网络描述了流行病学和生态学等领域出现的许多复杂的系统动态。它们缺乏明确的动力,并且具有多种成本来源,这两种成本都超出了传统控制理论的当前范围。我们将世界经济论坛专家的共识与风险激活数据相结合,以定义其拓扑结构和相互作用,从而构建全球风险网络。许多此类风险(包括极端天气)在活动时会造成巨大的经济损失。我们介绍了一种将网络交互数据转换为连续动态的方法,并对其应用了最佳控制。我们为根据经验收集的数据构建和控制风险网络动态的第一种方法做出了贡献。我们确定了政府通常用来控制COVID-19传播的七种风险,并表明存在许多替代的驾驶员风险集,且潜在的控制成本较低。
基于网络的意大利COVID-19流行预测
原文标题: Network-based Prediction of COVID-19 Epidemic Spreading in Italy
地址: http://arxiv.org/abs/2010.14453
作者: Clara Pizzuti, Annalisa Socievole, Bastian Prasse, Piet Van Mieghem
摘要: SARS-CoV-2病毒最初出现在中国的武汉市,随后在世界范围内引起大流行,SARS-CoV-2病毒在中国病例的接触网络上遵循了SIR(易感传染病恢复)流行模型。在本文中,我们还将研究意大利网络上SIR模型的预测准确性。具体来说,意大利地区是由网络节点代表的一个族群,网络链接是这些地区之间的互动。然后,我们修改基于网络的SIR模型,以考虑到意大利政府在COVID-19传播的各个阶段所采取的不同锁定措施。我们的结果表明,当将时变锁定协议纳入经典SIR模型时,基于网络的模型可以更好地预测每日累积感染个体。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论