- 依赖边的顶点权重的超图上的随机游走;
- 从社交媒体来源获取高速流图;
- 复杂网络中恢复的持久阈值动态;
- 最大异配网络上的渗流;
- 人类接触网络的性质不断变化及其对流行病过程的影响;
- 树状时态网络中的并发性和可达性;
- 内容与结构融合的通用多层网络数据分析;
- 量化新颖性和影响力,以及范式转换的模式;
- 从流中学习保守网络;
- 社交媒体流简单有效早期抑郁检测的文本分类框架;
依赖边的顶点权重的超图上的随机游走
原文标题: Random Walks on Hypergraphs with Edge-Dependent Vertex Weights
地址: http://arxiv.org/abs/1905.08287
作者: Uthsav Chitra, Benjamin J Raphael
摘要: 超图在机器学习中用于模拟数据中的高阶关系。虽然图的谱方法已经很成熟,但超图的谱理论仍然是一个活跃的研究领域。在本文中,我们使用随机游走来开发具有依赖于边的顶点权重的超图的谱理论:超图,其中每个顶点 v 具有权重 gamma_e(v),用于描述贡献的每个事件超边界 e v 到hyperedge e 。我们推导出一个随机的基于步行的超图拉普拉斯算子,并限制了这种超图上随机游走的混合时间。此外,我们给出了这样的条件,在这些条件下,这些超图上的随机行走等同于图上的随机行走。作为推论,我们表明当前的机器学习方法依赖于拉普拉斯算子,该拉普拉斯算子来自在具有边无关顶点权重的超图上的随机游走,而不利用数据中的高阶关系。最后,我们使用真实世界的数据集来展示具有依赖于边的顶点权重的超图的优势。
从社交媒体来源获取高速流图
原文标题: Ingesting High-Velocity Streaming Graphs from Social Media Sources
地址: http://arxiv.org/abs/1905.08337
作者: Subhasis Dasgupta, Aditya Bagchi, Amarnath Gupta
摘要: 许多数据科学应用程序(如社会网络分析)使用图作为其主要数据形式。但是,从社交媒体获取图结构数据会带来一些有趣的挑战。第一个挑战是社交媒体数据的高数据速度和突发性质。第二个挑战是数据的复杂性使得摄取过程变得昂贵。如果我们想将流图数据存储在图数据库中,我们将面临第三个挑战 - 数据库通常无法维持高速,高突发数据的摄取。我们开发了一种自适应缓冲机制和一种图压缩技术,可以有效地缓解这一问题。我们方法的一个新方面是自适应缓冲算法使用数据速率,数据内容以及数据库机器的CPU资源来确定最佳数据摄取机制。我们进一步表明,摄取含时图压缩策略可以提高数据摄取数据的效率。我们通过大量实验验证了摄取优化策略的有效性。
复杂网络中恢复的持久阈值动态
原文标题: Persistent Threshold Dynamics with Recovery in Complex Networks
地址: http://arxiv.org/abs/1905.08358
作者: Nanxin Wei, Bo Fan
摘要: 二进制状态网络中的扩展阈值规则导致级联。我们研究了准鲁棒网络上的持续级联恢复动态,即对小触发器具有鲁棒性但对于较大触发器可能会崩溃的网络。据观察,根据触发和恢复的相对速率,网络属于两个动态阶段之一:崩溃或活动阶段。我们设计了一个分析框架,不仅表征了关键行为,而且表征了两个阶段中网络活动的时间演变。基于Agent的仿真结果与分析计算结果吻合良好,表明我们的方法对复杂网络中的持续级联动态具有很强的预测能力。
最大异配网络上的渗流
原文标题: Percolation on a maximally disassortative network
地址: http://arxiv.org/abs/1905.08466
作者: Shogo Mizutaka, Takehisa Hasegawa
摘要: 我们提出了一种最大不协调(MD)网络模型,它实现了最大负度相关性,并研究其渗透过渡,以讨论强度相关性对渗透临界行为的影响。使用二分网络的生成函数方法,我们分析地推导出逾渗阈值和临界指数。对于MD分度网络,其度分布为 P(k) sim k ^ - gamma ,我们表明MD网络和相应的不相关网络的关键性对于 gamma> 3是相同的但是 2 < gamma <3 不同。强度 - 度相关性显著影响重尾无标度网络中的渗流临界行为。我们对关键指数的分析结果通过有限大小的尺度参数在数值上得到证实。
人类接触网络的性质不断变化及其对流行病过程的影响
原文标题: Evolving nature of human contact networks with its impact on epidemic processes
地址: http://arxiv.org/abs/1905.08525
作者: Cong Li, Jing Li, Xiang Li
摘要: 人际接触网络由众多个体和它们之间的成对联系构成。然而,尚不知道产生接触模式的人类接触网络演变的动态性质。在这里,我们分析了三个经验数据集,并确定了时间人类接触网络演变的两个关键机制,即个人社会活跃的活动状态转换法,以及活跃个体采用的联系建立机制。我们考虑两种机制来提出人类接触网络的时间网络模型,称为记忆驱动(MD)模型。然后,我们研究了经验人类接触网络和四个相应的时间网络模型上的易感染(SI)传播过程,并将SI过程的完全流行时间与网络上的各种感染率进行比较。 MD模型中SI过程的完全流行时间与现实世界人类接触网络中的相同。此外,我们发现个体活动状态转变促进了传播过程,而活跃个体的接触建立抑制了普遍性。除此之外,我们观察到,即使只有一小部分人探索新的社会关系,也能够在网络上引发爆炸性的传播。建议的时间网络框架可以帮助进一步研究时间人类接触网络中的动态过程,并提供新的见解来预测和控制网络上的扩散过程。
树状时态网络中的并发性和可达性
原文标题: Concurrency and reachability in tree-like temporal networks
地址: http://arxiv.org/abs/1905.08580
作者: Eun Lee, Scott Emmons, Ryan Gibson, James Moody, Peter J. Mucha
摘要: 网络属性控制着各种传播过程的速度和程度,从简单的传染到复杂的级联。最近,对扩展过程的分析已从静态网络扩展到时间网络,其中节点和链接出现和消失。我们关注“可访问性”的影响,无论是从一个节点到另一个节点存在时间上一致的路径,还是“可达性”,即时间网络的相应“可访问性图”表示的密度。因此,可达性水平固有地限制了时间网络上任何扩散过程的可能程度。我们研究了边之间时间并发的总体水平以及网络在所有边聚集的结构内聚力的可达性。我们使用模拟结果并为随机网络开发异质平均场模型预测,以更好地量化基础时间网络的属性如何调节可达性。
内容与结构融合的通用多层网络数据分析
原文标题: Generic Multilayer Network Data Analysis with the Fusion of Content and Structure
地址: http://arxiv.org/abs/1905.08635
作者: Xuan-Son Vu, Abhishek Santra, Sharma Chakravarthy, Lili Jiang
摘要: 多特征数据分析(例如,在Facebook,LinkedIn上)是具有挑战性的,特别是如果想要通过选择感兴趣的特征进行分析而有效地进行并保持灵活性。可以从数据集中明确地给出特征(例如,年龄,性别,关系,政治观点等),但也可以从内容(例如,基于Facebook帖子的政治观点)导出特征。需要从多个角度进行分析,以了解数据集(或其子集)并推断有意义的知识。例如,年龄,地点和婚姻状况对政治观点的影响可能需要单独推断(或组合)。在本文中,我们采用多层网络(MLN)分析(非传统方法)来模拟Facebook数据集,集成内容分析和进行分析,这是由所需的基于应用程序的查询列表驱动的。我们的实验分析显示了在建模和分析具有多个特征的数据集时所提出的方法的灵活性和效率。
量化新颖性和影响力,以及范式转换的模式
原文标题: Quantifying Novelty and Influence, and the Patterns of Paradigm Shifts
地址: http://arxiv.org/abs/1905.08665
作者: Doheum Park, Juhan Nam, Juyong Park
摘要: 用于异构大规模数据建模和分析的定量计算方法的最新进展为理解人类行为和能力提供了新的机会,包括驱动诸如科学等创造性企业的创造力的表现。虽然创新对于新颖和有影响力的成就至关重要,但在创意作品中量化这些品质仍然是一项挑战。在这里,我们提出了一个信息论框架,用于根据创作作品的生成概率计算创作作品的新颖性和影响力,反映其元素与其他作品相比的独特程度。将形式主义运用到高质量,大型古典钢琴作品的数据集中,这些作品代表了弦乐的象征性进步 - 具有重要科学和知识价值的作品 - 跨越几个世纪的音乐历史,我们发现企业的发展历史可以是这是一种动态过程,表现出主导的,典型的创作风格,定义了不同的历史时期。这些发现可以使人们更深入地了解创新,人类创造力和创意企业的进步。
从流中学习保守网络
原文标题: Learning Conserved Networks from Flows
地址: http://arxiv.org/abs/1905.08716
作者: Satya Jayadev P., Shankar Narasimhan, Nirav Bhatt
摘要: 网络重建问题是网络科学中的一个挑战性问题。这项工作涉及重建网络,其中流在节点周围得到保存。这些网络称为保守网络。我们提出了一种用于描述守恒网络的保守图的新概念。研究了守恒图的性质。我们开发了一种方法,通过将这些图特性与学习技术相结合,利用多项式时间复杂度,从流中重建保守网络。我们表明,径向网络可以进行精确的网络重建。此外,我们扩展了从噪声数据重建网络的方法。我们在不同类型的径向网络上演示了所提出的方法。
社交媒体流简单有效早期抑郁检测的文本分类框架
原文标题: A Text Classification Framework for Simple and Effective Early Depression Detection Over Social Media Streams
地址: http://arxiv.org/abs/1905.08772
作者: Sergio G. Burdisso, Marcelo Errecalde, Manuel Montes-y-Gómez
摘要: 随着互联网的兴起,越来越需要建立能够有效处理社交媒体上的早期风险检测(ERD)问题的智能系统,例如早期抑郁症检测,早期谣言检测或性掠食者识别。这些系统现在主要基于机器学习技术,必须能够处理数据流,因为用户随时间提供数据。此外,这些系统必须能够确定何时处理的数据足以实际对用户进行分类。此外,由于ERD任务涉及人们生活可能受到影响的风险决策,因此这些系统也必须能够为其决策辩护。然而,大多数标准和最先进的监督机器学习模型(例如SVM,MNB,神经网络等)不适合处理这种情况。这是因为它们既可以作为黑盒子,也可以不支持增量分类/学习。在本文中,我们介绍SS3,一种新颖的文本分类监督学习模型,自然支持这些方面。 SS3旨在用作处理ERD问题的一般框架。我们在CLEF的早期抑郁症检测eRisk2017试验任务中评估了我们的模型。提交给本次比赛的30个贡献中的大多数使用了最先进的方法。实验结果表明,我们的分类器能够胜过这些模型和标准分类器,尽管计算成本较低且能够解释其基本原理。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
网友评论