- 复杂网络中的层次结构和中心性之间的相互作用;
- 隐式图神经网络中的图信息消失现象;
- 互惠-竞争随机网络的统计性质;
- 度相关性引起的网络不对称及其对控制中双峰的影响;
- 从一个网络快照对优先连接函数进行非参数估计;
- 具有高度模块化的优先连接超图;
- 政治地理的不对称性与区域的紧凑性:偏见的计算分析;
- 移动性驱动的生物共存;
- 理解跨艺术、文化和科学职业的好运气的开始;
- 行为的性别典型性可预测创意平台上的成功;
- 在基于匿名位置的社会网络中使用机器学习理解和预测用户寿命;
- 公平意识代表排名的公平程度和公平排名的方法;
- TweetCOVID:一个用于通过Twitter活动分析公众情绪和对COVID-19进行讨论的系统;
- 英国用于组合有效复制数,R(t)和其他相关度量COVID-19的统计方法;
复杂网络中的层次结构和中心性之间的相互作用
原文标题: Interplay Between Hierarchy and Centrality in Complex Networks
地址: http://arxiv.org/abs/2103.01376
作者: Stephany Rajeh, Marinette Savonnet, Eric Leclercq, Hocine Cherifi
摘要: 层次结构和中心性是两个流行的概念,用于表征复杂系统中实体的重要性。实际上,许多复杂的系统都具有自然的层次结构,而中心性是允许识别关键组成部分的基本特征。为了量化这些概念,已经提出了几种基于网络拓扑各个方面的措施。尽管大量研究调查了集中度度量是否传达了多余的信息,但是集中度和层次结构度量之间的关系仍然是一个未解决的问题。在本文中,我们使用几种相关性和相似性评估方法来研究中心性和层次结构之间的相互作用。为了评估6个集中度度量与4个等级度量在28个具有不同拓扑特征的不同真实世界网络中的组合,进行了一系列实验。结果表明,网络密度和传递性在塑造中心性和等级测度之间的关系模式方面起着关键作用。
隐式图神经网络中的图信息消失现象
原文标题: Graph Information Vanishing Phenomenon inImplicit Graph Neural Networks
地址: http://arxiv.org/abs/2103.01770
作者: Haifeng Li, Jun Cao, Jiawei Zhu, Qing Zhu, Guohua Wu
摘要: GNN的关键问题之一是如何在聚合过程中描述邻居节点对于学习节点表示的重要性。一类GNN通过学习隐式权重来表示邻居节点的重要性来解决此问题,我们将其称为隐式GNN,例如图注意力网络。隐式GNN的基本思想是引入具有特殊属性的图信息,然后引入可学习的转换结构(LTS),该结构通过数据驱动的方式对邻居节点的重要性进行编码。在本文中,我们认为LTS使图信息的特殊属性在学习过程中消失,从而导致图信息对学习节点表示无益。我们称这种现象为图信息消失(GIV)。此外,我们发现LTS将不同的图信息映射为高度相似的结果。为了验证以上两点,我们通过使用随机置换算子随机破坏图信息的顺序并将图信息替换为随机值,在五种隐式GNN方法和七个基准数据集上设计了两组70个随机实验。我们发现,在93%的情况下,随机化不会影响模型性能,大约7%的情况会导致平均0.5%的精度损失。由LTS映射不同图信息生成的输出结果的余弦相似度超过99 %,比例为81 %。实验结果为支持隐式GNN中GIV的存在提供了证据,并且暗示了隐式GNN的现有方法没有充分利用图信息。应该重新考虑图信息和LTS之间的关系,以确保在节点表示中使用图信息。
互惠-竞争随机网络的统计性质
原文标题: Statistical properties of mutualistic-competitive random networks
地址: http://arxiv.org/abs/2103.01922
作者: C. T. Martínez-Martínez, J. A. Méndez-Bermúdez, Thomas Peron, Yamir Moreno
摘要: 互惠网络用于研究互惠关系固有的结构和过程。在本文中,我们介绍了一个随机矩阵集合(RME),它表示由两个大小为 n 和 m-n 的顶点集组成的互惠网络的邻接矩阵。我们的RME取决于三个参数:网络大小 n ,较小集合 m 的大小以及两个集合 alpha 之间的连通性,其中 alpha 是当前相邻对对之间的比率。组之间可能的相邻对的总数。通过分别计算连续特征值间距 r 的比值,特征向量 S 的香农熵和Randi'c指数 R ,我们分别关注RME的谱,特征向量和拓扑属性。首先,在随机矩阵理论方法(即统计方法)中,我们确定参数 xi equiv xi(n,m, alpha)来尺度平均归一化度量 left < overline X right> (其中 X 代表 r , S 和 R )。具体来说,我们显示(i)对 m 的依赖性较弱的 xi propto alpha n ,以及(ii)对于 xi <1/10 ,互惠网络中的大多数顶点都是孤立的,而对于 xi> 10 ,网络获得了完整网络的属性,即,从孤立的顶点到类似完整行为的过渡发生在区间 1/10 < xi <10 中。然后,我们证明了我们的统计方法可以很好地预测现实世界互惠网络的性质;也就是说,通用曲线 left < overline X right> vs. xi 与真实网络的属性具有良好的对应关系。
度相关性引起的网络不对称及其对控制中双峰的影响
原文标题: The network asymmetry caused by the degree correlation and its effect on the bimodality in control
地址: http://arxiv.org/abs/2103.01591
作者: Xiaoyao Yu, Yongqing Liang, Xiaomeng Wang, Tao Jia
摘要: 我们控制整个网络的能力可以通过一小组驱动程序节点来实现。尽管在给定的网络中控制所需的最小驱动程序节点数是固定的,但对于驱动程序节点集,有多种选择。用于研究这种多样性的数量是网络中冗余节点的比例,指的是不需要任何外部控制的节点。先前的工作发现了一种以分叉图为特征的双峰特征:具有相同统计属性的网络将以相同的概率停留,具有很大或很小一部分冗余节点。在这里,我们发现此特征植根于有向网络的对称性中,其中度分布和度相关都可以发挥作用。进出度相关性将抑制分叉,因为具有这种度相关性的网络在网络转置下是不对称的。出入和出入程度的相关性不会改变网络对称性,因此保留了双峰特征。但是,出入度相关将改变分叉所需的临界平均度。因此,通过固定网络的平均程度并单独调整外向度相关性,我们可以观察到类似的分叉图。我们进行分析分析,以充分解释由度外相关引起的双峰现象的出现。我们还提出了一个数量,同时考虑了度数分布和度数相关性,以预测网络是在分叉的上分支还是下分支。众所周知,大多数实际网络都不是中立的,我们的结果扩展了我们对复杂网络可控性的理解。
从一个网络快照对优先连接函数进行非参数估计
原文标题: Nonparametric estimation of the preferential attachment function from one network snapshot
地址: http://arxiv.org/abs/2103.01750
作者: Thong Pham, Paul Sheridan, Hidetoshi Shimodaira
摘要: 测量成长中的网络中的优先依恋是网络科学中的一个重要主题,因为对引起真实网络特征的重尾度分布的生成过程的假设的实验确认依赖于此。已经设计出多种方法来测量时间分辨网络中的优先连接。但是,许多实际网络数据集仅作为单个快照提供。我们提出了一种新颖的非参数方法,称为PAFit-oneshot,用于从一个快照中估计成长中的网络的优先连接功能。 PAFit-oneshot方法可校正仅针对单个快照中观察到的度数估计优先连接值时出现的偏差。这种偏见以前没有引起注意,它与最近开发的称为后选择推理的条件推理方法有关。大量的实验表明,我们的方法在模拟网络和实际网络中都能恢复真正的优先附着功能。我们的工作为网络科学家开辟了一条新的途径,可以用来衡量迄今为止尚未使用的大量单快照网络中的优先连接。作为演示,我们非参数地估计了三个这样的网络中的优先依附函数,发现它们都是亚线性的。 PAFit-oneshot方法是在R包PAFit中实现的。
具有高度模块化的优先连接超图
原文标题: Preferential attachment hypergraph with high modularity
地址: http://arxiv.org/abs/2103.01751
作者: Frédéric Giroire, Nicolas Nisse, Thibaud Trolliet, Małgorzata Sulkowska
摘要: 已经提出了许多工作来生成随机图,该随机图保持与现实生活中的大规模网络相同的特性。但是,许多实际网络可以用超图更好地表示。很少有用于生成随机超图的模型,并且没有通用模型可以同时保留幂律度分布和指示社区存在的高模块化。我们提出了一个动态的优先连接超图模型,该模型具有划分成多个社区的特征。我们证明了其度数分布遵循幂律,并且给出了其模块化的理论下界。我们将其特征与现实生活中的共同作者网络进行了比较,并表明我们的模型取得了良好的效果。我们相信,我们的超图模型将是一个有趣的工具,可以在许多研究领域中使用,以反映更好的现实生活现象。
政治地理的不对称性与区域的紧凑性:偏见的计算分析
原文标题: Asymmetry in Political Geography and Compactness in Districting: a Computational Analysis of Bias
地址: http://arxiv.org/abs/2103.01735
作者: Constantine (Dinos) Gonatas
摘要: 我们调查了十个不同国家/地区的党派分布,以阐明选票如何转化为赢得的席位和其他指标。考虑党派分布的马尔可夫链模拟令人惊讶地与简单模型很好地吻合,该模型仅覆盖区域投票结果的相等投票人口加权分布,不包含空间信息。我们发现,不对称现象使民主党人赢得的选区少于共和党人,但在多数党派中却如此。即使在某些州对民主党拥有全州多数投票权的州,这种偏见也导致共和党对州议会和国会席位的持续控制。尽管基于覆盖许多随机场景的模拟结果得出的平均结果显示出许多州的共和党优势,但模拟产生了广泛的指标,这表明通过选择效率差距小的值的分区计划比选择具有效率差距的计划可以更好地将偏差最小化。值接近随机模拟整体的均值。我们研究了对县级划分的约束,以实现更高的紧凑性,并调查了需要凝聚力的政策,以筛选出最明显的游民。最小化县的分裂并不一定减少党派偏见,除了宾夕法尼亚州,限制县的分裂似乎可以减少偏见。
移动性驱动的生物共存
原文标题: Mobility driven coexistence of living organisms
地址: http://arxiv.org/abs/2103.01250
作者: B.F. de Oliveira, M.V. de Moraes, D. Bazeia, A. Szolnoki
摘要: 我们提出了一个最小的生物的非晶格模型,其中仅假设了很少的动态增长规则。当我们用局部应用的规则替换全局限制规则时,会检测到许多群集的稳定共存。揭示了各种各样的演化模式,其中玩家的移动对演化的结果具有决定性的作用。例如,密集的个人活动可能会危及人口的生存,但是如果我们进一步增加玩家的活动,则可以节省人口。值得注意的是,人口成员的集体动力能够弥补密集运动的负面影响,并使系统保持活力。当驱动器变得偏斜时,所产生的单向流将改变稳定模式并产生条纹状状态,而不是先前观察到的簇的六边形排列。有趣的是,如果单个运动超过阈值,则可以翻转条纹的旋转。
理解跨艺术、文化和科学职业的好运气的开始
原文标题: Understanding the onset of hot streaks across artistic, cultural, and scientific careers
地址: http://arxiv.org/abs/2103.01256
作者: Lu Liu, Nima Dehmamy, Jillian Chown, C. Lee Giles, Dashun Wang
摘要: 热条纹主导着创意事业的主要影响。尽管它们在广泛的创意领域中无处不在,但目前尚不清楚热条纹的开始是否存在任何规律性。在这里,我们使用深度学习和网络科学来开发计算方法,并将其应用于追踪艺术家,电影导演和科学家的职业产出的新颖的大规模数据集,从而使我们能够建立艺术品,电影和摄影作品的高维度表示形式。他们制作的科学出版物。通过检查个人在潜在创意空间中的职业轨迹,我们发现在所有三个领域中,个人倾向于在热连胜之前探索各种风格或主题,但是在热连胜开始后,他们会变得更加专注于他们的工作。至关重要的是,我们发现热斑与孤立地勘探或开发行为无关,而是特定的勘探顺序,随后是剥削,即从勘探到剥削的过渡密切追踪了热斑的发生。总体而言,这些结果揭示了热条纹发作的第一个可识别规律性,这种规律性在各个创意领域中普遍存在,这表明,平衡实验和实施的创意策略的顺序视图对于产生持久的贡献可能特别有力,对于识别和培养创意人才可能具有广泛的意义。
行为的性别典型性可预测创意平台上的成功
原文标题: Gender Typicality of Behavior Predicts Success on Creative Platforms
地址: http://arxiv.org/abs/2103.01093
作者: Orsolya Vasarhelyi, Balazs Vedres
摘要: 互联网上的协作平台已成为独立创意工作者的重要工具,从而促进了与协作者,用户和购买者的联系。这样的平台有望为妇女和其他代表性不足的群体提供更好的进入市场和合作者的机会,但是越来越多的证据表明,它们使现有的偏见和不平等长期存在。在先前的工作中,我们发现,大多数女性在GitHub上获得成功和生存的劣势都源于她们在开源编程中的行为性别特征,而不是基于对性别的绝对歧视。在本文中,我们在另一个平台上复制了我们的发现,而这个平台的重点明显不同。Behance是一个图艺术家社区。我们还将研究注意力作为两个平台上的新成果。我们发现,女性行为的典型性是创造平台上注意力,成功和生存的重要负面预测指标,而分类性别的影响因结果和领域而异。我们发现,在技术领域中,女性的可见性悖论得到了支持,而女性行为的典型性与注意力负相关,因为女性预示着更高的注意力水平。我们通过性别行为量化了同性恋同性对成功的间接影响,这种行为占女性成功中不利条件的37%。我们的发现表明,行为性别典型性的负面影响是比我们的第一个研究表明的更为普遍的现象,突显了在平台经济中应对无意识的性别偏见的挑战范围。
在基于匿名位置的社会网络中使用机器学习理解和预测用户寿命
原文标题: Understanding & Predicting User Lifetime with Machine Learning in an Anonymous Location-Based Social Network
地址: http://arxiv.org/abs/2103.01300
作者: Jens Helge Reelfs, Max Bergmann, Oliver Hohlfeld, Niklas Henckell
摘要: 在这项工作中,我们预测了沙特阿拉伯王国基于匿名和基于位置的社会网络Jodel中的用户寿命。 Jodel基于位置的性质有助于在全国范围内建立不相交的社区,并且在有大量不相交的社区的情况下,首次实现了用户寿命的研究。用户的寿命是评估和引导客户群的重要衡量指标,因为可以利用它来预测客户流失并可能应用适当的方法来规避潜在的用户损失。我们使用5倍交叉验证来训练和测试现成的机器学习技术,以预测用户的生命周期,作为回归和分类问题;确定随机森林以提供非常出色的结果。在讨论模型的复杂性和质量折衷时,我们还将深入研究与时间有关的特征子集分析,该分析效果不佳。将分类问题简化为二元决策(生存期长于时间跨度 x )可以使实用的寿命预测器具有非常好的性能。根据功能重要性之间的强相关性,我们确定了跨社区模型的隐式相似性。一个单一的全国性模型可以概括该问题,并且对于任何经过测试的社区都同样有效;整体模型在内部与其他模型相似,其功能重要性也表明了这一点。
公平意识代表排名的公平程度和公平排名的方法
原文标题: How Fair is Fairness-aware Representative Ranking and Methods for Fair Ranking
地址: http://arxiv.org/abs/2103.01335
作者: Akrati Saxena, George Fletcher, Mykola Pechenizkiy
摘要: 人员和项目的排名已在选择,匹配和推荐算法中得到了广泛使用,这些算法已部署在从就业网站到搜索工具的各种平台上。候选人的排名位置影响排名的候选人获得的机会数量。在几本著作中已经观察到,基于候选人得分的候选人排名可能会偏向属于少数族裔的候选人。在最近的工作中,提出了公平意识代表排名,用于计算结果的公平意识重新排名。所提出的算法相对于一个或多个受保护的属性实现了排名靠前的结果的所需分布。在这项工作中,如果该小组在平台上处于非活动状态,则我们着重强调个人以及对小组的公平意识代表排名的偏向。我们定义了个人不公平和群体不公平,并提出了在普遍代表比例已知或未知的情况下产生理想的个人和群体公平代表排名的方法。仿真结果表明了所提出解决方案中公平性的量化分析。本文以开放的挑战和进一步的方向结束。
TweetCOVID:一个用于通过Twitter活动分析公众情绪和对COVID-19进行讨论的系统
原文标题: TweetCOVID: A System for Analyzing Public Sentiments and Discussions about COVID-19 via Twitter Activities
地址: http://arxiv.org/abs/2103.01472
作者: Jolin Shaynn-Ly Kwan, Kwan Hui Lim
摘要: COVID-19大流行已经造成了广泛的健康和经济影响,影响了全球数百万人。为了更好地理解这些影响,我们介绍了TweetCOVID系统,该系统提供了在一段时间,不同地点,不同地点,在其情绪,情感,感兴趣的话题和有争议的讨论方面,理解公众对COVID-19大流行的反应的能力,使用公开推文。我们还提供了三个示例用例,这些用例说明了我们提出的TweetCOVID系统的有用性。
英国用于组合有效复制数,R(t)和其他相关度量COVID-19的统计方法
原文标题: Statistical methods used to combine the effective reproduction number, R(t), and other related measures of COVID-19 in the UK
地址: http://arxiv.org/abs/2103.01742
作者: T. Maishman, S. Schaap, D.S. Silk, S.J. Nevitt, D.C. Woods, V.E. Bowman
摘要: 在COVID-19大流行中,已使用一系列流行病学模型来预测新的每日感染次数 I ,每日指数增长速率 r 和有效繁殖数量 R(t)。这些模型在方法(例如机械或经验)和/或关于空间或年龄混合的假设方面有所不同,并且某些模型在科学地理解疾病动态方面存在不确定性,并且/或者具有不同的简化假设。组合来自多个模型的估计以更好地理解这些结果度量的变化,对于帮助做出决策很重要。我们使用荟萃分析,结合了来自特定英国国家/地区的许多候选模型对这些结果度量的估计。已经实现了随机效应模型,以适应候选模型之间的不同建模方法和假设。限制最大似然(REML)用于估计异质性方差参数,其中两种方法可计算组合效应的置信区间:标准Wald型区间和Knapp和Hartung(KNHA)方法。单独使用REML和REML + KNHA的方法为 R(t)和 r 提供了相似的变化范围。但是,将 I 的估计值与REML + KNHA方法结合使用可提供更为保守的置信区间时,会发现差异。这可能是由于为该结果度量贡献估计的候选模型数量有限,加上模型估计之间观察到的巨大差异。利用这些荟萃分析技术,可以计算出关键COVID-19结果指标的统计稳健的组合估算值,从而可以对当前的响应指标以及相关的不确定性进行全面评估。反过来,这允许根据所有可用信息进行及时而明智的决策。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论