- 复杂网络的交联双曲嵌入的优化;
- 理解大图嵌入的粗粒化;
- 是什么使人们加入阴谋论社区?社会因素在阴谋论参与中的作用;
- 制度相似性推动在线社区之间的文化相似性;
- COVID-19在美国的传播情况如何?使用交通和天气数据进行分析;
- 墨西哥蒙特雷凶杀案演变八年:网络方法;
- 顺序种子时态网络中的有效影响传播;
- 一种推荐系统中有偏随机游走的评分预测的信任游走:H指数中心性、项目和好友相似性的影响;
- 疫苗不良事件检测的多实例域自适应;
- GoCoronaGo:尊重隐私跟踪的COVID-19管理;
- 2020年斯特吉斯摩托车拉力赛和COVID-19;
- 复杂地球系统的统计物理学方法;
- 美国的社会经济差距和COVID-19;
- 基于动态图的流行病学模型用于COVID-19接触者追踪数据分析和最佳测试处方;
- 在COVID-19危机中使用语义网络分析预测金融市场;
复杂网络的交联双曲嵌入的优化
原文标题: Optimisation of the coalescent hyperbolic embedding of complex networks
地址: http://arxiv.org/abs/2009.04702
作者: Bianka Kovács, Gergely Palla
摘要: 一些观察表明,在实际网络后面存在潜在的双曲空间,这使得它们的结构非常直观,即连接的概率随着节点之间的双曲距离的减小而减小。沿这条线生成随机图的杰出网络模型是流行度相似度优化(PSO)模型,它同时提供无标度分布,高聚类和小世界属性。这些结果为开发双曲嵌入算法提供了强大的动力,该算法解决了基于网络结构找到节点的最佳双曲坐标的问题。非中心最小曲线嵌入(ncMCE)方法提供了一种非常有前途的双曲线嵌入方法,该方法属于合并嵌入算法家族。这种方法可在较低的运行时间下提供高质量的嵌入。在目前的工作中,我们建议在此框架中进一步优化角坐标,与原始版本相比,似乎可以减少对数损失并提高嵌入的贪婪路由得分,从而对推断的双曲线的质量进行额外的改进坐标。
理解大图嵌入的粗粒化
原文标题: Understanding Coarsening for Embedding Large-Scale Graphs
地址: http://arxiv.org/abs/2009.04925
作者: Taha Atahan Akyildiz, Amro Alabsi Aljundi, Kamer Kaya
摘要: 当今的很大一部分数据,例如社会网络,Web连接等,都可以通过图表来建模。使用机器学习(ML)算法对图进行适当的分析可能会产生对许多研究和行业领域的深刻见解。但是,图数据的不规则结构构成了在图上运行ML任务(例如链路预测,节点分类和异常检测)的障碍。图嵌入是将图表示为d维空间中的一组向量的计算密集型过程,这反过来使其适合ML任务。文献中已经提出了许多方法来改善图嵌入的性能,例如,使用分布式算法,加速器和预处理技术。图粗化(可以视为预处理步骤)是给定的大图和小图的结构近似。如文献所暗示的,当采用粗化时,嵌入的成本显著降低。在这项工作中,我们从速度和准确性两方面全面分析了粗化质量对嵌入性能的影响。我们使用最先进的快速图嵌入工具进行的实验表明,所采取的粗化决策与嵌入质量之间存在相互作用。
是什么使人们加入阴谋论社区?社会因素在阴谋论参与中的作用
原文标题: What Makes People Join Conspiracy Communities?: Role of Social Factors in Conspiracy Engagement
地址: http://arxiv.org/abs/2009.04527
作者: Shruti Phadke, Mattia Samory, Tanushree Mitra
摘要: 广泛的阴谋论,例如那些激发反疫苗态度或否认气候变化的理论,会推动集体行动并承担全社会的后果。然而,实证研究在很大程度上研究了阴谋理论的采用是个人追求,而不是社会中介过程。是什么使用户加入社区,认可和传播阴谋论?我们利用Reddit上56个阴谋社区的纵向数据来比较个人和社会因素,以确定哪些用户加入了社区。使用准实验方法,我们首先确定30K未来的阴谋家-(FC)和30K匹配的非阴谋家-(NC)。然后,我们通过分析600万个Reddit评论和帖子,提供相对于单个因素而言,社会因素在六个维度上的重要性的经验证据。特别是在社会因素方面,我们发现与阴谋社区成员的二元互动和阴谋社区以外的边化是阴谋加入甚至是超越个人因素基线的最重要的社会先兆。我们的结果提供了定量的支持,以了解在共谋活动中的社会过程和回声室效应,这对民主机构和在线社区具有重要意义。
制度相似性推动在线社区之间的文化相似性
原文标题: Institutional Similarity Drives Cultural Similarity among Online Communities
地址: http://arxiv.org/abs/2009.04597
作者: Qiankun Zhong, Seth Frey
摘要: 了解在线社区需要对结构和文化都有所了解。但是基本问题仍然很难提出。这些方面如何相互作用和相互驱动?利用有关5,000个小型在线社区的成员资格和治理方式的数据,我们构建了针对跨服务器相似的制度结构和文化的经验测度,以探索制度环境对其文化的影响以及文化对其制度环境的影响。为了建立文化和制度之间的相互影响,我们构建了社区网络,将在成员或治理上更相似的社区联系起来。然后,我们使用网络分析来评估共享文化与制度之间的因果关系。我们的结果表明,尽管在两个方向上的影响都是显而易见的,但文化机构对文化的作用远大于文化对机构的作用。这些过程在管理和信息类型规则中显而易见。
COVID-19在美国的传播情况如何?使用交通和天气数据进行分析
原文标题: How Political is the Spread of COVID-19 in the United States? An Analysis using Transportation and Weather Data
地址: http://arxiv.org/abs/2009.04612
作者: Karan Vombatkere, Hanjia Lyu, Jiebo Luo
摘要: 我们通过挖掘2020年3月至2020年7月美国居民的交通方式,调查了唐纳德·特朗普(红色)赢得的州和希拉里·克林顿(蓝色)赢得的州之间COVID-19传播的差异为了确保公平的比较,我们首先使用K-means聚类方法将50个州根据人口,面积和人口密度分为五个聚类。然后,我们使用居民旅行的平均百分比和每人的出行次数来表征不同州居民的日常交通方式。对于每个州,我们研究官方州重新开放日期前后两个月内的出行方式与感染率之间的相关性。我们观察到,在锁定期间,红色和蓝色状态均显示出其传播方式与感染率之间存在强正相关。但是,在州重新开放后,我们发现在所有五个州群集中,红色州的旅行感染相关性都高于蓝色州。我们发现,红色州和蓝色州的居民在州重新开放后的这段时间里表现出相似的出行方式,这使我们得出结论,平均而言,红色州的居民动员的安全性可能低于蓝色州的居民。此外,我们使用温度数据来尝试解释居民出行方式的差异并采取安全措施。
墨西哥蒙特雷凶杀案演变八年:网络方法
原文标题: Eight years of homicide evolution in Monterrey, Mexico: a network approach
地址: http://arxiv.org/abs/2009.04671
作者: Rodrigo Dorantes-Gilardi, Diana García-Cortés, Hiram Hernández-Ramos, Jesús Espinal-Enriquez
摘要: 毫无疑问,凶杀是墨西哥最重要的安全问题之一,据数据显示,这种令人沮丧的暴力行为是在2007年宣告禁毒战争后不久迅速飙升的。从那以后,类似暴力的战争区在整个墨西哥出现并消失了,造成巨大的人员,社会和经济损失。这些区域中最具代表性的地区之一是蒙特雷市,这是麻醉战中的中心场景。为了更好地了解暴力在城市中发展和传播的基本机制,在这里我们提出一种基于网络的方法。为此,我们定义了一个杀人网络,其中节点是通过空间接近度和犯罪相似性相连的地理实体。数据来自蒙特雷都会区长达86个月的犯罪数据库,其中包含人工策划的地理位置和过时的凶杀案,以及城市环境的开放街道地图。在这种方法下,我们首先确定对应于不同关联组件的独立犯罪部门。这些犯罪群中的每一种都表现出与州和国家级犯罪类似的犯罪演变。然后,我们展示了在暴力主要与卡特尔相关的情况下,犯罪是如何从邻域传播到相邻邻域的,以及在不同时间犯罪是如何基本静止的。最后,我们通过研究安全暴力社区到最近高速公路的距离,并研究与卡特尔相关的年份及其后一段时期的高速公路和犯罪距离的演变,来表明凶杀犯罪与城市景观之间的关系。通过这种方法,我们能够更准确地描述大都市地区凶杀犯罪的演变。
顺序种子时态网络中的有效影响传播
原文标题: Effective Influence Spreading in Temporal Networks with Sequential Seeding
地址: http://arxiv.org/abs/2009.04769
作者: Radosław Michalski, Jarosław Jankowski, Piotr Bródka
摘要: 网络中影响力的传播是许多应用领域中非常重要的主题。例如,人们想扩大覆盖面,限制营销活动初始化的预算,并利用社会影响力。为了应对这一挑战和类似挑战,十多年前,研究人员开始研究影响最大化的问题。挑战在于找到最佳的初始激活种子节点集,以使网络中的影响力最大化。在典型方法中,我们将在流程开始时在单个阶段中激活所有种子,而在这项工作中,我们介绍并评估一种基于顺序播种的时间网络中种子激活的新方法。此方法不是同时激活所有节点,而是分配种子的激活,从而导致影响范围扩大。使用真实和随机网络进行的实验结果表明,所提出的方法在71%的案例中优于单阶段播种,平均效果接近6%。知道时间网络是动态过程建模的适当选择,所以这项工作的结果可以解释为鼓励在现实世界中应用时间顺序播种,尤其是知道可以通过使用种子激活策略来实现更复杂的种子选择策略介绍这项工作。
一种推荐系统中有偏随机游走的评分预测的信任游走:H指数中心性、项目和好友相似性的影响
原文标题: Presentation a Trust Walker for rating prediction in Recommender System with Biased Random Walk: Effects of H-index Centrality, Similarity in Items and Friends
地址: http://arxiv.org/abs/2009.04825
作者: Saman Forouzandeh, Mehrdad Rostami, Kamal Berahmand
摘要: 推荐系统的使用已大大增加,以帮助在线社会网络用户进行决策过程和选择适当的项目。另一方面,由于许多不同的项目,用户不能对它们进行广泛的评分,通常,为用户创建的矩阵存在散射问题。为了解决该问题,基于信任的推荐系统被应用于为用户预测期望项目的分数。已经考虑了各种标准来定义信任,并且通常基于这些标准来计算用户之间的信任度。在这方面,由于社会网络中的大量用户,因此不可能获得所有用户的信任度。此外,针对此问题,研究人员使用随机游走算法的不同模式来随机访问某些用户,研究他们的行为,并获得他们之间的信任度。在本研究中,提出了一种基于信任的推荐系统,该系统可预测目标用户尚未评分的项目得分,如果未找到该项目,它将为用户提供依赖于该项目的项目,这些项目也是该项目的一部分用户的利益。在受信任的网络中,通过对节点之间的边进行加权,可以确定信任程度,并开发出TrustWalker,它使用有偏随机游走(BRW)算法在节点之间移动。边的权重在随机步长的选择中有效。本研究方法的实现和评估已在三个名为Epinions,Flixster和FilmTrust的数据集上进行;结果表明,该方法具有较高的效率。
疫苗不良事件检测的多实例域自适应
原文标题: Multi-instance Domain Adaptation for Vaccine Adverse Event Detection
地址: http://arxiv.org/abs/2009.04901
作者: Junxiang Wang, Liang Zhao
摘要: 疫苗不良事件的检测对于发现和改进有问题的疫苗至关重要。为了实现这一目标,传统的正式报告系统(如VAERS)支持准确但延迟的监视,而近来已经挖掘出社交媒体以进行及时但嘈杂的观察。利用这两个域的互补优势来提高检测性能看起来不错,但由于其数据特征之间的显著差异,现有方法无法有效实现,包括:1)形式语言与内容。非正式语言; 2)每位用户的单条信息。每位使用者多讯息,以及3)一类。二进制类。在本文中,我们提出了一种新颖的通用框架,称为多实例域适应(MIDA),以在社交媒体用户的疫苗不良事件检测任务中最大化这两个域之间的协同作用。具体来说,我们提出了一种广义最大均值差异(MMD)准则,以测量这两个域在它们共享的潜在语义空间中来自这两个域的异构消息之间的语义距离。然后,通过新提出的混合实例内核将这些消息级别的广义MMD距离合成为用户级别的距离。最后,我们将来自这两个域的部分匹配类的样本之间的距离最小化。为了解决非凸优化问题,开发了一种基于乘数交替方向法(ADMM)的算法,并结合了凸凹过程(CCP)来精确地优化参数。广泛的实验表明,在六个指标下,我们的模型在很大程度上优于基线。案例研究表明,MIDA的正式报告和提取的不利相关推文具有相似的关键字和描述模式。
GoCoronaGo:尊重隐私跟踪的COVID-19管理
原文标题: GoCoronaGo: Privacy Respecting Contact Tracing for COVID-19 Management
地址: http://arxiv.org/abs/2009.04916
作者: Yogesh Simmhan, Tarun Rambha, Aakash Khochare, Shriram Ramesh, Animesh Baranawal, John Varghese George, Rahul Atul Bhope, Amrita Namtirtha, Amritha Sundararajan, Sharath Suresh Bhargav, Nihar Thakkar, Raj Kiran
摘要: COVID-19大流行正在控制病毒传播方面面临巨大的全球挑战。缓解的关键支柱是联系跟踪,它补充了测试和隔离。智能手机中使用蓝牙技术进行联系人跟踪的数字应用已在全球范围内普及。在本文中,我们讨论了这种数字联系人跟踪的各种功能,及其对社区安全和个人隐私的影响。我们进一步描述了我们开发的GoCoronaGo机构联系追踪应用程序,以及我们做出的有意识的,有时甚至是逆向的设计选择。我们提供了该应用程序,后端平台和分析的详细概述,以及我们在班加罗尔的印度科学研究所校园内为1000多个用户部署该应用程序的早期经验。我们还将重点介绍在由其构建的时态网络上进行数字联系人跟踪和分析的研究机会和挑战。
2020年斯特吉斯摩托车拉力赛和COVID-19
原文标题: The 2020 Sturgis Motorcycle Rally and COVID-19
地址: http://arxiv.org/abs/2009.04917
作者: Yong Cai, Grant Goehring
摘要: 自从COVID-19爆发以来,8月7日至16日举行的斯特吉斯摩托车拉力赛是最大的公众聚会之一。来自美国各地的460,000名游客前往南达科他州的斯特吉斯参加了为期10天的活动。使用匿名手机跟踪数据,我们可以确定参加集会的游客所在县,并检查集会对COVID-19传播的影响。我们的基线估计表明,反弹后的几周内,斯特吉斯出勤率增加了一个标准差,COVID-19病例的增长增加了1.1pp。
复杂地球系统的统计物理学方法
原文标题: Statistical physics approaches to the complex Earth system
地址: http://arxiv.org/abs/2009.04918
作者: Jingfang Fan, Jun Meng, Josef Ludescher, Xiaosong Chen, Yosef Ashkenazy, Jurgen Kurths, Shlomo Havlin, Hans Joachim Schellnhuber
摘要: 全球气候变化,极端气候事件,地震及其伴随的自然灾害对人类构成重大威胁。然而,由于非线性反馈,战略相互作用以及地球系统的复杂结构,对此类破坏性事件的理解,尤其是对此类破坏性事件的预测,对科学界和政策界都构成了严峻的挑战。在过去的几年中,地球系统科学的出现和发展吸引了很多关注,并产生了新的概念和框架。特别是,已经开发并实施了新颖的统计物理学和基于复杂网络的技术,以极大地增进我们的知识,以便更好地理解地球系统,包括气候极端事件,地震和地球几何起伏特征,从而大大提高了预测性能。在这里,我们对如何将统计物理学和复杂系统科学方法(例如临界现象,网络理论,渗流,临界点分析以及熵)相结合的发展和应用方面的最新科学进展进行全面回顾。地球系统(气候,地震等)。值得注意的是,这些集成工具和方法为理解地球系统的动力学提供了新的见解和观点。这篇综述的总体目的是为读者提供有关统计物理学方法如何在地球系统科学领域中有用的知识。
美国的社会经济差距和COVID-19
原文标题: Socio-economic disparities and COVID-19 in the USA
地址: http://arxiv.org/abs/2009.04935
作者: Ayan Paul, Philipp Englert, Melinda Varga
摘要: COVID-19不是通用杀手。我们研究了COVID-19在美国县级的传播,直到2020年8月的15 ^ th 。我们表明该疾病的流行率和死亡率与当地的经济状况往往超出当地人口密度分布,特别是在农村地区。我们将COVID-19的患病率和死亡率与美国人口普查局的数据相关联,并指出该疾病的传播方式如何分别在城市和农村地区显示出不对称性,并优先影响那些非人口很大的县-白色。我们的发现可用于更有针对性的政策制定和资源部署,以备将来因SARS-CoV-2导致大流行时使用。我们基于可解释的机器学习和博弈论的方法论可以扩展为研究其他疾病的传播。
基于动态图的流行病学模型用于COVID-19接触者追踪数据分析和最佳测试处方
原文标题: Dynamic graph based epidemiological model for COVID-19 contact tracing data analysis and optimal testing prescription
地址: http://arxiv.org/abs/2009.04971
作者: Shashanka Ubaru, Lior Horesh, Guy Cohen
摘要: 在这项研究中,我们解决了与COVID-19大流行相关的三个重要挑战,即(a)为可能暴露的个体提供预警,(b)识别无症状的个体,以及(c)当检测能力为有限。首先,我们介绍一个基于动态图的SEIR流行病学模型,以描述疾病传播的动态。我们的模型考虑了一个动态图/网络,该图/网络考虑了一段时间后各个人之间的交互(例如通过手动或自动接触跟踪获得的交互),并使用扩散反应机制来描述状态动态。这种动态图模型有助于识别可能暴露/感染的个体,即使在他们出现任何症状之前我们也可以向他们提供预警。当与人群数量相比,COVID-19的检测能力受到限制时,使用流行病学模型对个人健康状况和疾病传播性进行可靠的估计非常困难。因此,状态不确定性的估计对于卓越的风险评估以及通过最佳测试处方关闭跟踪测试循环都是至关重要的。因此,我们建议使用任意多项式混沌扩展(一种用于不确定性量化的流行技术)来表示状态并量化动态模型中的不确定性。这种设计使我们能够分配每个人的状态的不确定性,并因此在测试预算受限的情况下优化测试以减少总体不确定性。我们提供了一些仿真结果,说明了所提出框架的性能。
在COVID-19危机中使用语义网络分析预测金融市场
原文标题: Forecasting financial markets with semantic network analysis in the COVID-19 crisis
地址: http://arxiv.org/abs/2009.04975
作者: A. Fronzetti Colladon, S. Grassi, F. Ravazzolo, F. Violante
摘要: 本文使用新的文本数据索引来预测股市数据。该索引应用于大量新闻,以评估出现在文本中的一个或多个与经济相关的通用关键字的重要性。该索引根据与经济相关的关键字的使用频率和语义网络位置来评估其重要性。我们将其应用于意大利新闻界并构建指数,以预测最近一个样本期间(包括COVID-19危机)意大利股票和债券市场的回报和波幅。有证据表明,该指数很好地反映了金融时间序列的不同阶段。此外,结果表明,债券市场数据的可预测性,回报率和波动率,短期和长期到期日以及股票市场的波动性都有很强的证据。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论