- COVID-19大流行期间共享自行车使用的时空分析:以北京为例;
- 决策与疾病:大流行病中合作的演变;
- 如何恢复正常:通过使用移动设备的接近感应快速而全面地跟踪COVID-19的接触;
- 如何重启?基于主体的模拟模型,用于定义公共建筑中COVID-19“第二阶段”的策略;
- 加总COVID-19增长率的系统偏差;
- 具有城际网络耦合效应的COVID-19分数阶SEIHDR模型;
- 论COVID-19案例分布的幂律涌现;
- 使用基于主体的社会模拟分析冠状病毒大流行对健康、社会和经济的综合影响;
- 预测COVID-19的SUIR模型全局动力学;
- 互动热点的动力学-I;
- 互动热点的动力学-II;
- COVID-19的感染率估算和初始感染个体的预测;
- 分数SIS流行病模型及其解;
- 第一个COVID-19的Instagram数据集;
- 主体级大流行模拟(ALPS),用于分析锁定措施的效果;
- 为什么要封城:SARS-CoV-2在印度传播的网络方法;
- 使用Google趋势评估冠状病毒锁定对不快乐、孤独和无聊的影响;
- HIV传播的SICA模型;
- 带累积过采样的快速汤普森采样算法:预算影响最大化的应用;
- 使用块模型的社会困境决策的最优预测和模型选择;
- DAN-SNR:用于考虑社交关系的下一个兴趣点推荐的深度注意力网络;
- 大规模有向网络的随机谱共聚;
- 一种基于命名实体的食谱建模方法;
- 互联网人类基础设施:从哈瓦那StreetNet学到的;
- 引用级联与主题相关性的演变;
- 世界美食的分层聚类;
- 烹饪食谱中的营养成分估算;
- 计算法律文件相似性的方法:比较研究;
- 级联LSTM:使用深度神经网络预测信息级联;
- 关于Instagram上的多模式受欢迎程度预测的局限性-新的稳健、有效和可解释的基准;
- Twitter上主题标签的尺度律和动态;
- 时间网络中的记忆形状;
- 多重马尔可夫链;
COVID-19大流行期间共享自行车使用的时空分析:以北京为例
原文标题: Spatiotemporal Analysis of Share Bike Usage during the COVID-19 Pandemic: a Case Study of Beijing
地址: http://arxiv.org/abs/2004.12340
作者: Xinwei Chai, Xian Guo, Jihua Xiao, Jie Jiang
摘要: 在COVID-19流行期间,不仅中国而且整个世界都面临着严重的公共卫生和经济危机,这种疾病已成为大流行病。由于估算中国的总体损失和预防措施的有效性是一项复杂的任务,因此,我们试图揭示人们在时间和空间上的行为变化,以推断其对日常生活和整体经济的影响。共享自行车的使用可以反映出时空行为模式,因为绝大多数中国城市居民使用共享自行车来连接公共交通工具和旅行的两端。记录北京的单车共享系统(BSS)记录,不仅描述共享单车用户的时间行为模式:在日常工作,节假日和大流行期间,而且还描述空间行为模式:在购物中心,地铁,正常社区和受感染社区周围等等。本文说明了大流行期间共享单车使用的演变,并发现了对生产和社会活动产生重大影响的关键时间和地点。通过在时间上进行共址分析,推断出公共卫生干预措施与改进的COVID-19爆发控制的关联。这些发现可能提供有关如何应对其他流行病的重要信息。
决策与疾病:大流行病中合作的演变
原文标题: Decisions and disease: the evolution of cooperation in a pandemic
地址: http://arxiv.org/abs/2004.12446
作者: Julie Rowlett, Carl-Joar Karlsson
摘要: 面对大流行,个人可以决定是否采取行动来减轻疾病的传播(合作),还是不(缺陷),导致类似于囚徒困境的“疾病困境”。合作需要个人改变其日常行为以造福他人。人群中的合作率与疾病的传播率直接相关。不幸的是,演化的博弈动力学预测所有个体都会演化为“缺陷”。在这里,我们将疾病难题与用于不赋予免疫力的疾病的区室模型相结合。我们证明,如果个人接收信息的时间尺度与疾病传播的时间尺度相比足够快,那么就会出现合作,并且可以控制疾病。当遇到新的传染病时,我们的结果可能对最好的行动方案有影响。
如何恢复正常:通过使用移动设备的接近感应快速而全面地跟踪COVID-19的接触
原文标题: How to Return to Normalcy: Fast and Comprehensive Contact Tracing of COVID-19 through Proximity Sensing Using Mobile Devices
地址: http://arxiv.org/abs/2004.12576
作者: Ye Xia, Gwendolyn Lee
摘要: 我们概述了基于使用移动设备的接近感测的接触跟踪策略。我们讨论理想系统的外观和功能。我们表明,如果采用足够广泛的接触追踪策略,则可以使COVID-19受到完全控制,可以消除与社会的距离,并使社会恢复正常。我们还将回顾当前的近距离传感技术所面临的一些挑战,包括电话使用的蓝牙低功耗技术,并考虑临时和长期解决方案。我们的主要贡献在于,我们通过推理来解释为什么这样的联系跟踪策略很可能会实现所陈述的恢复完全正常状态的目标。使用概率模型,我们表明通用采用不是实现既定目标的必要条件,因此存在一些例外的余地。但是收养率必须很高,例如高于 95%,具体取决于疾病参数。随着在疾病监测中提高警惕以及早发现轻症病例,这一数字可能会降低到约90%。结果要求由州或联邦级别的公共机构领导部署工作,以便达到所需的采用率,并且跟踪范围足够广泛以与疾病控制相关。
如何重启?基于主体的模拟模型,用于定义公共建筑中COVID-19“第二阶段”的策略
原文标题: How to restart? An agent-based simulation model towards the definition of strategies for COVID-19 "second phase" in public buildings
地址: http://arxiv.org/abs/2004.12927
作者: Marco D'Orazio, Gabriele Bernardini, Enrico Quagliarini
摘要: 应通过操作措施来支持在COVID-19紧急情况的“第二阶段”中重新开始公共建筑活动,以避免再次传播病毒。由于长时间与感染者接触,容纳相同用户持续存在的建筑物以及在空间/时间上人满为患的建筑物(例如大型办公室,大学)是关键场景。除了个人执行的风险缓解策略(面罩)外,利益相关者还应推广其他策略,即乘员的负荷限制(迈向“社会隔离”)和访问控制。仿真器可以支持措施有效性评估。这项工作提供了一个基于主体的模型来估计病毒在封闭的构建环境中的传播。该模型采用概率方法,根据国际卫生组织提出的基于接近度和基于暴露时间的规则,共同模拟乘员的活动和病毒传播。可以根据建筑物占用,缓解策略和病毒相关方面来定义方案。该模型在实验数据(“钻石公主”号巡洋舰)上进行了校准,然后应用于相关的案例研究(大学校园的一部分)。结果证明了模型的功能。关于案例研究,采用口罩似乎是通过保持可接受的感染人数来减少每种初始条件下病毒传播的最重要策略。建筑物容量的限制可能会通过将占用者使用的FFPk口罩转换为手术口罩来支持这种措施(从而改善了使用者的舒适度)。提出了将可接受的面罩过滤器-乘员的密度组合相结合的初步模型。可以对模型进行修改,以考虑其他公共建筑(例如旅游设施,文化建筑)中的其他重复性场景。
加总COVID-19增长率的系统偏差
原文标题: Systematic Biases in Aggregated COVID-19 Growth Rates
地址: http://arxiv.org/abs/2004.12994
作者: Keith Burghardt, Kristina Lerman
摘要: COVID-19大流行已成为现代最大的公共卫生挑战之一。政策制定者依靠衡量疾病传播的速度来制定缓解策略的决策。我们分析了有关确认的COVID-19感染和死亡的美国县级数据,以表明其影响是不同的。一小部分县占所有感染和死亡的大多数。这些热点与疾病较早到达并增长较快的人口稠密地区有关。当汇总县级数据以创建州级和国家级统计数据时,这些热点系统地偏向增长率。结果,感染和死亡似乎在较大规模上比在组成较大区域的典型县内更快地增长。公共政策,经济分析和流行病模型必须考虑到空间聚集带来的潜在扭曲。
具有城际网络耦合效应的COVID-19分数阶SEIHDR模型
原文标题: A fractional-order SEIHDR model for COVID-19 with inter-city networked coupling effects
地址: http://arxiv.org/abs/2004.12308
作者: Zhenzhen Lu, Yongguang Yu, YangQuan Chen, Guojian Ren, Conghui Xu, Shuhui Wang, Zhe Yin
摘要: 本文提出了一个数学模型来分析COVID-19的动态行为。基于城际网络耦合效应,讨论了分数阶SEIHDR系统,该系统具有2020年1月23日至3月18日的COVID-19真实数据。同时,该模型首先考虑了住院患者和三种类型的患者(暴露,感染和住院)的死亡率。本文还考虑了个体在孵化过程中的传染性。通过应用最小二乘法和预测校正器方案,利用从1月23日到 18-m 的实际数据,刺激了所提出系统在没有城际网络和城际网络的情况下的数值解。 2020年3月,其中 m 等于预测天数。与整数阶系统( alpha = 0 )相比,无网络分数阶模型经过验证,可以更好地拟合北京,上海,武汉,皇岗等城市的数据。与没有网络的情况相比,该结果表明,由于封锁和隔离措施的存在,城际网络系统可能不是中国病毒传播的重要案例,但是,它可能会对那些尚未建立网络的城市产生影响。通过城市封闭。同时,提出的模型更适合2月24日至3月31日在意大利的数据,并且该分数阶模型也预测了确诊人数的高峰。此外,在提出的系统中考虑了在初始条件下有界解的存在性和唯一性。之后,对基本繁殖数 R_0 进行分析,并发现它具有一个阈值:当 R_0 le 1 时,无病平衡点在局部渐近稳定,这为COVID-19是否变为未来大流行。
论COVID-19案例分布的幂律涌现
原文标题: On the Emergence of a Power Law in the Distribution of COVID-19 Cases
地址: http://arxiv.org/abs/2004.12772
作者: Brendan K. Beare, Alexis Akira Toda
摘要: 2020年1月21日报道了美国首例确诊的2019年冠状病毒病病例(COVID-19)。到2020年3月底,美国已确诊病例超过350000,分布在2000多个县中。我们发现该分布的上尾部表现出幂定律,帕累托指数接近于一。我们调查涉及吉布拉特定律的COVID-19案例增长的简单模型是否可以解释该幂定律的出现。对该模型进行了校准,以匹配(i)确诊病例的增长率,以及(ii)每个县内存在COVID-19的不同时间长度。经过校准后,该模型将生成幂定律,其帕累托指数几乎与3月底根据各县的确诊病例分布直接估算的指数相等。
使用基于主体的社会模拟分析冠状病毒大流行对健康、社会和经济的综合影响
原文标题: Analysing the combined health, social and economic impacts of the corovanvirus pandemic using agent-based social simulation
地址: http://arxiv.org/abs/2004.12809
作者: Frank Dignum, Virginia Dignum, Paul Davidsson, Amineh Ghorbani, Mijke van der Hurk, Maarten Jensen, Christian Kammler, Fabian Lorig, Luis Gustavo Ludescher, Alexander Melchior, René Mellema, Cezara Pastrav, Loïs Vanhee, Harko Verhagen
摘要: 在COVID-19危机期间,政府和其他决策者不得不做出许多困难的决定。例如。我们要完全封锁还是让学校开门?多少人以及应该测试哪些人?尽管有很多很好的模型,例如流行病学家在一定条件下对病毒的传播,这些模型并未直接转化为政府可以采取的干预措施。这些模型都不能有助于理解干预措施的经济和/或社会后果。但是,有效和可持续的解决方案需要考虑多种因素的组合。在本文中,我们提出了一种基于主体的社会模拟工具ASSOCC,该工具可帮助决策者了解政策干预措施的可能后果,并探索这些干预措施的综合社会,健康和经济后果。
预测COVID-19的SUIR模型全局动力学
原文标题: Global dynamics of a SUIR model with predicting COVID-19
地址: http://arxiv.org/abs/2004.12433
作者: Jingyuan Wang, Xin Lin, Yuxi Liu, Qilegeri, Hui Lin, Manqing Wu
摘要: 自2019年12月以来,一种新型冠状病毒(2019-nCoV)在中国已经流行,它可以引起呼吸系统疾病和严重的肺炎。依靠新病例的发病率来预测流行病暴发的流行病模型受到越来越多的关注。但是,该领域的许多先前工作大多专注于传统SIR模型的应用,而忽略了2019-nCoV的传播特征,这是未诊断病例的传染性。在此,我们提出基于经典SIR模型对象的SUIR模型,以监督传染病的有效预测,预防和控制。 SUIR模型添加了流行病的独特 U (未诊断)状态,并将人群分为四个状态:S(易感),U(未诊断),I(传染性和非传染性)和R(已恢复)。这种方法使我们能够有效预测2019-nCoV的发生率,并且模型准确性的明显优势比传统的SIR模型更可靠。
互动热点的动力学-I
原文标题: Dynamics of Interacting Hotspots -- I
地址: http://arxiv.org/abs/2004.12799
作者: Suman Dutta
摘要: COVID-19在全球范围内的传播要求快速开发新的建模策略以估计其空前的传播。在这里,我们介绍了一个基于随机疾病的基本SIR方程的模型,该模型通过在城市之间随机交换受感染人口来研究模型状态下震中相互作用网络中的动力学。尽管每个随机交换都成对保存种群,但这种疾病驱使全球系统朝着达到动态平衡的新途径发展。通过控制交换分数的范围,我们表明可以控制传播热点之间的分布异质性和合作性。德国联邦州受感染人口的集体时间演化数据证明了该模型的定性特征。
互动热点的动力学-II
原文标题: Dynamics of Interacting Hotspots - II
地址: http://arxiv.org/abs/2004.12780
作者: Suman Dutta
摘要: 在没有任何适当的临床解决方案的情况下,人类文明只能采取复杂的干预措施来遏制COVID-19的传播。但是,现有的估计干预措施的模型并未考虑到大流行中心的现实联系。我们推广了我们先前讨论的热点互动模型,以测试在由多个震中组成的模型状态下进行干预的各种可能性。我们还分析了热点在空间上相关并且相互作用仅限于与最近邻的人口交换的情况。我们表明,感染传播中的异质性仅取决于收容措施及其强度。我们探讨了许多此类情况并讨论了可能性。
COVID-19的感染率估算和初始感染个体的预测
原文标题: Estimation of Infection Rate and Prediction of Initial Infected Individuals of COVID-19
地址: http://arxiv.org/abs/2004.12665
作者: Seo Yoon Chae, Kyoung-Eun Lee, Hyun Min Lee, Nam Jun, Quang Ahn Le, Biseko Juma Mafwele, Tae Ho Lee, Doo Hwan Kim, Jae Woo Lee
摘要: 我们考虑到冠状病毒在中国武汉市爆发后在某些选定国家大范围传播的COVID-19。我们使用流行病初期的易感性(S),可传染性(I),隔离(Q)和确定的治愈率(Rk)的官方报告数据,估算了COVID-19的感染率和最初感染的个体。 )人口模型,即所谓的SIQRk模型。在报告的数据中,我们知道了隔离病例和恢复病例。我们无法从无症状病例中得知康复病例。在SIQRk模型中,我们可以根据数据拟合估计模型参数和初始感染病例(确认为无症状病例)。对于某些选定的国家,我们获得的感染率在0.233至0.462的范围内,基本繁殖数Ro在1.8至3.5的范围内,初始感染人数在10至8409之间。通过使用拟合参数,我们可以估算出政府执行隔离政策时德国的最长感染时间。在确定第一批患者后约六个月,该病正处于平静状态。
分数SIS流行病模型及其解
原文标题: Fractional SIS epidemic models and their solutions
地址: http://arxiv.org/abs/2004.12803
作者: Caterina Balzotti, Mirko D'Ovidio, Paola Loreti
摘要: 在人口规模恒定的情况下,这项工作涉及分数SIS流行病模型。我们提供了在适当假设下分数模型的显式解的表示形式,并且通过考虑两个数值方案来验证结果。我们研究了分数阶 alpha uparrow1 的极限情况的显式表示形式和数值方案,该分数情形与众所周知的普通SIS模型相对应,并且通过比较这两个模型来分析分数导数的作用。
第一个COVID-19的Instagram数据集
原文标题: A First Instagram Dataset on COVID-19
地址: http://arxiv.org/abs/2004.12226
作者: Koosha Zarei, Reza Farahbakhsh, Noel Crespi, Gareth Tyson
摘要: 新型冠状病毒(COVID-19)大流行性暴发正在极大地塑造和重塑我们生活的许多方面,对我们的社交生活产生了巨大影响。在这个世界上大多数主要城市的封锁政策时代,我们看到社交媒体上的人员和专业参与度急剧增加。社交媒体在新闻传播以及与人们保持联系方面发挥着重要作用。同时,由于冠状病毒信息流行已成为人们关注的主要问题,因此,这一来源既是福也是祸,而且已经是一个需要特别关注和进一步研究的话题。在本文中,我们提供了自2020年3月30日以来一直在收集的多语种冠状病毒(COVID-19)Instagram数据集。我们正在将数据集提供给Github的研究社区。我们认为,这一贡献将帮助社区更好地了解作为主要社交媒体之一的Instagram中这种现象背后的动态。该数据集还可以帮助研究与此爆发有关的错误信息的传播。
主体级大流行模拟(ALPS),用于分析锁定措施的效果
原文标题: Agent-Level Pandemic Simulation (ALPS) for Analyzing Effects of Lockdown Measures
地址: http://arxiv.org/abs/2004.12250
作者: Anuj Srivastava
摘要: 本文开发了一种称为ALPS的主体级模拟模型,用于模拟密闭社区中传染病的传播。传播的机制是使用“电晕” COVID-19大流行报道的参数进行的人与人之间的接触。 ALPS模拟的主要目标是分析预防措施(实施和取消锁定规范)对感染率,死亡率和恢复率的影响。模型的假设和选择代表了相互竞争的需求之间的平衡,即现实的需求与实时推理的效率。该模型通过实施和保持限制性措施来量化减少伤亡的收益。
为什么要封城:SARS-CoV-2在印度传播的网络方法
原文标题: Why lockdown : On the spread of SARS-CoV-2 in India, a network approach
地址: http://arxiv.org/abs/2004.11973
作者: Pradumn Kumar Pandey, Bibhas Adhikari
摘要: 我们分析了印度从2020年3月1日到2020年4月17日受COVID-19影响的地区或城市的时间序列数据。我们在时间序列网络数据的框架内研究数据。使用纬度和经度坐标指定的地区或城市的测地距离定义网络。我们特别将分析范围限制在印度东北部以外的所有地区。与近期对SARS-CoV-2感染人数预测的最新研究不同,在本说明中,重点在于了解印度各地病毒传播的动态。我们通过考虑几种措施对模型网络进行谱和结构分析,特别是谱半径,代数连通性,平均聚类系数,平均路径长度和群落结构。此外,我们研究了锁定前后的地区或城市数量给出的总体扩张属性。这些研究表明,封锁对SARS-CoV-2在长途地区或城市中的传播具有重大影响。但是,只有在锁定大约两周后才能观察到这种影响。我们推测,发生这种情况是由于在锁定之前对COVID-19的测试数量不足,这无法阻止被病毒感染但未被发现的人的长距离移动。
使用Google趋势评估冠状病毒锁定对不快乐、孤独和无聊的影响
原文标题: Assessing the impact of the coronavirus lockdown on unhappiness, loneliness, and boredom using Google Trends
地址: http://arxiv.org/abs/2004.12129
作者: Abel Brodeur, Andrew E. Clark, Sarah Fleche, Nattavudh Powdthavee
摘要: COVID-19大流行导致许多政府实施封锁。虽然封锁可能有助于遏制病毒的传播,但有可能对人口的福祉造成实质性损害。这项研究基于Google趋势数据,并测试了在欧美实施的锁定是否导致与健康相关的主题搜索字词发生了变化。使用不同的方法评估锁定的因果关系,我们发现欧洲和美国的无聊搜索强度大大增加。我们还发现孤独感,忧虑和悲伤的搜索量显著增加,而压力,自杀和离婚的搜索反而下降了。我们的结果表明,锁定可能严重影响了人们的心理健康。
HIV传播的SICA模型
原文标题: On SICA models for HIV transmission
地址: http://arxiv.org/abs/2004.11903
作者: Cristiana J. Silva, Delfim F. M. Torres
摘要: 我们重新审视了SICA(易感性传染性慢性艾滋病)数学模型,该模型用于在均匀混合的人群中以不同的人口规模传播人类免疫缺陷病毒(HIV)的传播动力学。我们考虑由常微分方程系统给出的SICA模型,以及由分数阶和随机微分算子给出的系统的一些概括。对于确定性,分数和随机类型的SICA模型,证明了局部和全局稳定性结果。对佛得角和摩洛哥的两个案例研究进行了调查。
带累积过采样的快速汤普森采样算法:预算影响最大化的应用
原文标题: Fast Thompson Sampling Algorithm with Cumulative Oversampling: Application to Budgeted Influence Maximization
地址: http://arxiv.org/abs/2004.11963
作者: Shatian Wang, Shuoguang Yang, Zhen Xu, Van-Anh Truong
摘要: 我们提出了汤普森采样(TS)的累积过采样(CO)技术,与现有的过采样框架相比,可使用后验分布中明显更少的样本来构造乐观参数估计。我们将CO应用于具有边权重线性泛化的影响最大化(IM)半强盗的新预算变体。将CO与针对离线问题设计的预言相结合,我们的在线学习算法可同时解决预算分配,参数学习和奖励最大化的难题。我们证明,我们的在线学习算法可实现与IM半强盗基于UCB的算法相当的规模后悔。这是基于IM的基于TS的IM半强盗算法的第一个遗憾,它不线性依赖于边的最小观察概率的倒数。在数值实验中,我们的算法在很大程度上优于所有基于UCB的替代方案。
使用块模型的社会困境决策的最优预测和模型选择
原文标题: Optimal prediction of decisions and model selection in social dilemmas using block models
地址: http://arxiv.org/abs/2004.12151
作者: Sergio Cobo-Lopez, Antonia Godoy-Lorite, Jordi Duch, Marta Sales-Pardo, Roger Guimera
摘要: 增进我们对人类行为的理解取决于理论揭示这些行为背后机制的能力。衡量理论和模型预测未观察到的行为的能力可提供一种有原则的方法来评估其优点,从而帮助确定最合理的机制。在这里,我们提出模型并开发严格的推理方法来预测二元社会困境中的战略决策。特别是,我们使用了包含有关个人所面临困境的信息的二部随机块模型。我们显示,将这些模型与关于二元社会困境中战略决策的经验数据结合起来,尽管不是“理性的”,但单个战略决策在很大程度上是可以预测的。通过对这些模型的分析,我们可以得出以下结论:(i)个人没有根据其博弈论结构来感知博弈; (ii)个人使用多种简单策略的组合做出决策,而我们的方法自然可以揭示这些策略。
DAN-SNR:用于考虑社交关系的下一个兴趣点推荐的深度注意力网络
原文标题: DAN-SNR: A Deep Attentive Network for Social-Aware Next Point-of-Interest Recommendation
地址: http://arxiv.org/abs/2004.12161
作者: Liwei Huang, Yutao Ma, Yanbo Liu, Keqing He
摘要: 近年来(或以后)的兴趣点(POI)建议已引起越来越多的关注。先前的大多数研究都试图将时空信息和用户签到的顺序模式纳入推荐模型中,以预测目标用户的下一步行动。但是,这些方法都没有利用每个用户朋友的社会影响力。在这项研究中,我们讨论了下一个POI推荐的新主题,并提出了一个用于社交的下一个POI推荐的深层关注网络,称为DAN-SNR。特别是,DAN-SNR利用自我注意力机制代替循环神经网络的体系结构,以统一的方式对顺序影响和社会影响进行建模。此外,我们设计并实现了两个并行渠道,分别捕获短期用户偏好和长期用户偏好以及社会影响力。通过利用多头注意力,DAN-SNR可以有效地对任意两个历史值机之间的远程依赖性进行建模,并自适应地权衡它们对下一个目的地的贡献。此外,我们使用从两个流行的基于位置的社会网络Gowalla和Brightkite收集的大规模现实世界数据集进行了全面评估。实验结果表明,DAN-SNR在推荐性能方面优于7种竞争基准方法,并且在6种基于神经网络和注意力的方法中效率很高。
大规模有向网络的随机谱共聚
原文标题: Randomized spectral co-clustering for large-scale directed networks
地址: http://arxiv.org/abs/2004.12164
作者: Xiao Guo, Yixuan Qiu, Hai Zhang, Xiangyu Chang
摘要: 有向网络通常用于表示单元之间的不对称关系。共聚旨在同时对有向网络的发送者和接收者进行聚类。特别地,可以将众所周知的谱聚类算法修改为谱共聚到共聚有向网络。但是,大型网络对其提出了计算挑战。在本文中,我们利用随机素描技术来加速谱共聚算法,以便更有效地共聚大规模有向网络。具体来说,我们推导了两个系列的随机谱共聚算法,一个是基于随机投影的算法,另一个是基于随机采样的算法。从理论上讲,我们在两个生成模型 textendash emph 随机协同块模型和 emph 度校正随机协同块模型下分析所得算法。建立了近似误差率和聚类错误率,与共聚文献的最新结果相比,它们显示出更好的界限。在数值上,我们进行仿真以支持我们的理论结果,并在具有多达数千万个节点的真实网络上测试算法的效率。
一种基于命名实体的食谱建模方法
原文标题: A Named Entity Based Approach to Model Recipes
地址: http://arxiv.org/abs/2004.12184
作者: Nirav Diwan, Devansh Batra, Ganesh Bagler
摘要: 如果正确分析和表示食谱文本不同部分的规则和语义,则传统的烹饪食谱遵循的结构可以很好地建模。我们提出了一种可以精确表示配方的结构,以及一种可以在这种统一结构中推断配方最佳表示的管道。配方中的“成分”部分通常列出所需的成分以及相应的属性,例如数量,温度和加工状态。可以通过定义这些属性及其值来建模。组成食谱的物理实体可以大致分为炊具,食材及其组合,它们与烹饪技术有关。说明部分列出了一系列事件,在这些事件中,对这些器皿和配料应用了烹饪技术或过程。我们以元组的形式对这些关系进行建模。因此,结合使用这些方法,我们在数据集RecipeDB中对烹饪食谱建模,以显示该方法的有效性。该挖掘的信息模型可以具有多种应用程序,包括在语言之间翻译食谱,确定食谱之间的相似性,生成新食谱以及估算食谱的营养状况。为了识别成分属性,我们训练了命名实体关系(NER)模型,并借助K-Means聚类分析了推理。我们的模型在所有数据集中的F1得分均为0.95。在说明部分中,我们使用类似的NER标签模型来标记烹饪技术(F1得分= 0.88)和器皿(F1得分= 0.90)。最后,我们确定配料,餐具和烹饪技术之间关系的时间顺序,以对指导步骤进行建模。
互联网人类基础设施:从哈瓦那StreetNet学到的
原文标题: Internet-human infrastructures: Lessons from Havana's StreetNet
地址: http://arxiv.org/abs/2004.12207
作者: Abigail Z. Jacobs, Michaelanne Dye
摘要: 我们提出了一种混合方法来理解StreetNet(SNET)底层的人力基础设施,SNET是一个分布式的,社区运行的企业内部网,是古巴哈瓦那的主要“互联网”。我们将人种学研究与社会网络和组织的研究联系起来,以了解权力嵌入哈瓦那SNET结构的方式。通过定量和定性地解压缩SNET的人员基础结构,这项工作揭示了分布式基础结构必然如何嵌入该基础结构中分布的不平等的结构方面。传统的网络技术测量反映了形成最终网络的社会,组织,空间和技术限制,而人种志可以帮助发现这些隐藏的支持关系的结构和作用。通过合并这些观点,这项工作有助于我们理解网络在增长和维护分布式基础结构中的作用,并揭示新的方法来理解更大,更复杂的Internet-人基础结构-包括Internet和WWW。
引用级联与主题相关性的演变
原文标题: Citation Cascade and the Evolution of Topic Relevance
地址: http://arxiv.org/abs/2004.12275
作者: Chao Min, Qingyu Chen, Erjia Yan, Yi Bu, Jianjun Sun
摘要: 引文分析作为科学定量研究的一种工具,长期以来一直强调直接引文关系,而忽略了间接或高阶引文。但是,一系列早期和最近的研究表明,跨代存在间接和连续引用影响。除了有关高序引用的文献外,我们还介绍了引用级联的概念:由某个出版物发起的一系列后续引用事件的构成。我们通过分析超过450,000篇文章和超过600万种引用关系来研究这种引用结构。我们表明,引用影响不仅存在于先前研究记录的三个世代中,而且还存在于更远的世代中。尽管如此,我们的实验结果仍然表明,两到四代人通常足以追踪作品的科学影响。我们还探讨了特定的结构特性,例如深度,宽度,结构病毒性和大小,这些特性可解释各个引用级联之间的差异。最后,我们发现有证据表明,对于跨领域(或间接相关领域)的作品进行科学研究,比仅获得内部领域的认可更重要,以取得高影响。我们的方法和发现可以作为科学评估和科学史建模的新工具。
世界美食的分层聚类
原文标题: Hierarchical Clustering of World Cuisines
地址: http://arxiv.org/abs/2004.12283
作者: Tript Sharma, Utkarsh Upadhyay, Jushaan Kalra, Sakshi Arora, Saad Ahmad, Bhavay Aggarwal, Ganesh Bagler
摘要: 尽管使用了共同的食材和烹饪技术,但世界各地的文化已发展成具有独特的模式。利用从食谱在线资源RecipeDB获得的数据,我们提取了26种世界美食的模式,并进一步探讨了它们之间的相互关系。通过频繁的项目集挖掘和成分真实性的应用,我们描绘出了美食中的典型模式,并建立了世界美食的等级树。这棵树提供了有关美食演变及其地理和历史关联性的有趣见解。
烹饪食谱中的营养成分估算
原文标题: Nutritional Profile Estimation in Cooking Recipes
地址: http://arxiv.org/abs/2004.12286
作者: Jushaan Kalra, Devansh Batra, Nirav Diwan, Ganesh Bagler
摘要: 食谱的准确营养状况的可用性是食品数据库具有多个应用程序的重要功能,其中包括营养辅助,推荐系统和饮食分析等应用。通常在在线数据库中,从各种来源获取食谱,以尝试使食谱的数量和数据集的种类最大化。这导致营养细节不完整且通常不可靠。我们提出了一种可扩展的方法,可使用标准的可靠营养值数据库从其成分部分估算配方的营养成分。先前的研究证明了在小型数据集上使用字符串匹配方法的效率。为了证明我们程序的有效性,我们使用美国农业部标准参考(USDA-SR)数据库作为计算营养状况的参考,将建议的方法应用于大型数据集RecipeDB,其中包含来自多个数据源的配方。我们通过计算食谱数据库中的平均误差(每份热量36卡路里)来评估我们的方法,该误差完全在可归因于身体差异的误差范围内。
计算法律文件相似性的方法:比较研究
原文标题: Methods for Computing Legal Document Similarity: A Comparative Study
地址: http://arxiv.org/abs/2004.12307
作者: Paheli Bhattacharya, Kripabandhu Ghosh, Arindam Pal, Saptarshi Ghosh
摘要: 在法律信息检索领域,计算两个法律文档之间的相似性是一项重要且具有挑战性的任务。查找相似的法律文件在下游任务中有许多应用,包括事前案例检索,法律文章推荐等。先前的工作提出了两种测量法律文件之间相似性的广泛方法-分析先例引用网络,以及基于文本内容相似性度量来测量相似性。但是,尚未在通用平台上对这些现有方法进行全面比较。在本文中,我们对现有方法进行了首次系统分析。此外,我们探索了两种有前途的新的相似度计算方法-一种是基于文本的,另一种是基于网络嵌入的,至今尚未考虑。
级联LSTM:使用深度神经网络预测信息级联
原文标题: Cascade-LSTM: Predicting Information Cascades using Deep Neural Networks
地址: http://arxiv.org/abs/2004.12373
作者: Sameera Horawalavithana, John Skvoretz, Adriana Iamnitchi
摘要: 从传播医疗保健消息到模因跟踪,预测动态社会环境中的信息流与当代社会的许多领域都息息相关。尽管已经在各种社交平台上成功解决了预测信息级联的增长的问题,但预测信息级联的时间和拓扑结构却受到了有限的探索。但是,准确预测有多少用户将发送特定用户的消息,以及在什么时间设计实用的干预技术至关重要。本文利用长时记忆(LSTM)神经网络技术来预测信息级联的两个时空特性,即各个级别信息传输的大小和速度。我们将这些预测算法与级联树的概率生成结合到一个生成测试模型中,该模型能够在两个不同的平台Reddit和Github中准确生成级联树。我们的方法导致在各种社交平台中,信息传输器的分类准确性超过73%,早期传输器的分类准确性超过83%。
关于Instagram上的多模式受欢迎程度预测的局限性-新的稳健、有效和可解释的基准
原文标题: On the Limits to Multi-Modal Popularity Prediction on Instagram -- A New Robust, Efficient and Explainable Baseline
地址: http://arxiv.org/abs/2004.12482
作者: Christoffer Riis, Damian Konrad Kowalczyk, Lars Kai Hansen
摘要: 社交媒体受欢迎程度的可预测性是一个具有极大科学意义和重大实际意义的主题。我们为Instagram上的流行度预测提供了一个新的强基准,它既健壮又高效。该方法通过对视觉模态的多种表示形式的预测能力进行全面的消融研究以及详细使用可解释性工具来扩展以前的工作。我们使用转移学习将视觉语义提取为概念,场景和对象,这使我们能够解释和解释经过训练的模型和预测。这项研究基于从Instagram摘录的100万篇帖子中。我们将受欢迎程度预测问题视为排名问题,在其中我们预测对数归一化的喜欢人数。通过我们的消融研究设计,我们可以建议模型,该模型优于用于Instagram上的多模式受欢迎程度预测的现有最新黑盒方法。
Twitter上主题标签的尺度律和动态
原文标题: Scaling laws and dynamics of hashtags on Twitter
地址: http://arxiv.org/abs/2004.12707
作者: Hongjia H. Chen, Tristram J. Alexander, Diego F.M. Oliveira, Eduardo G. Altmann
摘要: 在本文中,我们量化了Twitter上#标签使用频率的统计属性和动态变化。标签是社交媒体中用来吸引注意力和组织内容的特殊单词。通过查看一段时间内使用的所有主题标签的集合,我们确定了主题标签频率分布(Zipf定律),作为标签大小的函数的唯一主题标签的数量(希普斯定律)的定标定律。期望值(泰勒定律)。尽管这些尺度定律似乎是通用的,但在某种意义上,无论何时采集样品,都可以观察到相似的指数,但标签的数量和性质在很大程度上取决于时间,在微小的范围内会出现爆发,这是胖尾的。噪声和远程相关性。我们通过计算相距获得 tau 的标签分布之间的Jensen-Shannon散度来量化这种动态,我们发现变化的速度大约衰减了 1 / tau 。我们的发现基于对2015年至2016年使用的35亿个标签的分析。
时间网络中的记忆形状
原文标题: The shape of memory in temporal networks
地址: http://arxiv.org/abs/2004.12784
作者: Oliver E. Williams, Lucas Lacasa, Ana P. Millán, Vito Latora
摘要: 时间网络是用于描述复杂系统的体系结构的广泛使用的模型。网络内存-时空网络的结构对其过去的依赖-已显示出它在网络上发生的扩散,流行病和其他过程中甚至在改变其社区结构方面发挥着重要作用。最近的工作提出了通过使用高阶马尔可夫模型来估计时间网络中的存储器长度。在这里,我们显示网络内存本质上是多维的,无法有意义地减少为单个标量。因此,我们引入了一个数学框架,用于定义和有效估计内存的微观形状,从而充分表征每个链接的活动如何与所有其他链接的活动交织在一起。我们在具有可调整内存的各种时态网络综合模型中验证了我们的方法,然后研究了各种现实网络中出现的内存的异构形状。
多重马尔可夫链
原文标题: Multiplex Markov Chains
地址: http://arxiv.org/abs/2004.12820
作者: Dane Taylor
摘要: 多重网络是互连系统和多模式数据的通用建模框架,但是对于多重性如何影响随机过程,我们仍然缺乏基本的见识。我们引入了“马尔可夫链的马尔可夫链”模型,使得可能带有(1- omega) in [0,1] 的随机游走者留在同一层,并遵循(特定于层的) emph 层内马尔可夫链,而它们以 omega 的概率沿着(特定于节点的) emph interlayer Markov chain移动到不同的层。通过耦合“马尔可夫链层”与“网络层”,我们确定了新的由多重性引起的现象,包括 emph 多重不平衡(从而可逆马尔可夫链的多重耦合产生了不可逆的)和 emph 多重对流(从而静态分布展示出涉及多层的循环流。发现这些现象(以及收敛速度 lambda_2 )对中间的 omega 表现出最佳状态,并且我们探讨了它们与节点内层度不平衡的关系。为了提供分析的见解,我们描述了各层之间以及各层之间的过渡之间存在时标分隔时(即 omega to0 和 omega to1 )的平稳分布的特征。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论