- COVID-19动态模型:全面识别一般生物学特征和特定国家/地区社会特征;
- 基于卫星的COVID-19大流行期间中国CO_2排放量下降和反弹的估计;
- 碳监测器:化石燃料和水泥生产产生的全球CO2排放的近实时每日数据集;
- 爆发控制的灾难性失败:有限的测试导致流行病过渡的中断;
- COVID-19的两阶段动态传染模型;
- COVID-19在意大利传播的隐藏一面;
- 在各种社会和经济情况下建模和控制流行病的传播;
- COVID后V型,U型,L型或W型恢复?来自基于主体的模型的见解;
- 基于社区检测(Kemeny)的COVID-19测试的说明;
- 斯里兰卡COVID-19病毒爆发期间社交媒体网络的探索性分析;
- 墨西哥COVID-19大流行的地理空间传播;
- 基于主体的洪水应急行人响应建模:移动行为规则及其对洪水风险分析的启示;
- 结合人口统计数据分析Foursquare和Streetlight数据对未来犯罪预测的影响;
- 用于离网网络的基于区块链的分散式数据共享基础架构;
- 考虑天气条件的影响,在自行车共享系统中模拟自行车数量;
- 使用地理标记事件跟踪的时空点过程进行隐式社区建模;
- 社会网络中竞争注意力的中性理论;
- 通过结合经典中心性来普遍地确定最有影响力的人;
- 通过Twitter Glass:检测微文本中的问题;
- 深度外生和内生性影响组合用于社会颤抖强度预测;
- 检查情绪模式在预测自我报告的抑郁症状中的作用;
- 公平影响力最大化:福利最优化方法;
- 通过集成学习检测伪造评论;
- 世界GDP的能源表征;
- 多次重复在谣言大小上的作用;
- 正式层次结构和非正式网络:组织结构如何塑造地方政府的信息搜索;
- 动态网络嵌入研究;
- 随机网络中长程相关性的出现;
- 使用机器学习在自行车共享系统中建模自行车可用性;
- 具有任意聚类的随机图及其应用;
- 零模型用于多重优化的大型网络结构;
- 死亡的社会空间因素:分析香港贝叶斯死亡率模型中地理空间分布变量的影响;
- 通过关注最成功的合作伙伴来阻止背叛者的入侵;
COVID-19动态模型:全面识别一般生物学特征和特定国家/地区社会特征
原文标题: COVID-19 dynamic model: Balanced identification of general biological and country specific social features
地址: http://arxiv.org/abs/2006.07370
作者: A. V. Sokolov (1), L. A. Sokolova (2) ((1) Institute for information transmission problem (Kharkevitch Insitute) RAS, (2) Federal Research Center Computer Science and Control of RAS Institute for Systems Analysis)
摘要: 将复杂的生物社会现象(流行病)分解成各个组成部分,考虑确定其动力学的过程,在数学方程式中形式化公认的假设,选择适当的实验和统计资料,以及构建数学模型-这些是科学研究的典型任务。特定的数据处理方法(平衡识别)和适当的信息技术使得可以考虑多种模型,确定病毒-人类相互作用的一般生物学规律(对所有人群而言都是如此),以及国家/地区特定的流行病管理特征在所考虑的国家(或城市)中。作为初始数据,仅使用新案例。来自不同国家的数据取自官方来源,并以统一的方式进行处理。未检测到的感染数量的估计值较低。
基于卫星的COVID-19大流行期间中国CO_2排放量下降和反弹的估计
原文标题: Satellite-based estimates of decline and rebound in China's CO_2 emissions during COVID-19 pandemic
地址: http://arxiv.org/abs/2006.08196
作者: Bo Zheng, Guannan Geng, Philippe Ciais, Steven J. Davis, Randall V. Martin, Jun Meng, Nana Wu, Frederic Chevallier, Gregoire Broquet, Folkert Boersma, Ronald van der A, Jintai Lin, Dabo Guan, Yu Lei, Kebin He, Qiang Zhang
摘要: 根据COVID-19大流行期间CO_2排放的变化,已根据运输和发电等活动的指标进行了估算。在这里,我们改为使用卫星观测以及自下而上的信息来跟踪大流行期间CO_2排放量的每日动态。与活动数据不同,我们的基于观察的分析可以独立进行评估,并且可以为空间明晰的变化提供更详细的见解。具体而言,我们使用TROPOMI观测值NO_2得出中国的NO_x和CO_2排放量的10天移动平均值,从而按行业和省份区分排放量。在2020年1月至2020年4月期间,中国的CO_2排放量与2019年同期相比下降了11.5%,但此后由于工业活动集中的省份经济快速复苏,排放量已反弹至大流行前水平。
碳监测器:化石燃料和水泥生产产生的全球CO2排放的近实时每日数据集
原文标题: Carbon Monitor: a near-real-time daily dataset of global CO2 emission from fossil fuel and cement production
地址: http://arxiv.org/abs/2006.07690
作者: Zhu Liu, Philippe Ciais, Zhu Deng, Steven J. Davis, Bo Zheng, Yilong Wang, Duo Cui, Biqing Zhu, Xinyu Dou, Piyu Ke, Taochun Sun, Rui Guo, Olivier Boucher, Francois-Marie Breon, Chenxi Lu, Runtao Guo, Eulalie Boucher, Frederic Chevallier
摘要: 我们构建了近实时的每日CO2排放数据集,即Carbon Monitor,以监测自2019年1月1日以来国家层面的化石燃料燃烧和水泥生产产生的CO2排放变化,并每天近乎全球覆盖。经常更新的潜力。每天的二氧化碳排放量是根据各种各样的活动数据估算得出的,其中包括:29个国家的每小时至每日发电数据,62个国家/地区的月度生产数据和行业过程生产指数,道路运输的每日流动性数据和流动性指数全球416个城市。单个飞行位置数据和月度数据用于航空和海上运输部门的估算。此外,使用每月燃油消耗数据(经206个国家/地区的每日空气温度校正)校正了商业和住宅建筑物的排放量。该碳监测器数据集通过受工作日和假日影响的每日,每周和季节性变化来显示CO2排放的动态性质,以及COVID-19大流行的不断扩大的影响。 Carbon Monitor近实时CO2排放数据集显示,与2019年同期相比,2020年1月1日至4月30日全球CO2排放量下降了7.8%,并检测到4月下旬CO2排放量的重新增长主要归因于中国经济活动的复苏以及其他国家/地区部分封锁的放松。此外,该每日更新的二氧化碳排放数据集可以为相关科学研究和政策制定提供一系列机会。
爆发控制的灾难性失败:有限的测试导致流行病过渡的中断
原文标题: Catastrophic failure of outbreak containment: Limited testing causes discontinuity in epidemic transition
地址: http://arxiv.org/abs/2006.08005
作者: Davide Scarselli, Nazmi Burak Budanur, Björn Hof
摘要: 隔离嫌疑人和联系追踪等标准措施不能遏制正在进行的COVID-19大流行。与其他最近流行的工具成功的情况不同,在本例中,很大一部分感染者仅表现出轻度的非特异性症状。通过采用网络模型,我们在这里表明,即使对于近乎完美的联系跟踪和无限的可疑测试,当大约一半以上的运营商属于弱症状类别时,遏制也会开始失败。如果每日可用测试的数量有限,情况将变得更加严重。在这种情况下,流行病的转变变得不连续,并且人口中很大一部分被感染。尽管适度的社会疏远可以使情况重新得到控制,但每天进行的有限测试会引入有限的时间范围:如果在截止日期之后实施社会疏远,则遏制性灾难性地崩溃,导致指数级疾病传播。
COVID-19的两阶段动态传染模型
原文标题: A Two-Phase Dynamic Contagion Model for COVID-19
地址: http://arxiv.org/abs/2006.08355
作者: Zezhun Chen (1), Angelos Dassios (1), Valerie Kuan (2), Jia Wei Lim (3), Yan Qu (4), Budhi Surya (5), Hongbiao Zhao (6) ((1) London School of Economics, (2) University College London, (3) Brunel University London, (4) University of Warwick, (5) Victoria University of Wellington, (6) Shanghai University of Finance and Economics)
摘要: 本文提出了一种连续时间随机强度模型,即两阶段动态传染过程(2P-DCP),用于对COVID-19的传染性流行进行建模,并基于由COVID-19引入的动态传染模型研究锁定效应。 Dassios和Zhao(2011)。它允许个体感染的随机性,而不是标准模型所假设的恒定繁殖数。关键流行病学数量(例如最终流行病规模的分布和预期流行病持续时间)是根据各个地区和国家的真实数据得出和估算的。估计了每个国家或地区干预效果的相关时滞。我们的结果与最近医学研究发现的COVID-19的孵育时间一致。我们证明了我们的模型在COVID-19建模中可能是有价值的工具。更重要的是,建议的2P-DCP模型也可以用作流行病学建模的重要工具,因为这种结构非常简单的传染模型足以描述区域流行病和全球流行病的演变。
COVID-19在意大利传播的隐藏一面
原文标题: The hidden side of COVID-19 spread in Italy
地址: http://arxiv.org/abs/2006.08356
作者: Luigi Brugnano, Felice Iavernaro, Paolo Zanzottera
摘要: 背景。该文件涉及SARS-CoV2(COVID-19)大流行,该大流行从2020年2月底开始,首先在北部地区袭击小型社区,然后扩展到意大利的中部和南部,开始在意大利半岛蔓延,包括两个主要岛屿。目的。创建一个预测模型,该模型可以提醒决策机构,尤其是医疗保健系统,以防止其他任何大流行病爆发或随后的大流行浪潮到来。方法。给出了描述流行病的新数学模型。该模型包括未诊断的感染者类别,并具有多区域扩展,以应对流行病在时间和空间上的异质性。结果。我们获得了一个强大而可靠的工具来预测总的和正在发生的案件,该工具还可以用于模拟不同的情况。结论。我们能够解决许多问题,例如评估从2020年3月11日开始在意大利采用封锁措施的方式,以及如何采用快速筛查测试活动来控制这种流行病。
在各种社会和经济情况下建模和控制流行病的传播
原文标题: Modeling and Controlling the Spread of Epidemic with Various Social and Economic Scenarios
地址: http://arxiv.org/abs/2006.08375
作者: S.P. Lukyanets, I.S. Gandzha, O.V. Kliushnychenko
摘要: 我们提出了一种新颖的模型来描述传播过程,尤其是流行病。我们的模型是先前用来描述各种流行病传播情况的SIQR(易感感染隔离恢复)和SIRP(易感感染恢复病原体)模型的扩展。与基本SIR模型相比,我们的模型考虑了两种可能的病毒传播途径:直接从受感染的隔间传播到易感隔间,以及通过某些中间介质或毒气间接传播。根据所选社交环境中个人之间的平均距离和特征性放松时间来估算传输速率。我们还引入了一种资源激活函数,该函数反映了流行病对经济的负担以及医疗基础设施的有限能力。我们的模型具有建立各种控制策略以最大程度减少流行病影响的优势,可用于模拟最近的COVID-19爆发。
COVID后V型,U型,L型或W型恢复?来自基于主体的模型的见解
原文标题: V-, U-, L-, or W-shaped recovery after COVID? Insights from an Agent Based Model
地址: http://arxiv.org/abs/2006.08469
作者: Dhruv Sharma, Jean-Philippe Bouchaud, Stanislao Gualdi, Marco Tarzia, Francesco Zamponi
摘要: 我们讨论了类似Covid的冲击对简单玩具经济的影响,这由我们在一系列先前的论文中开发和讨论的基于Mark-0 Agent的模型进行了描述。我们考虑了混合的供需冲击,并表明根据冲击参数(振幅和持续时间),我们的玩具经济性可以显示V形,U形或W形回收率,甚至L形输出曲线具有永久产出损失。这是由于经济存在自我维持的“坏”状态。然后,我们讨论两种试图减轻冲击影响的政策:为企业提供容易的信贷,以及所谓的直升飞机资金,即向家庭储蓄中注入新的资金。我们发现,如果这两个政策足够强大,则它们是有效的,并且我们强调了过早终止这些政策的潜在危险。尽管我们只讨论了有限的几种情况,但我们的模型具有足够的灵活性和通用性,可以进行更广泛的探索,因此可以作为定性理解Covid后恢复的有用工具。
基于社区检测(Kemeny)的COVID-19测试的说明
原文标题: A note on community-detection (Kemeny) based testing for COVID-19
地址: http://arxiv.org/abs/2006.08504
作者: Serife Yilmaz, Ekaterina Dudkina, Michelangelo Bin, Emanuele Crisostomi, Pietro Ferraro, Roderick Murray-Smith, Thomas Parisini, Lewi Stone, Robert Shorten
摘要: 图的Kemeny常数可用于识别和分析图中的社区之间的桥梁。测试,跟踪和追踪能力被认为对于帮助各国在第一波COVID-19病毒爆发后安全地重新开展活动至关重要。跟踪技术旨在重建过去的联系历史,但在测试或过分隔离的指数增长中可能会遇到实际限制。我们展示了图论的这种应用如何可以方便地用于在新病毒爆发仍处于早期阶段时有效地拦截它们。模拟在早期识别和阻止可能在不同社区之间传播疾病的“超级传播者”链接方面提供了有希望的结果。
斯里兰卡COVID-19病毒爆发期间社交媒体网络的探索性分析
原文标题: Exploratory Analysis of a Social Media Network in Sri Lanka during the COVID-19 Virus Outbreak
地址: http://arxiv.org/abs/2006.07855
作者: D.S. Lenadora, G.S.W. Gamage, H.D.I. Haputhanthri, D. Meedeniya, I. Perera
摘要: 在COVID-19大流行期间,人类生活的各个方面在全球范围内经历了前所未有的变化。在位于南亚的发展中国家斯里兰卡,由于COVID-19病毒爆发的影响,有可能观察到一系列事件。因此,斯里兰卡人民利用社交媒体表达了对此类事件及其参与人员的观点,从而为探索社会观念提供了理想的途径。然而,这种行动的结果有时是有害的。进行这项研究的目的是找出发生这种情况的原因,并找出发生这种危机事件期间斯里兰卡民众的行为。为了支持这项研究,从斯里兰卡最受欢迎的社交媒体平台Facebook手动收集了来自50个来源的样本的观察结果以及相关帖子的数据。所考虑的帖子一直持续到该国首次爆发重大病毒后大约一个月,并且所包含的内容甚至与该病毒隐约相关。利用这些数据,进行了各种形式的分析,例如主题重要性和主题共现。调查结果强调,尽管可能存在社会有害的想法,但大多数职位都提出建设性和积极的想法,表明斯里兰卡社会在整个文化和社会价值观中所倡导的成功影响力。
墨西哥COVID-19大流行的地理空间传播
原文标题: Geospatial Spread of the COVID-19 Pandemic in Mexico
地址: http://arxiv.org/abs/2006.07784
作者: Dagoberto Pulido, Daniela Basurto, Mayra Cándido, Joaqín Salas
摘要: COVID-19是世界卫生组织宣布的大流行性传染病。尽管这是一种全球现象,但由于某些基本计划高度依赖于文化,地理,法律和习俗等因素,因此需要在当地采取迅速而明智的行动。本文介绍了我们绘制墨西哥州和市级COVID-19地理空间分布图的方法,这是卫生部提供的公开可用数据集中允许的最高可能分辨率。为了可视化感染的严重程度,我们为确诊的阳性,未决和死亡病例提供了地图,为支持流动性,我们提供了基本复制数 R_t 的地理空间可视化。本文档描述了数据集的结构,所使用的软件工具以及对地图功能的描述,这些定义我们已公开提供。
基于主体的洪水应急行人响应建模:移动行为规则及其对洪水风险分析的启示
原文标题: Agent-based modelling of pedestrian responses during flood emergency: mobility behavioural rules and implications for flood risk analysis
地址: http://arxiv.org/abs/2004.10589
作者: Mohammad Shirvani, Georges Kesserwani, Paul Richmond
摘要: 增强了用于模拟洪水与行人交互的基于主体的模型(ABM),以特别探索洪水期间疏散行人的更现实的响应。 ABM中的行人特工遵循导航规则来管理其在干旱地区的行动。在洪水中,行人特工被赋予额外的行为规则,以考虑其稳定性和步行速度以及他们不同的身高和体重。考虑到疏散行人行为规则的日益复杂的配置模式,ABM用于复制充斥的购物中心的综合测试案例。根据时空指标分析仿真结果,该指标根据常用的洪水灾害等级(HR)度量,可变的行走速度以及由于倾覆和/或滑动造成的不稳定性通知被淹行人的洪水风险状态动态变化。我们的分析显示,随着稳定性和步行速度行为规则变得更加复杂,疏散时间和风险暴露水平会大大延长。它还可以识别由于行人不稳定而导致的更为保守的HR阈值,并可以使用新公式直接估算步行速度状态作为洪水中稳定行人的HR函数。提供了有关软件可访问性的随附详细信息。
结合人口统计数据分析Foursquare和Streetlight数据对未来犯罪预测的影响
原文标题: Analyzing the Impact of Foursquare and Streetlight Data with Human Demographics on Future Crime Prediction
地址: http://arxiv.org/abs/2006.07516
作者: Fateha Khanam Bappee, Lucas May Petry, Amilcar Soares, Stan Matwin
摘要: 寻找有助于犯罪活动的因素及其后果,对于改进定量犯罪研究至关重要。为了回应这种担忧,我们从不同的角度和解释中研究了广泛的功能。我们的研究旨在建立数据驱动的模型来预测未来的犯罪事件。在本文中,我们建议使用路灯基础设施和Foursquare数据以及人口统计特征来改善未来犯罪事件的预测。我们根据各种特征组合以及基准模型评估分类性能。我们提出的模型在加拿大哈利法克斯的每个最小地理区域上进行了测试。我们的发现证明了整合各种数据源以获得令人满意的分类性能的有效性。
用于离网网络的基于区块链的分散式数据共享基础架构
原文标题: A Blockchain-based Decentralized Data Sharing Infrastructure for Off-grid Networking
地址: http://arxiv.org/abs/2006.07521
作者: Harris Niavis, Nikolaos Papadis, Leandros Tassiulas
摘要: 离网网络最近正在作为一种解决方案来连接未连接的网络,或为可能不受信任的参与者的网络提供替代服务。但是,当前使用的系统由于其集中性而显示出局限性,因此证明不足以确保信任。区块链技术可以成为在此类网络中实现信任和透明的工具。在本文中,我们介绍了一个用于在离网网络中不受信任的参与者之间安全和尊重隐私的分散数据共享的平台。所提出的架构通过将现有的区块链框架(Hyperledger Fabric,Indy,Aries)与离网网络设备和分布式文件系统集成来实现此目标。我们通过实验评估了提出的平台,并显示了其吞吐量和延迟的结果,这表明该平台足以支持离网分散式应用程序。
考虑天气条件的影响,在自行车共享系统中模拟自行车数量
原文标题: Modeling bike counts in a bike-sharing system considering the effect of weather conditions
地址: http://arxiv.org/abs/2006.07563
作者: Huthaifa I. Ashqar, Mohammed Elhenawy, Hesham A.Rakha
摘要: 本文开发了一种方法,该方法可以量化天气状况对旧金山湾区自行车共享系统中自行车站点数量预测的影响。随机森林技术用于对预测变量进行排名,然后使用指导的逐步逐步回归方法来开发预测模型。贝叶斯信息准则被用于各种预测模型的开发和比较中。我们证明了所提出的方法有望量化大型网络具有大数据的情况下,各种功能对大型BSS和每个站的影响。结果表明,一天中的时间,温度和湿度水平(之前尚未研究过)是重要的计数预测指标。它还表明,由于天气变量与地理位置有关,因此在进行建模之前应先对其进行量化。此外,研究结果表明,在时间t-1和一天中的时间i处的可用自行车数量是估计i处的自行车数量时最重要的变量。
使用地理标记事件跟踪的时空点过程进行隐式社区建模
原文标题: Modeling Implicit Communities using Spatio-Temporal Point Processes from Geo-tagged Event Traces
地址: http://arxiv.org/abs/2006.07580
作者: Ankita Likhyani, Vinayak Gupta, Srijith P. K., Deepak P., Srikanta Bedathur
摘要: 用户通过Foursquare,Twitter和Facebook Places等各种基于位置的服务进行位置签入,会生成大量带有地理标记事件的痕迹。这些事件跟踪通常显示在具有相似兴趣的用户的隐藏(可能重叠)社区中。推断这些隐式社区对于形成用户配置文件以改善建议和预测任务至关重要。仅给出带有时间戳的地理标记用户跟踪,我们是否可以找出这些隐式社区以及潜在影响网络的特征?我们可以使用这个网络来改善下一个位置预测任务吗?在本文中,我们着眼于社区检测问题并捕获潜在的扩散过程,并提出了基于时空点过程的COLAB模型,该模型基于连续时间但位置分散的空间,同时基于该模型对用户的隐式社区建模他们的签到活动,而无需利用他们的社会网络连接。 COLAB捕获位置的语义特征,用户对用户的影响以及用户的空间和时间偏好。为了学习潜在的用户社区和模型参数,我们提出了一种基于随机变分推理的算法。据我们所知,这是首次尝试结合活动驱动的隐性社区对扩散过程进行建模。我们证明,相对于从基于Foursquare签入收集的带有地理标记的事件跟踪的最新基于深度处理的方法而言,COLAB可以将位置预测任务最多提高27%。
社会网络中竞争注意力的中性理论
原文标题: Neutral Theory for competing attention in social networks
地址: http://arxiv.org/abs/2006.07586
作者: Carlos A. Plata, Emanuele Pigani, Sandro Azaele, Violeta Callejas, María J. Palazzi, Albert Solé-Ribalta, Sandro Meloni, Javier Borge-Holthoefer Samir Suweis
摘要: 我们使用基于中性模型的生态方法来研究在线社会网络中注意力的竞争。这种新颖的方法使我们能够分析一些生态模式,这些生态模式在信息生态系统的背景下也具有深刻的意义。具体来说,我们专注于研究与网络内模因的持久性和系统维持共存模因的能力有关的模式。我们不仅能够在近似连续极限内进行这种分析,而且还能获得有限尺寸离散系统的精确结果。
通过结合经典中心性来普遍地确定最有影响力的人
原文标题: Top influencers can be identified universally by combining classical centralities
地址: http://arxiv.org/abs/2006.07657
作者: Doina Bucur
摘要: 信息流,意见和流行病遍布结构化网络。当使用单个节点中心性指标来预测哪些节点将成为大型网络中的主要影响者或传播者时,在六个类别的60种有限,多样,静态的真实世界拓扑中,没有任何一个中心性具有一致的良好预测能力网络。我们显示,在每个网络的节点样本上训练的多中心统计分类器,在不同的网络案例中具有一致的预测性。某些中心点对在统计上绘制最大扩展器和其余扩展点之间的类边界时特别配合:测量节点邻域大小的局部中心点与本征向量中心点,紧密度或核心数等全局中心点很好地结合在一起。结果,具有七个经典中心点的训练分类器导致几乎最大的平均精度函数(0.995)。
通过Twitter Glass:检测微文本中的问题
原文标题: Through the Twitter Glass: Detecting Questions in Micro-Text
地址: http://arxiv.org/abs/2006.07732
作者: Kyle Dent, Sharoda Paul
摘要: 在另一项研究中,我们有兴趣了解Twitter上人们的问答习惯。在Twitter上查找问题原来是一个艰巨的挑战,因此我们考虑将一些传统的NLP方法应用于该问题。一方面,Twitter充满了特质,这使处理变得困难。另一方面,它的长度非常受限制,并且倾向于采用简单的语法结构,这可能有助于NLP处理的性能。为了找出NLP和Twitter的可行性,我们构建了一系列工具来专门与Twitter输入配合使用,以查找推文中的问题。这项工作仍然是初步的,但是在本文中,我们将讨论我们使用的技术和我们吸取的教训。
深度外生和内生性影响组合用于社会颤抖强度预测
原文标题: Deep Exogenous and Endogenous Influence Combination for Social Chatter Intensity Prediction
地址: http://arxiv.org/abs/2006.07812
作者: Subhabrata Dutta, Sarah Masud, Soumen Chakrabarti, Tanmoy Chakraborty
摘要: 在社交媒体上对用户参与动态进行建模在用户角色检测和政治话语挖掘中具有引人注目的应用。大多数现有方法在很大程度上取决于对基础用户网络的了解。但是,在缺乏任何可靠社会网络或仅部分揭示用户间联系(Reddit,Stackoverflow)的平台上进行了大量讨论。许多方法都需要在相当长的一段时间内观察讨论,然后才能做出有用的预测。在实时流方案中,观察会产生成本。最后,大多数模型无法捕获外部事件(例如在外部发布的新闻文章)和网络效应(例如有关Reddit的后续讨论)之间的复杂交互来确定参与度。为了解决上述三个限制,我们提出了一个新颖的框架ChatterNet,据我们所知,它是第一个可以建模和预测用户参与度而无需考虑底层用户网络的框架。给定带有时间戳记的新闻报道和讨论流,任务是观察一段短时间内直至某个时间范围的信息流,然后预测:不休:在视野后指定时间段内的讨论量。 ChatterNet使用新颖的随时间变化的递归网络体系结构处理新闻和讨论中的文本,该体系结构既可以捕获新闻和讨论中的时间属性,也可以捕获新闻对讨论的影响。我们使用Reddit的为期两个月的讨论语料,以及来自Common Crawl的在线新闻语料的同期语料,报告了广泛的实验。 ChatterNet显示出超越最新的参与度预测模型的重大改进。控制43个不同子分类的观察和预测窗口的详细研究得出了更多有用的见解。
检查情绪模式在预测自我报告的抑郁症状中的作用
原文标题: Examining the Role of Mood Patterns in Predicting Self-Reported Depressive symptoms
地址: http://arxiv.org/abs/2006.07887
作者: Lucia Lushi Chen, Walid Magdy, Heather Whalley, Maria Wolters
摘要: 抑郁症是全球残疾的主要原因。发现来自社交媒体帖子的抑郁信号的初步努力已显示出令人鼓舞的结果。由于内部有效性很高,因此此类分析的结果可能对临床判断有益。用于自动检测抑郁症状的现有模型从社交媒体数据中学习主体诊断信号,例如心理健康或药物名称的求助行为。但是,实际上,患有抑郁症的人通常会感到情绪低落,几乎在所有活动中都丧失愉悦感,一文不值或感到内,并且思考能力下降。因此,这些模型中使用的许多替代信号缺乏抑郁症状的理论基础。另据报道,在临床环境中来自许多患者的社交媒体帖子不包含这些信号。基于这一研究差距,我们建议监视一种已确定为情感障碍中的一类症状的信号-情绪。情绪是一种可以持续数小时,数天甚至数周的感觉。在这项工作中,我们试图通过为社交媒体用户构建“情绪特征”来丰富用于检测潜在抑郁症状的当前技术。
公平影响力最大化:福利最优化方法
原文标题: Fair Influence Maximization: A Welfare Optimization Approach
地址: http://arxiv.org/abs/2006.07906
作者: Aida Rahmattalabi, Shahin Jabbari, Himabindu Lakkaraju, Phebe Vayanos, Eric Rice, Milind Tambe
摘要: 一些社交干预措施(例如,自杀和艾滋病毒预防)利用社会网络信息来最大程度地扩大宣传范围。已经提出了算法影响力最大化技术来帮助选择此类干预措施中的影响者(或同伴领导者)。影响力最大化的传统算法在设计时并未考虑到社会干预。结果,他们可能不成比例地将少数民族社区排除在干预措施的收益之外。这激发了公平影响最大化的研究。现有技术需要致力于单个特定于域的公平性度量。这使得决策者很难有意义地比较这些概念及其在不同应用程序之间的权衡取舍。我们通过将基本福利原则扩展到影响最大化设置来解决这些缺陷,这是不同社区成员之间复杂联系的基础。我们概括了有关这些原则的理论,并显示了在什么情况下福利功能可以满足这些原则。然后,我们提出了一个由单个不平等厌恶参数控制的福利函数族,该决策函数使决策者能够研究公平与总影响力之间的任务相关权衡,并通过改变该参数有效权衡诸如影响力缺口之类的数量。我们将这些福利函数用作公平概念,以排除不必要的分配。我们表明,由此产生的优化问题是单调和亚模的,并且可以通过最优性保证来解决。最后,我们对综合的和真实的社会网络进行了详细的实验分析,并且应该在不显著牺牲总体影响的前提下实现较高的福利。有趣的是,我们可以证明存在经验上满足所有原理的福利函数。
通过集成学习检测伪造评论
原文标题: Fake Reviews Detection through Ensemble Learning
地址: http://arxiv.org/abs/2006.07912
作者: Luis Gutierrez-Espinoza, Faranak Abri, Akbar Siami Namin, Keith S. Jones, David R. W. Sears
摘要: 客户通过使用在线评论来分享他们的经验来表示他们对消费产品的满意度。几种基于机器学习的方法可以自动检测欺骗性和虚假评论。最近,有研究报告与传统的机器学习技术相比,基于整体学习的方法的性能。受集成学习最新趋势的推动,本文评估了基于集成学习的方法来识别虚假在线信息的性能。我们开发的许多基于整体学习的方法在一系列假餐厅评论中的应用表明,这些基于整体学习的方法比传统的机器学习算法能够更好地检测欺骗性信息。
世界GDP的能源表征
原文标题: The energy representation of world GDP
地址: http://arxiv.org/abs/2006.07938
作者: Boris M. Dolgonosov
摘要: 研究了世界国内生产总值对当前能源消耗和前一时期产生的,以生产基础设施形式实现的总能源的依赖性。该依存关系描述了1965-2018年整个观察间隔内的高精度经验数据。
多次重复在谣言大小上的作用
原文标题: The role of multiple repetitions on the size of a rumor
地址: http://arxiv.org/abs/2006.07992
作者: Alejandra Rada, Cristian F. Coletti, Elcio Lebensztayn, Pablo M. Rodriguez
摘要: 我们提出了一个数学模型来衡量多次重复可能会如何影响特定爆发期间从未听到谣言的人口的最终比例。该模型是多维连续时间马尔可夫链,可以看作是Maki-Thompson模型的概括,用于在同质混合群体中传播谣言。在众所周知的基本模型中,人口是由“传播者”,“无知者”和“胡言乱语”组成的,任何传播者都试图通过直接联系将谣言传给其他人。如果所接触的个人是一个无知的人,它将成为撒布者,而在另外两种情况下,发起者的撒布者会变成窒息者。有限人口中的过程最终将达到均衡状态,在这种情况下,个人要么是胡扯,要么是无知。我们通过假设每个无知者仅在听到谣言预定次数之后才成为传播者来推广该模型。我们确定并分析了该模型的一个合适的极限动力系统,并证明了限制定理,这些定理表征了人口在不同类别中的最终比例。
正式层次结构和非正式网络:组织结构如何塑造地方政府的信息搜索
原文标题: Formal Hierarchies and Informal Networks: How Organizational Structure Shapes Information Search in Local Government
地址: http://arxiv.org/abs/2006.08019
作者: Travis A. Whetsell, Alexander Kroll, Leisha DeHart-Davis
摘要: 近几十年来,对公共组织内部非正式交流网络的关注日益增长。虽然研究已经记录了个人认知和社会结构在理解组织中信息搜索中的作用,但本文强调了正式等级制的重要性。我们认为,在对公共组织中的知识流动进行建模时,官僚机构的结构属性太重要而不能忽略。根据经验,我们使用指数随机图模型研究了小城市政府中143名员工的人际信息搜索模式。结果表明,形式结构强烈塑造了信息搜索模式,同时考虑了社会网络变量和个人水平感知。我们发现,部门成员,层次结构,管理状态,权力接近程度和权限规则都影响员工的信息搜索。了解组织结构对信息搜索网络的影响将为通过设计选择改善公共组织中的信息流提供机会。
动态网络嵌入研究
原文标题: A Survey on Dynamic Network Embedding
地址: http://arxiv.org/abs/2006.08093
作者: Yu Xie, Chunyi Li, Bin Yu, Chen Zhang, Zhouhua Tang
摘要: 现实世界的网络由各种相互作用和不断发展的实体组成,而大多数现有研究只是将它们描述为特定的静态网络,而没有考虑动态网络的发展趋势。近来,在跟踪动态网络的属性方面取得了重大进展,其利用网络中实体和链接的变化来设计网络嵌入技术。与广泛提出的静态网络嵌入方法相比,动态网络嵌入致力于将节点编码为低维密集表示,从而有效地保留了网络结构和时间动态性,这对进行多种下游机器学习任务是有好处的。在本文中,我们对动态网络嵌入进行了系统的调查。具体来说,描述了动态网络嵌入的基本概念,尤其是,我们首次提出了一种新的现有动态网络嵌入技术的分类法,包括基于矩阵分解,基于Skip-Gram,基于自动编码器,基于神经网络的嵌入方法和其他嵌入方法。此外,我们仔细总结了常用的数据集以及动态网络嵌入可以从中受益的各种后续任务。之后,主要是,我们提出了现有算法面临的几个挑战,并概述了促进未来研究的可能方向,例如动态嵌入模型,大规模动态网络,异构动态网络,动态属性网络,面向任务的动态网络嵌入和更多的嵌入空间。
随机网络中长程相关性的出现
原文标题: Emergence of Long-Range Correlations in Random Networks
地址: http://arxiv.org/abs/2006.08132
作者: Shogo Mizutaka, Takehisa Hasegawa
摘要: 我们通过使用生成函数对不相关随机网络中巨型组件的远程相关性进行分析。通过引入特征长度,我们发现巨分量中的一对节点在特征长度内是负相关的,否则是不相关的。在临界点处,巨型分量变为分形的,特征长度发散,并且出现负的远程程度相关性。我们还为距离为 l 的节点对的度提出了一个相关函数,该函数在非关键区域中表现为距离的指数下降函数。相关函数遵循在临界点附近具有指数截止的幂律。使用Erd H o s-R 'e nyi随机图来确认此关键行为。
使用机器学习在自行车共享系统中建模自行车可用性
原文标题: Modeling bike availability in a bike-sharing system using machine learning
地址: http://arxiv.org/abs/2006.08352
作者: Huthaifa I. Ashqar, Mohammed Elhenawy, Mohammed H. Almannaa, Ahmed Ghanem, Hesham A. Rakha, Leanna House
摘要: 本文使用机器学习算法对旧金山湾区自行车共享站点的自行车可用性进行了建模。随机森林(RF)和最小二乘增强(LSBoost)被用作单变量回归算法,而偏最小二乘回归(PLSR)被用作多元回归算法。单变量模型用于模拟每个站点的可用自行车数量。 PLSR用于减少所需的预测模型的数量并反映网络中站点之间的空间相关性。结果清楚地表明,单变量模型的预测误差低于多变量模型。但是,对于具有相对大量空间相关站点的网络,多元模型结果是合理的。结果还表明,站台邻居和预测地平线时间是重要的预测因子。产生最小预测误差的最有效预测范围时间是15分钟。
具有任意聚类的随机图及其应用
原文标题: Random graphs with arbitrary clustering and their applications
地址: http://arxiv.org/abs/2006.08427
作者: Peter Mann, V. Anne Smith, John B. O. Mitchell, Simon Dobson
摘要: 许多实际网络的结构不是局部树状的,因此,典型的网络分析无法描述其键渗滤特性。在最近的一篇论文中,我们开发了具有均质聚类(节点位置等效的簇)的随机网络的渗滤特性的解析解决方案。在本文中,我们扩展了该模型以研究包含集群的网络,这些集群具有多个当前节点站点,包括多层网络。通过数值示例,我们展示了如何使用此方法研究具有任意聚类的随机复杂网络的属性,扩展配置模型的适用性并生成函数公式。
零模型用于多重优化的大型网络结构
原文标题: Null models for multi-optimized large-scale network structures
地址: http://arxiv.org/abs/2006.08508
作者: Sebastian Morel-Balbi, Tiago P. Peixoto
摘要: 我们研究网络中正在出现的大规模结构,这些结构会受到选择性压力的影响,同时会朝着更高的模块化和鲁棒性发展,以应对随机故障。我们构造了最大熵零模型,该模型将联合优化对网络结构的影响与任何种类的演化动力学隔离开来。我们的分析揭示了优化结构的丰富相图,该结构由模块化,核心外围和二分模式的许多组合组成。此外,我们观察到参数区域,同时优化可能是协同的或拮抗的,其中一个标准的改进分别直接辅助或阻碍了另一个。我们的结果表明,不同选择压力之间的相互作用如何在确定新兴网络结构中起关键作用,并且可以通过简单的网络模型来捕获这些相互作用。
死亡的社会空间因素:分析香港贝叶斯死亡率模型中地理空间分布变量的影响
原文标题: The sociospatial factors of death: Analyzing effects of geospatially-distributed variables in a Bayesian mortality model for Hong Kong
地址: http://arxiv.org/abs/2006.08527
作者: Thayer Alshaabi, David Rushing Dewhurst, James P. Bagrow, Peter Sheridan Dodds, Christopher M. Danforth
摘要: 人类死亡率在一定程度上是多种社会经济因素的函数,这些因素在时空上都不同。调整其他协变量后,人类寿命与家庭财富呈正相关。但是,尚不清楚该地区及其邻国的地理区域内的死亡率在多大程度上取决于社会经济因素。关于这种关系的时间成分的信息也很少。以多个人口普查年的香港地区为例,我们证明了(a)富裕但与社会贫困地区相邻的地区与(b)富裕地区的财富指标变量与长寿的关系存在差异被同样富裕的地区所包围。我们还表明,与基线模型相比,空间分布变量的包含减少了每个普查年死亡率预测的不确定性。我们的结果表明,地理死亡率模型应纳入非本地信息(例如空间邻居)以降低其死亡率估计的方差,并指出对社会空间溢出对死亡率的影响进行更深入的分析。
通过关注最成功的合作伙伴来阻止背叛者的入侵
原文标题: Blocking defector invasion by focusing on the most successful partner
地址: http://arxiv.org/abs/2006.08560
作者: Attila Szolnoki, Xiaojie Chen
摘要: 根据空间公益博弈的标准协议,合作伙伴玩家不仅要投资于自己的博弈,而且还要投资于相邻伙伴组织的博弈。在这项工作中,我们放松了这一假设,允许合作者确定哪个邻居更喜欢而不是一致地支持他们。特别是,我们假设他们选择了最成功的邻居,并将外部投资专门集中在相关群体上。我们显示出,动态规则的这种非常简单的改变会产生令人惊讶的积极演化结果-即使在博弈中由协同因子小的值所代表的严酷环境中,合作者仍然占上风。所报告的合作者策略成功背后的微观机制可以用一种阻止机制来解释,该机制以一种有偏见的方式影响竞争策略的传播。通过使用不同的交互拓扑结构,我们的研究结果保持不变,它表明,集中个人的努力以实现更高的全球福祉可能是有益的。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论