- 从网络数据重建超图;
- 使用Gompertz函数模拟COVID-19死亡和感染的蒙特卡洛方法;
- 预测学术论文的引文;
- Sifter:基于主题的大规模视频管理的混合工作流;
- 基于危险食品阿拉伯文本的深度学习事件提取;
- 线程的智慧和说服力;
- 基于嵌入向量之间多种一致性的多元社会网络层间链路预测;
- 美国COVID危机期间的社交媒体和健康错误信息;
- 使用社交连通性核推断普遍的社会规模和隔离措施;
- 揭示多尺度网络纠缠对经验系统解耦的影响;
- 在Ad-Hoc社会网络中可靠传输热门数据包的开销控制;
- Ad hoc社会网络中基于用户流行度的分组调度以进行拥塞控制;
从网络数据重建超图
原文标题: Hypergraph reconstruction from network data
地址: http://arxiv.org/abs/2008.04948
作者: Jean-Gabriel Young, Giovanni Petri, Tiago P. Peixoto
摘要: 网络可以通过指定节点对之间的交互方式来描述各种复杂系统的结构。这种表示方式的选择是灵活的,但在需要节点组之间的联合交互来解释经验现象时,并不一定合适。但是,网络仍然是事实上的标准,因为关系数据集经常无法记录高阶交互。为了解决这一差距,我们在这里介绍一种贝叶斯方法,以从成对网络数据中重建高阶交互。我们的方法基于简约原理,并且在缺乏统计证据的情况下不会重建高阶结构。我们证明了我们的方法成功地揭示了综合和经验网络数据中的高阶交互。
使用Gompertz函数模拟COVID-19死亡和感染的蒙特卡洛方法
原文标题: A Monte Carlo approach to model COVID-19 deaths and infections using Gompertz functions
地址: http://arxiv.org/abs/2008.04989
作者: Tulio Rodrigues, Otaviano Helene
摘要: 这项研究通过蒙特卡洛方法描述了COVID-19死亡和感染的动态。根据世卫组织的数据,分析包括来自美国,巴西,墨西哥,英国,印度和俄罗斯的死亡数据,这些数据包括截至2020年8月7日死亡/确诊病例数最高的四个国家。通过映射 chi ^ 2 值,将Gompertz函数拟合到每周平均确认死亡人数的数据中。通过传播计算模型参数的不确定性,方差和协方差。美国和印度每天平均死亡人数的拟合函数呈上升趋势,前者的增长率较高且不确定性很大。对于墨西哥,英国和俄罗斯,拟合度与倾斜模式一致。对于巴西,我们发现微妙的下降趋势,但存在很大的不确定性。美国,英国和印度的数据显示,第一个高峰期的增长率高于第二个高峰期,表明卫生措施的非药物干预措施的收益以及使曲线变平的社会距离。对于美国来说,第三个高峰似乎是合理的,很可能与近期的放松政策有关。巴西的数据令人满意地描述了两个具有相似增长率的高度重叠的Gompertz函数,这表明大流行的传播过程分为两个步骤。该模型预测的2020年8月31日死亡总数(乘以10 ^ 3 )的95%CI为160至220、110至130、59至62、46.6至47.3、54至63和16.0美国,巴西,墨西哥,英国,印度和俄罗斯分别为16.7。我们对感染率的估计与在美国和巴西进行的血清学研究的一些初步报告合理地吻合。该方法代表了根据实际数据估算感染曲线的线形和相关参数的不确定性的有效框架。
预测学术论文的引文
原文标题: Predicting the Citations of Scholarly Paper
地址: http://arxiv.org/abs/2008.05013
作者: Xiaomei Bai, Fuli Zhang, Ivan Lee
摘要: 学术论文的引文预测对指导资金分配,招聘决策和奖励具有重要意义。但是,人们对引文模式如何随着时间演变知之甚少。通过探索学术论文引文的内在对合性质,我们基于四个因素引入论文潜力指数(PPI)模型:学术论文的内在质量,学术论文的影响随时间衰减,早期引文和早期公民的影响。此外,通过分析驱动引文增长的因素,我们提出了影响预测的多特征模型。实验结果表明,这两种模型提高了预测学术论文引文的准确性。与多特征模型相比,PPI模型在范围归一化的RMSE方面具有出色的预测性能。 PPI模型可以更好地解释引文的变化,而无需调整参数。与PPI模型相比,多特征模型在平均绝对百分比误差和准确性方面具有更好的预测;但是,它们的预测性能更多地取决于参数调整。
Sifter:基于主题的大规模视频管理的混合工作流
原文标题: Sifter: A Hybrid Workflow for Theme-based Video Curation at Scale
地址: http://arxiv.org/abs/2004.01790
作者: Yan Chen, Andrés Monroy-Hernández, Ian Wehrman, Steve Oney, Walter S. Lasecki, Rajan Vaish
摘要: 用户生成的内容平台将其庞大的存储库整理成主题汇编,以促进发现高质量的资料。寻求严格的编辑控制的平台需要人员来进行管理,但是此过程涉及耗时的例行任务,例如筛选成千上万个视频。我们介绍了Sifter,该系统通过将自动化技术与人力管道相结合来改进策展过程,该管道可以浏览,选择并就要包括在编辑中的视频达成协议。我们通过从34,000多个用户生成的视频中创建12个合辑来评估Sifter。 Sifter比专用策展人的速度快三倍以上,其输出质量相当。我们反思了Sifter提出的挑战和机遇,这些挑战和机遇为内容管理系统的设计提供了参考,这些系统需要大规模的主观人工判断。
基于危险食品阿拉伯文本的深度学习事件提取
原文标题: Event Extraction Based on Deep Learning in Food Hazard Arabic Texts
地址: http://arxiv.org/abs/2008.05014
作者: Fouzi Harrag, Selmene Gueliani
摘要: 社交媒体网站已经向公众传播了数字设备,从而使信息共享变得更加容易和快捷。交换文本数据是社交媒体用户中最流行的交流方式。这已经成为治疗的必要。另一方面,事件提取表明了解社交媒体帖子流中的事件。事件提取有助于在自然灾害中采取更快的纠正措施,并可以挽救生命。任务的主要目的是开发特定的模型,以检测和提取数字文本中标识的事件(事件)。我们在这里提出了一个基于深度递归网络的模型,以从社交媒体提要中提取事件。
线程的智慧和说服力
原文标题: The Wisdom and Persuadability of Threads
地址: http://arxiv.org/abs/2008.05203
作者: Robin Engelhardt, Vincent F. Hendricks, Jacob Stærk-Østergaard
摘要: 在线讨论线程是个人决策和汇总集体判断的重要手段,例如“人群的智慧”。关于人群智慧的实证研究目前与社会信息所起的作用尚不明确。尽管一些发现表明社交信息由于相关的判断错误而破坏了人群的准确性,但另一些研究表明,准确性提高了。我们通过实验研究了线程的准确性,其中参与者在看到不同数量的先前估计的同时做出了难度不同的幅度估计。我们证明,对于困难的任务,查看先前的估算值有助于提高人群的智慧。但是,如果参与者仅看到极端估计,那么智慧很快就会变成愚蠢。使用高斯混合模型,我们为每个参与者分配了一个可说服性得分,并显示了可说服性随着任务难度和所提供的社交信息量的增加而增加。在筛选出的线索中,我们看到了具有高度说服力的参与者和怀疑者之间的差距越来越大。
基于嵌入向量之间多种一致性的多元社会网络层间链路预测
原文标题: Interlayer Link Prediction in Multiplex Social Networks Based on Multiple Types of Consistency between Embedding Vectors
地址: http://arxiv.org/abs/2008.05212
作者: Rui Tang, Zhenxiong Miao, Shuyu Jiang, Xingshu Chen, Haizhou Wang, Wenxian Wang, Mingyong Yin, Wei Wang
摘要: 在线用户通常活跃在构成一个多元化社会网络的多个社交媒体网络(SMN)上。确定不同SMN上的给定帐户是否属于同一用户正变得越来越具有挑战性。这可以表示为多路网络中的层间链路预测问题。为了应对预测层间链接的挑战,可以利用特征或结构信息。使用网络嵌入技术来解决该问题的现有方法集中于学习映射功能,以将所有节点统一到一个共同的潜在表示空间中进行预测。未利用未匹配节点与其公共匹配邻居(CMN)之间的位置关系。此外,这些层通常被建模为未加权图,而忽略了节点之间关系的强度。为了解决这些限制,我们提出了一种基于嵌入向量之间的多种一致性类型的框架(MulCEV)。在MulCEV中,采用传统的基于嵌入的方法来获取表示不匹配节点的向量之间的一致性程度,并且基于每个潜在空间中节点位置的拟议距离一致性指标为预测提供了其他线索。通过将这两种类型的一致性相关联,可以充分利用潜在空间中的有效信息。此外,MulCEV将图层建模为加权图以获得更好的表示。这样,节点之间关系的强度越高,其在潜在表示空间中的嵌入向量将越相似。我们在多个实际数据集上的实验结果表明,所提出的MulCEV框架明显优于当前基于嵌入的方法,尤其是在训练迭代次数较小的情况下。
美国COVID危机期间的社交媒体和健康错误信息
原文标题: Social Media and Health Misinformation during the US COVID Crisis
地址: http://arxiv.org/abs/2008.05271
作者: Gillian Bolsover, Janet Tokitsu Tizon
摘要: 人们发现在社交媒体上普遍存在健康错误信息,特别是在科学信息有限的新公共卫生危机中。但是,社交媒体也可以在限制和反驳健康错误信息方面发挥作用。该数据备忘录以美国总统唐纳德·特朗普(Donald Trump)关于基于紫外线和消毒剂的治疗的前景和功效的有争议的评论为例,研究了如何在Twitter上讨论和回应这些评论。我们发现这些评论落入既定的政治党派叙述中,并在随后的几天中主导了对政治和COVID的讨论。评论的争议比支持要普遍得多。支持者根据特朗普的现有言论对媒体报道进行了攻击。参赛者幽默地回应,并分享了主流媒体对这些评论的谴责。这些做法本可以通过重复来加强原始的错误信息,而对可能相信它们的人却没有成功地构成反驳。这项研究为我们对围绕COVID的信息环境的理解增添了急需的知识,并表明,尽管在这次公共卫生危机中要求将卫生信息非政治化,但在很大程度上,这是沿着分裂,两极化,党派路线的政治问题。 。
使用社交连通性核推断普遍的社会规模和隔离措施
原文标题: Inference of a universal social scale and segregation measures using social connectivity kernels
地址: http://arxiv.org/abs/2008.05337
作者: Till Hoffmann, Nick S. Jones
摘要: 人们如何彼此联系是社会科学中的一个基本问题,由此产生的社会网络可以对我们的日常生活产生深远的影响。布劳提出了一个有力的解释:人们根据自己在社交空间中的位置相互联系。然而,允许在社会内部和社会之间进行比较的社会距离的原则性度量仍然难以捉摸。我们使用条件独立边模型的连接性内核来开发具有理想属性的隔离统计系列:它们在社交空间上提供了直观且通用的特征量表(便于在数据集和社会之间进行比较),适用于多元和混合节点属性,并在个人,个人对以及整个社会的层面上实现隔离。我们表明,种族隔离统计数据可以在Blau空间(由社会成员的属性跨越的空间)上引入度量,并提供两个社会的地图。在贝叶斯范式下,我们从在英国和美国的四次调查中收集的十一个自我网络数据集推断出连接内核的参数。布劳空间不同维度的重要性在时间和位置上都相似,这暗示着宏观上稳定的社会结构。身体上的分离和年龄的差异对友谊网络内的种族隔离影响最大,对人生后期的代际融合和孤立具有影响。
揭示多尺度网络纠缠对经验系统解耦的影响
原文标题: Unraveling the effects of multiscale network entanglement on disintegration of empirical systems
地址: http://arxiv.org/abs/2008.05368
作者: Arsham Ghavasieh, Massimo Stella, Jacob Biamonte, Manlio De Domenico
摘要: 复杂系统是实体的大集合,这些实体将自身组织成可以由网络表示的非平凡结构。这种系统的主要新兴特性是针对随机故障或针对性攻击的鲁棒性-即网络在删除节点或链接时保持其完整性的能力。在这里,我们介绍网络纠缠,通过多尺度镜头来研究网络的鲁棒性,该镜头由在系统中传播信息所需的时间进行编码。我们的措施的基础是基于最近提出的框架,该框架显然受到量子统计物理学的启发,该网络被解释为纠缠单元的集合,并且可以用类似于吉布斯的密度矩阵来表征。我们表明,在最小的时间尺度上,纠缠减少到节点程度,而在较大的尺度上,我们显示出它能够测量每个节点在网络完整性中扮演的角色。在中尺度上,纠缠合并了结构以外的信息,例如系统的传输属性。作为一项应用,我们证明了经验社会,生物和交通运输系统的网络拆解揭示了驱动网络解体的最佳时间尺度的存在。我们的结果为网络收缩过程及其对动态过程的影响进行新颖的多尺度分析打开了大门。
在Ad-Hoc社会网络中可靠传输热门数据包的开销控制
原文标题: Overhead Control with Reliable Transmission of Popular Packets in Ad-Hoc Social Networks
地址: http://arxiv.org/abs/2008.05394
作者: Feng Xia, Hannan Bin Liaqat, Jing Deng, Jiafu Wan, Sajal K. Das
摘要: 在多跳特设社会网络(ASNET)中,可靠的社交连接和流行节点的数据传输至关重要。在这种网络范式中,传输不可靠性可能是由在单个节点上运行的多个社交应用程序引起的。这导致节点和连接路径之间的争用。另外,拥塞可能是由于多个发送方将数据发送到单个接收方,而每个发送方都在等待肯定的确认继续进行。因此,传统的传输控制协议(TCP)在ASNET中的性能较差,这是由于以下事实:使用往返时间在节点之间共享可用带宽,并且向每个数据包分别提供了确认。为解决这些问题,我们提出了一种技术,即在Ad-Hoc社会网络(RTPS)中可靠传输流行数据包的开销控制,该技术通过根据用户的流行程度为用户分配带宽来提高传输可靠性:具有较高知名度的节点及其确认将以较高的优先级发送。另外,RTPS通过延迟确认数据包传输进一步减少了争用和数据包丢失。我们的详细研究表明,在不同的跃点距离和不同数量的并发TCP流的吞吐量延迟和开销方面,RTPS的出色性能。
Ad hoc社会网络中基于用户流行度的分组调度以进行拥塞控制
原文标题: User Popularity-based Packet Scheduling for Congestion Control in Ad-hoc Social Networks
地址: http://arxiv.org/abs/2008.05395
作者: Feng Xia, Hannan Bin Liaqat, Ahmedin Mohammed Ahmed, Li Liu, Jianhua Ma, Runhe Huang, Amr Tolba
摘要: 传统的自组织网络数据包调度方案无法满足基于邻近的自组织社会网络(ASNET)的要求,并且它们在拥挤的环境中无法正常运行。为了解决此问题,我们提出了一种基于用户流行度的数据包调度方案,用于ASNET中的拥塞控制,称为Pop-aware。所提出的算法利用发送者节点的社会流行度来对所有传入流进行优先级排序。 Pop-aware还提供每个流所接收的服务的公平性。我们通过一系列模拟评估Pop-aware的性能。与某些现有的调度算法相比,Pop-aware在控制开销,总开销,平均吞吐量,数据包丢失率,数据包传递率和平均延迟方面表现更好。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论