- 社交媒体上的热点;
- 动态网络的拟合优度检验;
- 含时网络的增量嵌入;
- 检测Reddit上违反宏规范的注释的混合方法;
- 真或假?用户行为和态度与确定社交媒体帖子的准确性有关;
- 利用组合传递熵和特征向量中心性分析进行全厂故障和扰动筛选;
- 城市恐怖主义的共同统计模式;
- 语境情感分析:网上MeToo故事中人物形象的个案研究;
- 聪明、负责任和仅限上层种姓:通过对婚姻状况的大规模分析来衡量种姓态度;
- 分布式无需信任社会技术系统的脆弱性;
- 人工蜂群算法中社会交互的表征;
社交媒体上的热点
原文标题: Hot Streaks on Social Media
地址: http://arxiv.org/abs/1904.03301
作者: Kiran Garimella, Robert West
摘要: 衡量人类表现的影响和成功在各种学科中很常见,包括艺术,科学和体育。量化影响在社交媒体上也起着关键作用,其中影响通常被定义为用户的内容的覆盖范围,如视图,喜欢,转推或分享的数量等指标所捕获。在本文中,我们研究Twitter用户的整个职业生涯,以了解影响的属性。我们表明用户影响倾向于具有某些特征:首先,影响是按时间聚集的,这样用户的最有影响力的推文看起来彼此接近。其次,用户通常具有影响的“热点”,即延长的高影响力推文。第三,影响倾向于在用户最有影响力的推文之前逐渐积累,然后逐渐消失。我们尝试使用社交媒体上测量的各种属性(包括用户的网络,内容,活动和体验)来解释这些特征,并发现影响的变化与这些属性的重大变化相关联。我们的研究结果为未来的病毒性研究和对社交媒体的影响开辟了有趣的途径。
动态网络的拟合优度检验
原文标题: Goodness of Fit Testing for Dynamic Networks
地址: http://arxiv.org/abs/1904.03348
作者: Abram Magner, Wojciech Szpankowski
摘要: 在节点和边进入和离开网络的意义上,现实世界中的许多网络随时间而变化。已经提出各种动态随机图模型来解释这些系统的宏观性质并为统计推断和预测提供基础。有一个严格的方法来确定这些模型与观察到的网络的匹配程度。因此,我们提出以下拟合优度问题:给定一系列随机图的观察/快照以及候选模型 M ,我们可以确定快照是来自 M 还是来自某个任意替代模型在一些自然指标中与 M 完全分开?我们精确地制定了这个问题,并将其归结为图值无限状态马尔可夫过程的拟合度测试,并基于我们称为自然类模型的非平稳采样的过程展示和分析测试。
含时网络的增量嵌入
原文标题: Incremental embedding for temporal networks
地址: http://arxiv.org/abs/1904.03423
作者: Tomasz Kajdanowicz, Kamil Tagowski, Maciej Falkiewicz, Piotr Bielak, Przemysław Kazienko, Nitesh V. Chawla
摘要: 对图中的边和节点的预测需要适当且有效地实现的数据表示。最近对动态网络表示学习的研究取得了重大进展。但是,方法越精确和准确,计算和内存的复杂性就越大。在这里,我们介绍ICMEN - 一流的增量元嵌入方法,它生成关于图中时间依赖性的节点的向量表示。 ICMEN通过线性凸组合有效地构建节点从历史表示中嵌入,使得该过程比最先进的嵌入算法更少的内存要求。该方法能够构建非活动节点和新节点的表示,而无需重新嵌入。几个真实世界数据集的链路预测结果表明,将ICMEN增量元方法应用于任何基础嵌入方法,我们得到了类似的结果,并节省了内存和计算能力。总之,我们的工作提出了一种在动态复杂网络中进行有效在线表示学习的新方法。
检测Reddit上违反宏规范的注释的混合方法
原文标题: Hybrid Approaches to Detect Comments Violating Macro Norms on Reddit
地址: http://arxiv.org/abs/1904.03596
作者: Eshwar Chandrasekharan, Eric Gilbert
摘要: 在此数据集文件中,我们提出了一个三阶段流程来收集Reddit评论,这些评论是由多个子评级的主持人删除评论,因为它违反了subreddit规则和指南。除了主持人因违反社区规范而举报这些评论这一事实外,我们没有任何其他有关违规行为性质的信息。通过使用从Reddit的100个不同社区收集的超过2.8M的评论,我们确定了8个宏规范(即在Reddit的大多数部分广泛实施的规范)。我们通过采用混合方法(分类,主题建模和开放编码)提取这些宏观规范,在100个研究子目标中至少85个中被认定为规范违规的评论。最后,我们根据违反宏规范的具体类型标记了主持人删除的40K以上的Reddit评论,并使该数据集公开可用。通过将删除的注释集合分解为更细粒度的宏规范违规类型,我们的数据集可用于训练更细微的机器学习分类器以进行在线审核。
真或假?用户行为和态度与确定社交媒体帖子的准确性有关
原文标题: Real or Fake? User Behavior and Attitudes Related to Determining the Veracity of Social Media Posts
地址: http://arxiv.org/abs/1904.03989
作者: Linda Plotnick, Starr Hiltz, Sukeshini Grandhi, Julie Dugdale
摘要: 公民和应急经理需要能够在灾难期间将社交媒体上的“假”(不真实)新闻帖与真实新闻帖区分开来。本文基于2018年进行的一项在线调查,该调查通过电子邮件和Facebook分发了341份回复。它探讨了公民在多大程度上以及如何评估帖子是“真实”还是“假”,并描述了用户希望的内容可信度的指标。衡量用户尝试验证新闻可信度的频率的语义差异量表的平均响应(从1到0到5的比例)是3.37。公民使用的最常见的消息特征是语法和发送者的可信度。大多数受访者会发现可信度指标很有帮助,最受欢迎的选择是彩色图。讨论了灾害期间可信度评估的局限性和影响。
利用组合传递熵和特征向量中心性分析进行全厂故障和扰动筛选
原文标题: Plant-wide fault and disturbance screening using combined transfer entropy and eigenvector centrality analysis
地址: http://arxiv.org/abs/1904.04035
作者: Simon Streicher, Carl Sandrock
摘要: 在诸如工业化学加工厂之类的复杂系统中找到干扰或故障的来源可能是一项艰巨的任务并且消耗大量的工程时间。在许多情况下,系统消除程序被认为是唯一可行的方法,但可能导致不希望的过程扰乱。从业者需要强有力的替代方法。本文提出了一种无监督的数据驱动方法,用于根据影响的大小和新颖性对过程元素进行排序。部分双变量传递熵估计用于推断过程元素的加权有向图。应用特征向量中心性来根据网络节点的整体效果对网络节点进行排序。由于流程元素的排名依赖于依赖于许多连接的聚合的新兴属性,因此结果对于单个边属性的估计中的误差以及包含不代表该过程的真正因果结构的间接连接是稳健的。在多个重叠时间区域上连续计算的过程元素重要性分数的监控图表可以帮助初始故障检测。将结果与信息传递网络的视觉检查相结合,对于已知故障和干扰的根本原因分析也是有用的。可以使用所提出方法的软件实现。
城市恐怖主义的共同统计模式
原文标题: Common Statistical Patterns in Urban Terrorism
地址: http://arxiv.org/abs/1904.04148
作者: Weisi Guo
摘要: 现代恐怖主义背后的根本原因似乎是复杂和无形的。尽管存在多种因果机制,但研究表明,在全球范围内存在可以揭示人类对抗行为的一般统计模式。虽然许多警务和反恐行动是在城市一级进行的,但是缺乏基于统计模式建立城市级决议预测引擎的研究。该文件首次表明,恐怖袭击下的全球城市之间存在普遍共性。通过检查2002年至今全球7000多个城市的30,000多个地理标记的恐怖主义行为,结果显示如下。所有城市都遇到与人口无关的攻击 A ,并以 t 的时间间隔分隔负有指数分布的 sim exp(-A ^ - 1),每次攻击造成死亡人数遵循幂律分布。预测参数产生很高的置信度,可以解释高达87%的频率变化和89%的死亡收费数据。这些调查结果表明,恐怖袭击的总体统计行为对于所有全球城市来说似乎是随机的,无记忆的。使作者能够开发一个数据驱动的城市特定预测系统,并量化其信息论不确定性和信息丢失。进一步分析表明,攻击可预测性的不确定性似乎有所增加,这对我们发展有效反恐能力的能力提出了挑战。
语境情感分析:网上MeToo故事中人物形象的个案研究
原文标题: Contextual Affective Analysis: A Case Study of People Portrayals in Online MeToo Stories
地址: http://arxiv.org/abs/1904.04164
作者: Anjalie Field, Gayatri Bhat, Yulia Tsvetkov
摘要: 2017年10月,许多女性指责制片人Harvey Weinstein遭受性骚扰。他们的故事鼓励其他女性对包括政治家,演员和制片人在内的许多知名人士发出性骚扰指控。这些事件被广泛称为MeToo运动,其名称是在Twitter和Facebook等社交媒体平台上使用标签“metoo”。这一运动被广泛称为“赋权”,因为它扩大了以前闻所未闻的女性的声音,而不是传统上强大的男性。在这项工作中,我们调查了这些事件的在线媒体报道中的情绪,权力和代理的动态。使用关于MeToo运动的在线媒体文章语料库,我们提出了一种情境中的情感分析 - 一种以实体为中心的方法,它使用情境化词典来检查媒体文章中人物的描绘方式。我们表明,尽管这些文章对遭受过性骚扰的女性表示同情,但即使在性侵犯指控之后,她们也始终将男性视为最强大的。虽然我们专注于MeToo运动的媒体报道,但我们的情境情感分析方法很容易推广到其他领域。
聪明、负责任和仅限上层种姓:通过对婚姻状况的大规模分析来衡量种姓态度
原文标题: Smart, Responsible, and Upper Caste Only: Measuring Caste Attitudes through Large-Scale Analysis of Matrimonial Profiles
地址: http://arxiv.org/abs/1904.04176
作者: Ashwin Rajadesingan, Ramaswami Mahalingam, David Jurgens
摘要: 歧视性的种姓态度目前使数百万印度人蒙羞,使个人在生活的各个方面受到偏见。政府的激励措施和社会运动试图对抗这些态度,但尚无法准确衡量公众对种姓的看法,无法了解是否正在取得进展。在这里,我们介绍了一种通过指标变量衡量公众对种姓态度的新方法:对婚姻的开放性。我们使用来自印度主要婚姻场所的超过313,000个剖面的大量数据集,精确地量化了公众的态度,以及世代之间以及印度居民和侨民之间的差异。我们表明,年轻一代对婚姻中的婚姻更加开放,但态度的基础是社会地位超越自己种姓的复杂功能。在研究配偶所期望的品质时,我们发现对性别婚姻开放的个体在他们所渴望的品质上更具个人主义性,而不是偏爱与家庭有关的品质,这反映了更大的社会趋势,远离集体主义。最后,我们表明侨民的态度明显不那么开放,这表明了一体化的双文化模式。我们的研究提供了第一个经验证据,证明了身份的各种交叉点如何塑造了印度和美国印度侨民对种姓婚姻的态度。
分布式无需信任社会技术系统的脆弱性
原文标题: The fragility of decentralised trustless socio-technical systems
地址: http://arxiv.org/abs/1904.04192
作者: Manlio De Domenico, Andrea Baronchelli
摘要: 区块链技术有望改变金融,金钱甚至政府。然而,区块链适用性和稳健性的分析通常集中在孤立的系统上,这些系统的参与者主要通过运行一致性算法来做出贡献。在这里,我们强调在包括社交和通信网络在内的更广泛的生态系统中考虑无信任平台的重要性。作为一个例子,我们分析了2017年6月21日在以太坊平台上观察到的闪电崩溃,并表明社会协调的一个主要现象导致了几个互连系统中的灾难级联事件。我们提出“紧急集中化”的概念来描述单个系统对整个生态系统的运作至关重要的情况,并认为这种情况在相互关联的社会技术系统中可能会变得越来越频繁。我们预计,我们提出的系统方法将对未来对无信任系统的评估产生影响,并要求决策者注意我们相互关联和迅速变化的世界的脆弱性。
人工蜂群算法中社会交互的表征
原文标题: Characterizing the Social Interactions in the Artificial Bee Colony Algorithm
地址: http://arxiv.org/abs/1904.04203
作者: Lydia Taw, Nishant Gurrapadi, Mariana Macedo, Marcos Oliveira, Diego Pinheiro, Carmelo Bastos-Filho, Ronaldo Menezes
摘要: 计算群体智能包括多个人工简单代理,在探索搜索空间时交换信息。尽管该领域有丰富的文献,其作品改进了旧方法并提出了新的方法,但复杂行为在这些系统中出现的机制仍然未得到很好的理解。这种文献差距阻碍了研究人员处理群体智能中已知问题的能力,例如早熟收敛,以及代理人之间协调和多样性的平衡。然而,文献中的最新进展已经提出通过网络研究这些系统,该网络来自群体内的社交交互(即,交互网络)。在我们的工作中,我们提出了人工蜂群(ABC)算法的交互网络的定义。通过我们的方法,我们捕获了该算法的惊人特性。我们揭示了从每种类型的蜜蜂中出现的不同的社会互动模式,揭示了蜜蜂在算法迭代中变化的重要性。我们发现ABC通过使用不同的蜜蜂展示了动态的信息流,但缺乏代理之间的持续协调。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。
网友评论