- 复杂网络系统流模型的影响力与介数;
- Facebook是否将敏感数据用于广告目的?全球分析和GDPR影响;
- 探索公共合作的最佳制度激励机制;
- 深度绘图:图绘制的深度学习方法;
- Python包索引(PyPI)的实证分析;
- 随机聚类网络中渗流簇的结构;
- 二元预测与实际收益的统计差异;
- 社交数据流的实时事件检测;
复杂网络系统流模型的影响力与介数
原文标题: Influence and Betweenness in Flow Models of Complex Network Systems
地址: http://arxiv.org/abs/1907.10667
作者: Olexandr Polishchuk
摘要: 本文对复杂网络系统研究的功能方法进行了分析。为了研究这些系统的行为,引入了流邻接矩阵。分析复杂网络节点的强度,功率,域和影响直径的概念,以确定它们在系统结构中的重要性。介绍了网络节点和边之间的度量,功率,域和直径的概念,以确定它们在网络系统运行过程中的重要性。这些指标定量地表示相应元素对系统中流动的影响,并确定在阻止该节点或边或对其进行有针对性攻击时预期的损失。引入类似的影响和介入概念来确定网络系统的独立子系统和整个系统的功能重要性。给出了在研究真实复杂网络系统期间获得的结果的实际使用示例。
Facebook是否将敏感数据用于广告目的?全球分析和GDPR影响
原文标题: Does Facebook Use Sensitive Data for Advertising Purposes? Worldwide Analysis and GDPR Impact
地址: http://arxiv.org/abs/1907.10672
作者: Ángel Cuevas, José González Cabañas, Aritz Arrate, Rubén Cuevas
摘要: 最近的欧洲通用数据保护条例(GDPR)和其他数据保护法规限制了某些类别的个人数据(健康,政治倾向,性取向,宗教信仰,种族血统等)的处理,因为这些隐私风险与此类相关。信息。 GDPR将这些类别称为敏感个人数据。本文量化了197个国家的Facebook(FB)用户部分,这些用户被标记为与潜在敏感个人数据相关的广告兴趣。我们的研究显示,Facebook标记了67%具有潜在敏感兴趣的用户。这相当于197个国家中22%的人口。此外,我们的工作表明,GDPR执法在这方面的影响可以忽略不计,因为在欧盟的敏感利益标记的FB用户部分在GDPR颁布前5个月和9个月后几乎保持不变。该文件还说明了与敏感利益的使用相关的潜在风险。例如,我们量化了在同性恋可能会被判处死刑的国家中标有“同性恋”兴趣的FB用户部分。最后一个贡献是实现了Web浏览器扩展,允许FB用户以简单的方式删除FB为其分配的潜在敏感兴趣。
探索公共合作的最佳制度激励机制
原文标题: Exploring optimal institutional incentives for public cooperation
地址: http://arxiv.org/abs/1907.10989
作者: Shengxian Wang, Xiaojie Chen, Attila Szolnoki
摘要: 亲社会激励可以促进合作,但提供激励是昂贵的。人类社会中的机构可能更愿意使用能够以合理的成本促进合作的激励策略。然而,迄今为止,很少有工作探索最佳的制度激励措施,以最大限度地降低相关成本,从而有利于公共合作。在这项工作中,结合最优控制理论,我们制定了两个最优控制问题,分别探讨制度奖惩的最优激励策略。利用Hamilton-Jacobi-Bellman方程对良好混合种群的方法,我们理论上分别以最小累积成本获得最优的正负激励策略。此外,我们提供了数值例子来验证所获得的最优激励是否允许动态系统以最低的累积成本与其他给定的激励策略相比达到期望的目的地。此外,我们发现,当与最优奖励策略进行比较时,最优惩罚策略是获得预期合作水平的更便宜的方式。
深度绘图:图绘制的深度学习方法
原文标题: DeepDrawing: A Deep Learning Approach to Graph Drawing
地址: http://arxiv.org/abs/1907.11040
作者: Yong Wang, Zhihua Jin, Qianwen Wang, Weiwei Cui, Tengfei Ma, Huamin Qu
摘要: 节点链接图广泛用于促进网络探索。然而,当使用图绘制技术来可视化网络时,用户通常需要通过比较相应的绘图结果来迭代地调整不同的算法特定参数,以便实现期望的视觉效果。此试错过程通常非常繁琐且耗时,尤其对于非专家用户而言。受深度学习技术强大的数据建模和预测功能的启发,我们探索了将深度学习技术应用于图绘制的可能性。具体而言,我们建议使用基于图LSTM的方法将网络结构直接映射到图图。给定一组布局示例作为训练数据集,我们训练所提出的基于图LSTM的模型以捕获它们的布局特征。然后,训练的模型用于生成新网络的类似样式的图绘制。我们以定性和定量的方式评估了两种特殊类型布局(即网格布局和星形布局)和两种一般布局类型(即ForceAtlas2和PivotMDS)的建议方法。结果为我们的方法的有效性提供了支持。我们还对具有20到50个节点的小图的图纸进行了时间成本评估。我们进一步报告我们学到的经验教训,并讨论限制和未来的工作。
Python包索引(PyPI)的实证分析
原文标题: An Empirical Analysis of the Python Package Index (PyPI)
地址: http://arxiv.org/abs/1907.11073
作者: Ethan Bommarito, Michael Bommarito
摘要: 在本研究中,我们提供了Python包存储库PyPI的综合实证摘要,包括包元数据和源代码,包括178,592个包,1,745,744个版本,76,997个贡献者和156,816,750个import语句。我们提供包,版本,依赖关系,类别分类,许可证和包导入以及作者,维护者和组织的计数和趋势。作为发布时最大和最古老的软件存储库之一,PyPI不仅提供了当今Python生态系统的洞察力,还提供了更广泛的软件开发和许可趋势。在PyPI中,我们发现存储库的增长在所有指标下都很稳健,活跃包的复合年增长率为18.3%,新作者的复合年增长率为15.5%,而最后一个新的进口报表的复合年增长率为27%。 15年。与许多类似的社交系统一样,我们发现了许多高度右倾的发行版,包括每个包的发布版本,每个作者的包和发行版,每个包的导入数以及每个包和发行版的大小。但是,我们还发现大多数软件包是由单个人提供的,而不是由多个人或组织提供。这里的数据,方法和计算为PyPI的公共讨论提供了锚点,并为未来Python软件生态系统的研究奠定了基础。
随机聚类网络中渗流簇的结构
原文标题: Structure of percolating clusters in random clustered networks
地址: http://arxiv.org/abs/1907.11130
作者: Takehisa Hasegawa, Shogo Mizutaka
摘要: 我们研究了在随机聚类网络(RCN)模型上由站点渗透形成的渗透簇(PC)的结构。使用生成函数,我们制定了PC的聚类系数和协调性。我们在分析和数值上表明高度集群网络中的PC即使在渗透阈值处也是聚类的。 PC的兼容性取决于RCN的细节。当通过泊松分布指定每个节点的边和三角形的数量时,在渗透阈值处的PC是不协调的,但是当RCN中的节点具有相同数量的边和三角形时,PC是分配的。这个结果似乎与分形网络的不协调性相矛盾,尽管重整化方案揭示了分形PC的不协调性。
二元预测与实际收益的统计差异
原文标题: On the Statistical Differences between Binary Forecasts and Real World Payoffs
地址: http://arxiv.org/abs/1907.11162
作者: Nassim Nicholas Taleb
摘要: 二元(或概率)预测能力与整体表现有什么关系?我们映射(单变量)二元预测,投注和“信念”(表示为特定“事件”将发生/不会发生)和现实世界连续收益(数字利益或事件的伤害)之间的差异并显示效果他们在决策科学文献中的混淆和错误描述。我们还研究了薄和肥尾的差异。其影响包括:A-许多心理结果的虚假性,特别是那些记录人类高估尾部概率和罕见事件的结果,或者他们对市场崩溃,生态灾难等的恐惧反应过度。许多感知到的“偏见”只是心理学家的错误描述。哈耶克在推动预测市场方面也存在滥用的论点。我们使用“伪高估”的度量来量化这种混淆。 B-作为二元空间中的“良好预测者”并不会导致具有良好的实际性能,反之亦然,尤其是在非线性情况下。在某些分布类别下,二元预测记录可能是一个反向指标。更深的不确定性或更复杂和更现实的概率分布使混淆恶化。 C-机器学习:一些非线性代价函数,虽然不能用于语言表达和“预测”,但很好地被ML捕获或在期权合约中表达。 D- 厚尾性:在概率分布的幂律类中,差异更加严重。
社交数据流的实时事件检测
原文标题: Real-time Event Detection on Social Data Streams
地址: http://arxiv.org/abs/1907.11229
作者: Mateusz Fedoryszak, Brent Frederick, Vijay Rajaram, Changtao Zhong
摘要: 社会网络正迅速成为讨论现实世界事件发生情况的主要媒介。在Twitter等社交平台上生成的信息可以生成丰富的数据流,以便立即了解正在进行的事务以及围绕它们的对话。为了解决事件检测问题,我们将事件建模为趋势实体集群的列表。我们描述了一个实时系统,用于发现模块化设计且规模和速度新颖的事件:它将聚类应用于每分钟有数百万个实体的大流,并生成动态更新的事件集。为了评估聚类方法,我们构建了一个评估数据集,该数据集源自完整的Twitter Firehose的快照,并提出了用于测量聚类质量的新指标。通过实验和系统分析,我们重点介绍了离线和在线管道的关键结果。最后,我们在Twitter上可视化一个高调的事件,以显示对事件演变进行建模的重要性,特别是那些从社交数据流中检测到的事件。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论