- 大规模Tumblr用户性别/年龄预测;
- 计算阿根廷可达性指标;
- 检测阿根廷锥虫病的潜在高患病率区域;
- 挖掘谣言和假新闻:概念、方法和最新进展;
- 建筑环境与步行:短程与长程步行;
大规模Tumblr用户性别/年龄预测
原文标题: Large-scale Gender/Age Prediction of Tumblr Users
地址: http://arxiv.org/abs/2001.00594
作者: Yao Zhan, Changwei Hu, Yifan Hu, Tejaswi Kasturi, Shanmugam Ramasamy, Matt Gillingham, Keith Yamamoto
摘要: tumblr,作为国内领先的内容提供商和社交媒体,吸引了3.71亿月访问量280个亿个博客和5330万发,每天的帖子。的tumblr的普及为广告商提供了巨大的机会,通过赞助的职位,以推广自己的产品。然而,这是一个具有挑战性的任务为目标的广告特定人群,因为的tumblr不需要像他们在注册过程中的性别和年龄的用户信息。因此,促进广告定位,必须用丰富的内容,如文章,图片和社会关系来预测用户的人口。在本文中,我们提出了基于图和深入的学习模式的年龄和性别的预测,其中考虑到用户的活动和内容的功能。对于基于图模型,我们提出了两个方案,网络嵌入和标签传播,产生连接,直接的功能,以及推断用户的人口。对于深学习模型,我们利用来预测用户的年龄和性别的卷积神经网络(CNN)和多层感知器(MLP)。在实际的tumblr的每日数据集实验结果,与数亿活跃用户,数十亿以下关系的,证明我们的方法显著跑赢基准模型,通过提高精度相对由年龄81%,而AUC和准确性由5 %的性别。
计算阿根廷可达性指标
原文标题: Computing Accessibility Metrics for Argentina
地址: http://arxiv.org/abs/2001.00596
作者: Carolina Lang, Tobias Carreira, German Cesar Dima, Lucila Berniell, Carlos Sarraute
摘要: 我们提出一个工具一组起源以及目的地的集合,利用阿根廷不同运输方式之间的计算距离和行驶时间。该工具的输入数据是一组目的地(城市设施还是“机会”,如企业,学校,医院,公园,银行,零售等点的地理参考列表)和一组起源的特点由可能被解释为家庭或其他的地理坐标。该工具确定,来自每个源,其是最接近的目的地,根据距离或旅行时间和运输方式(徒步,自行车,乘汽车,并通过公共交通工具)。出发地和目的地的集大集,它可以包含多达几千个百分点。我们的应用和发展的算法,以提高程序的不同部分的可扩展性。对于公共交通网络,我们预处理从每个点和用四树可到达的线,以确定所述点与所述总线线路的路径之间的距离。该项目的第二个目标是与使这一工具开源仅仅依靠开放的数据,如开放街道地图(OSM)数据,在一起。因此,这个工具的成功开发和实现是公共部门机构有潜在的益处,以及非政府组织和专注于公共政策,旨在提高无障碍城市,以此来设计和实现他们的工作其他民间社会组织减少空间上的不平等和社会排斥。
检测阿根廷锥虫病的潜在高患病率区域
原文标题: Detecting Areas of Potential High Prevalence of Chagas in Argentina
地址: http://arxiv.org/abs/2001.00604
作者: Antonio Vazquez Brust, Tomas Olego, German Rosati, Carolina Lang, Guillermo Bozzoli, Diego Weinberg, Roberto Chuit, Martin A. Minnoni, Carlos Sarraute
摘要: 具有高空间分解查加斯病(CHD)的潜在患病的图谱示。它的目的是检测大查科生态区(发病率高的CHD),其特点是具有较高的冠心病亲和力和高健康脆弱性以外的地区。为了量化潜在的患病率,我们开发了几个指标:一个亲和指数它量化冠心病的流行地区和国内其他地区之间的联系程度。我们也研究了骚扰锥蝽有利可居住条件,寻找在那里楼板,屋顶和天花板内部的主要材料有利于病媒的存在领域。我们研究了可以生脆弱性指数的概念下所涵盖的更一般性质的决定因素。这些因素与获得医疗服务提供者和居民的不同阶层的社会经济水平相关。最后,我们构建了结合亲和力指数,健康的脆弱性指数,人口密度的南美锥虫潜在患病率指数(ChPPI)。我们展示并讨论所获得的地图。这些地图是为了帮助公共卫生专家,公共卫生政策的决策者和政府官员在成本效益的发展战略,以提高获得诊断和治疗冠心病。
挖掘谣言和假新闻:概念、方法和最新进展
原文标题: Mining Disinformation and Fake News: Concepts, Methods, and Recent Advancements
地址: http://arxiv.org/abs/2001.00623
作者: Kai Shu, Suhang Wang, Dongwon Lee, Huan Liu
摘要: 近年来,造谣包括假新闻,已成为一个全球性的现象,由于其爆炸式的增长,特别是在社会化媒体。造谣和假新闻的广泛传播可能会导致有害的社会影响。尽管检测造谣和假新闻的最新进展,它仍然是不平凡的,因为它的复杂性,多样性,多模态,和事实查证或注释的成本。本章的目标是铺路通过欣赏的挑战和进步:(1)引进的各类信息障碍的社会化媒体和检查他们的区别和联系; (2)描述了新出现的重要任务,以打击造谣的表征,检测与归因;和(3)讨论的弱监督的方法来检测虚假与限制标记的数据。然后,我们提供了这本书代表了三个相关部分的最新进展章节的概述:(1)在信息混乱的传播用户约定; (2)在检测和减轻假技术; (3)趋势的问题,如道德,blockchain,clickbaits等。我们希望这本书是一个方便的切入点研究人员,从业人员和学生理解的问题和挑战,学会为国家的最先进的解决方案他们的具体需求,并迅速找出其领域新的研究问题。
建筑环境与步行:短程与长程步行
原文标题: Built Environment and Walking: Short vs. Long Walking Trips
地址: http://arxiv.org/abs/2001.00640
作者: Aryan Hosseinzadeh
摘要: 近几十年来,许多研究调查了行走的影响因素。虽然有很多查找有关这些因素,只有少数人进行短期和长期行走之旅及其相关影响因素进行区分。目前的研究调查的影响因素对行走之旅的份额,在短期和长期行走之旅的影响。要做到这一点,在第一步中短期和长期的旅行之间的主体应该得到承认。此外,两所提到案件的调查已经在出行生成区进行,在四个行程目的。虽然行走文学的显著部分由被集中在一个单一的出行目的的研究了,这项研究调查了各种各样的行程目的影响上行走的份额因素。在这项研究中,四个行程目的的个人行程信息(即,工作,教育,购物,返回家)已经以检测在112流量分析区短期和长期行走之旅为城市拉什特的影响因素进行了测试,伊朗。在这一点上,在文学评论中提到索引,从交通网络数据库和土地利用数据的。根据研究结果,密度在这两个出行产生双方在短途旅行是显著。此外,内置的环境因素是在描述很短的步行行程比较长的人更成功。模型能够描述在长期的教育行走吸引力短行程返回家园和0.11步行到0.277的份额。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。
网友评论