From Import AI
本期编辑小D非常给力,很用心的完成自己那部分的翻译。
希望再接再厉,一起加油 _。
紧急问题
如何面对AI的恶意使用:
当好人们天真地开源了AI系统时,坏人们却可能通过修改它,将好的AI转化为不好的AI...
人工智能,特别是深度学习,是种非常强大且有效的技术。这使得一些不怀好意的人可能会将其用于坏的用途。这基本上是所有重要技术需注意的:斧头可用于砍树也可以用来砍头,电可以照亮家中也可以电死人,实验室工作台可用于做疗药也可以用来做毒药...。
但与这些不同的是,AI还有些很危险的特性:即 Rodney Brooks 过去用来描述机器人的一句话:“快速,廉价,失控”。如今的AI系统运行在通用硬件上,大都可以用开源软件来实现,同时随着底层算法和计算力的进步可以看到性能的显著提高。
这些大家都是能够直接接触的,这意味着该技术有可能在做出巨大贡献同时,造成巨大的伤害。目前AI社区几乎让所有东西变成公开,虽然今天这看起来还是合理的,但未来可能就会变成大的危害,因为摩尔定律还有算法的进步(这意味着个人用更少的计算资源就能训练一个AI系统了)。
万用警报:
AI不仅仅是一种“两用”技术,而是一种万金油的技术。意味着目前搞清如何管理它,以防止坏人做坏事(大多数情况下)还很难做到。相反,更需要探索新的治理制度,社区规范,信息共享标准等等。
101页的问题报告:
如果您有兴趣深入了解这个问题,请查看众多研究人员花了去年一年时间制作的报告:The Malicious Use of Artificial Intelligence: Forecasting, Prevention, and Mitigation (Arxiv)。还可以通过这篇OpenAI的博文查看摘要。
百度可以通过少数样本克隆你的声音:
...真相只有一个...
百度研究所训练出了一种AI系统,可以通过少量的单人声音样本,微调神经网络然后输出听起来就像是这个人的声音。这种系统可能会非常强大,尤其是创建适用于多口音的多用户AI服务时。
然而细思极恐,如果它的性能变得非常好的话,那我们对声音的信任将会完全丧失。可幸的是,现在克隆语音的能力仍然有很大的不足,最好的系统也需要一百个不同的语音样本,而且听起来就像是从井底发出的声音,所以离我们真正遇到问题还有一段距离 - 但也要记住它们即将到来。
意味着什么:
这意味着将来不怀好意者可以将你的声音录下来,然后用文本到语音生成现成的对话。一旦这个时代到来,那么对声音的信任还有一个人的声音样本价值将会完全改变。
结果:为了更好地了解结果,可以听听这个示例(声音克隆:百度)。
更多:Neural Voice Cloning with a Few Samples (Baidu Blog).
为何未来机器人可能会被用作行人的减速带:
...研究人员展示了人们在巡逻机器人面前放慢脚步...
新泽西州霍博肯市史蒂文斯理工学院电气与计算机工程系的研究人员已经研究过人群对机器人的反应。他们为探究机器人辅助行人流量调节,在出口处设置的被动式人机交互(HRI)的研究。
结果:
“我们的实验结果表明,在出口通道环境中,机器人在与单向行人流垂直的方向上移动会减慢单向流动速度,机器人移动得越快, 平均行人速度变得更快,而且,当人们以更快的速度行走时,机器人对行人速度的影响更为显着,”他们写道。 换句话说:行人会避免一个笨拙的机器人在他们面前移动。
方法:
为了进行实验,研究人员使用定制的“Adept Pioneer P3-DX移动机器人”,它的程序被编程为以不同的速度垂直于行人流方向移动。为了收集数据,他们在房间内配备了五个Microsoft Kinect 3D传感器进行行人探测以及通过OpenPTrack进行追踪。
意味:
由于低成本化的传感器和硬件平台的激增,机器人变得便宜,人们很可能会将更多的机器人部署到现实世界中。 弄清楚这些非常愚笨的非反应式机器人如何变得有用,将进一步推动这些技术的应用,并增加经济规模以进一步降低硬件平台的成本并增加技术的推广。 基于这项研究,您可能会期待未来的机场和交通系统,在拥挤的路线上挤满了机器人往返穿梭,通过自动化机器人施加隐性的人群速度控制。
更多: Pedestrian-Robot Interaction Experiments in an Exit Corridor (Arxiv).
茶杯和AI:
... Google Brain的Eric Jang通过短篇故事解释了AI的难度...
你如何定义一个茶杯? 这是一个棘手的问题。 而且,越多尝试通过特定的视觉属性来定义它,就越有可能提供一种受到限制的狭义描述,或者遇到一个迟钝的读者。这些是Eric Jang在尝试定义茶杯这个有趣的小故事中探索的一些问题。
更多:
Teacup (Eric Jang, Blogspot.)
为什么在强化学习的帮助下,可以向你发送一辆自驾车?
...合作的研究人员与中国著骑行巨头滴滴出行合作,为了策略性车辆分配,模拟和测试RL算法...
来自中国骑行巨头滴滴 出行和密歇根州立大学的研究人员发表了关于使用强化学习来更好地管理跨给定城市区域的车辆分配的研究。 研究人员提出了两种算法来解决这个问题:contextual multi-agent actor-critic (cA2C)
和 contextual deep Q-learning (cDQN)
这两种算法都实施了调整,考虑地理禁区(如湖泊)以及其他协作智能体的存在。 算法的奖励功能是“通过将可用车辆重新定位,需供差距大于当前位置的地点,使平台的总商品量(GMV:所有订单的价值)最大化”。
数据集和环境:
研究人员在一个定制设计的大规模电网世界中测试他们的算法,这个世界充满了来自滴滴出行车队管理系统的真实数据。 这些数据连续四周的中国成都的游乐设施,包括订单价格,出发地,目的地和时间等信息,以及真实滴滴车辆的轨迹和状态。
结果:
研究人员通过模拟过去真实的情景来测试他们的方法,而不需要车队管理; 包括T-SARSA,DQN,Value-Iteration等一系列不同的技术; 然后通过实施基于RL的方法。CDQN和c2A2C的回报率高于所有基准线,其表现略高于(即略高于统计误差阈值)存量DQN。
为什么重要:
欢迎来到平台资本主义的新时代,在这个时代,GPU以最高速度嗡嗡作响,模拟替代版的商业世界。 虽然本文中的结果并不特别令人惊讶,但它们表明了未来平台公司将如何接近AI系统的部署:尽可能多地收集数据,构建一个基本模拟器,以便将实际数据插入,然后大力测试AI算法。 这表明,平台越大,数据和计算资源就越能够承受越来越高的保真度模拟; 所有的事情都是平等的,谁能够建立最高效和准确的模拟器就将可能是他们在市场上最好的竞争对手。
更多: Efficient Large-Scale Fleet Management via Multi-Agent Deep Reinforcement Learning (Arxiv).
CMU研究人员为改善端到端的SLAM,添加了“注意力”:
image...离神经SLAM的梦想越来越近...
卡内基梅隆大学和苹果公司的研究人员已经发布了关于神经图优化器的细节。神经图优化器是针对穿越在世界各地中的智能体同时定位和映射(SLAM)这一常年棘手的问题的神经方法。任何渴望在现实世界中做出有用的东西的系统都需要有SLAM功能。
今天,神经网络SLAM技术可以解决日常生活中遇到的问题,如错误的传感器校准和异常的亮度变化。所提出的神经图优化器系统由多个专用模块组成,以处理不同的SLAM问题,但每个模块都是可区分的,因此整个系统可以进行端对端培训 - 这是一个理想的命题,因为这可以缩短测试,实验,并迭代这些系统所需的时间。不同的模块处理从局部估计(基于当地情境的地方)到全球估计(您在全世界的哪个位置)的问题的不同方面,并纳入基于注意力机制的技术来帮助自动纠正训练期间产生的错误。
结果:
研究人员测试该系统是否能够在2D网格迷宫中导航,以及基于Doom游戏引擎的更复杂的3D迷宫。 实验表明,它能够更好地将某物的位置映射到相对于先前系统的真实地面位置。
为什么它很重要:
这项技术能剔除大量手工设计的SLAM算法,并将其替换为完全学习基底,使得这样的时代的到来变得更近。
这对于新系统新技术的测试和开发来说,是非常有用的,尽管它不可能在短期内取代传统的SLAM方法,因为神经网络很可能会继续显示他们在现实世界系统中不切实际的怪癖。
更多:
Global Pose Estimation with an Attention-based Recurrent Network (Arxiv).
AI 大佬们进行 Reddit AMA答题活动,承认了当前的难题
ImageReddit 机器学习板块是当前最大的英文机器学习网上社区。
AMA (Ask me anything 想问啥就问啥),是其中一个特殊的板块,会定期请一些领域有名的人来回答大家问题。
...话说三位 AI专家走进一家网站...
Yann LeCun,Peter Norvig和Eric Horvitz最近在Reddit上做了一个Ask Me Anything(AMA),大家像他们提出了很多最佳AI热带来的问题。这个AMA值得整个都阅读完,下面是其中的几个亮点:
计算鸿沟是不可否认的:“我的纽约大学学生在学校可以使用的GPU,就不可能像在FAIR公司实习时那么多”,Yann LeCun说。但也不要沮丧,他指出,尽管缺乏计算力,但学术界还是可能会继续成为新技术的主要发源地,之后大公司再将其扩大规模。 “你不会去想着与大型团队直接竞争的,这里有很多方法可以在不这样做的情况下也可以进行卓越的研究。”
通向通用人工智能(AGI) 之路:许多问题都是关于深度学习的局限性,而且稍稍探讨了可以产生更灵活,更强大智能体的研究途径。
Eric Horvitz对合奏方法很感兴趣**:“我们是否可以智能地将语音识别、自然语言、视觉、规划和推理等多种能力融入智能的大型协调的”合奏“中去,并探索如何协调的这个大难题。“
Yann LeCun:“通过观察世界来让机器学习预测模型是AGI目前最大的障碍...... 我的预感是,大脑中有一大块正是预测机构,它可以训练本身来预测任何它能预测的(从任何观察到的变量来预测未观察的变量,例如从过去和现在预测未来)。通过学习预测,大脑详细地勾画出了分层级的特征表示。“
更多:AMA AI researchers from Facebook, Google, and Microsoft (Reddit).
网友评论