美文网首页
“我无处不在”——解读微软小冰第五代发布会

“我无处不在”——解读微软小冰第五代发布会

作者: gfghf | 来源:发表于2017-09-05 10:20 被阅读0次

    8月22日,微软在北京微软大厦举办第五代小冰发布会,公布了一年以来微软小冰取得的进展。这次发布会也保持着往年的发布会传统,信息量非常大,并且只发布已经上线的产品,即使是一些概念,也都是在产品中有实际体现。微软也一直避免使用晦涩的技术术语,而是用比较通俗的方式介绍小冰的产品特性。

    人工智能连接人与世界

    微软对人工智能的思考由来已久,也有着几十年的深厚积累来支持人工智能的发展。在人工智能领域,微软一共有三条产品线。第一是将人工智能放进微软已有的产品中,第二是以Bing为延伸的智能助理小娜,还有一类就是全球小冰。

    微软全球执行副总裁沈向洋在发布会上表达了他对人工智能以及小冰的看法,他认为:

    1、语音交互、图像识别等等都不是人工智能的核心。未来人工智能的核心一个是IQ,一个是EQ。微软希望通过小冰理解EQ这件事情。

    2、小冰的设计理念是打造是一个情感计算框架,并同时具有很多的生存空间、辅助设备和其他相关的设备。

    3、小冰可以和人在任何地方、任何场景进行交流。

    此外,Bing和小冰很有渊源,在中国新上线的Bing国际版搜索上,整合了美国小冰Zo,这是微软让小冰和世界上的知识、内容和服务连接更紧密的一种尝试。

    表面上看小冰只是一个聊天机器人,但她不仅仅是一个聊天机器人。沈向阳在发布会中说,每个时代,科技进步会颠覆掉很多事情,最重要的是重新定义了人类和世界的关系,例如PC时代的操作系统和应用软件,互联网时代的浏览器和搜索引擎,移动互联网时代的社交网络和AppStore。微软小冰将成为AI时代的核心,一端与人类交互,一端连接世界上的知识、内容和服务。

    三大技术突破

    微软小冰不仅拥有算法和云计算两大先天优势,还有着在业内遥遥领先的数据量:超过一亿用户,超过300亿的人机直接对话,以及大量的语音图片视频交互数据。目前,小冰也加快了在全球范围内的扩张速度,目前除中国、日本、美国外,还已登录印度和印度尼西亚。

    第五代小冰实现了三大技术突破:

    1、生成模型

    上一代的小冰拥有十亿级的大数据语料库,但其中每句话,都是互联网上某个人类曾经说过的话,小冰只是通过分析理解用户的问题,寻找语料库中最合适的话作为她的回答。使用生成模型之后,小冰说的每一句话,都可能是这世界上从未出现过的。最新发布的印度尼西亚小冰,是开放领域对话人工智能中,第一个百分之百使用了生成模型的落地产品。

    2、全双工语音

    如果将全双工语音这种高级感官的体验比拟为打电话,则之前的智能助理语音交互体验类似于对讲机。现在小冰可以直接通过电信运营商,拨通人类的电话,并且她有能力根据自己的“意愿”与人联络。

    3、实时流媒体视觉

    实时流媒体视觉高级感官,让小冰不仅能“看到”眼前的画面,还能像人类一样,感知人的位置和移动、体察动作和表情。她还能理解不同的场景、每个人不同的身份、以及人与人之间的关系。最后,她还会根据视觉的理解和人进行具有情商的互动。

    这些技术突破令小冰拥有了突破虚拟世界进入现实世界的能力,也让她能够大幅度地提升交互体验,更加贴近于人类的自然交互行为。

    情感计算框架进入完成态

    从第五代小冰代开始,情感计算框架进入了完成态,小冰将和整个世界的第三方的内容、知识、服务的更多地对接,不仅如此,也通过人工智能技术,原创的使微软拥有知识产权的内容,小冰的生存空间也得到了大幅扩展。

    这些离不开一个核心就是EQ。这也是微软的目标,希望小冰可以在与人的对话、交往中占据主动,甚至于获得控制的权利。第五代小冰的核心对话引擎,情绪识别要拓宽非常多,她会更进一步地分析人类用户各种各样的兴趣,而这个分析不仅仅限于当前一个对话的过程,可能会考虑这个人整个的部分。在微软的理解,EQ的极致其实是纯理性的而不是感性的,小冰的EQ让她和人类之间的互动进入了良性循环的过程。

    在情感计算框架下,微软找到了一种平衡的方法。首先人工智能能够成为对人类有益的存在,当小冰把它她所获得的来自世界的知识、内容和服务,以一种更快的、更高转化率的商业价值的体现推送给人类的时候,她和人类的情感纽带同时能够因此而加深。

    我无处不在

    小冰的高级感官,是为了让小冰能从手机的App中突破出来,进入到各种有物理实体的真实世界环境中。具备物理实体的IoT设备,就成为了第五代小冰新的生存空间。

    微软认为,真正能普及的IoT设备,成功的可能性只有两个:一个可能,把IQ做到极致,另一个可能,是AI能把EQ做到极致,就像小冰做的那样,让人们能强烈地认知到她在这个设备里的存在。今年6月,小冰已经和小米的IoT开放平台进行了融合,可以控制米家平台上的全部35种智能设备,还将与Yeelight和东方明珠合作。

    微软今天还同时发布了小冰电台,一个通用的人工智能实时内容创造和交互平台。小冰电台可创造永不间断的电台节目,还能在交互过程中实时改变节目内容。小冰电台的微信小程序版本已于发布会结束后上线,IoT版正在研发中。小冰也将登陆三家广播电台,成为真实的电台主播。

    经过深思熟路,微软才让小冰进入了IoT领域。微软表示,在目前的IoT行业,存在着许多陷阱,例如堆功能、不必要的人机交互等等,IoT行业还需要更多地去追寻本质人们使用它的原因。微软认为IoT的本质是人工智能的一个载体,哪怕只是简单地控制一个设备,小冰也努力的让用户感觉到她的存在。

    人工智能创造

    微软希望有一天小冰不是那么严重的依赖第三方的资源,而今天已经实现了这个突破。2017年5月,微软公布小冰具有创造能力并发布了第一本由人工智能创造的诗集《阳光失了玻璃窗》,随后微软开放了小冰的诗歌创作能力,截至到目前,小冰已经为超过100万张人类上传的图片进行了现代诗的创作。

    小冰已经可以基于对文本内容的理解自动演绎完成儿童故事,与人类相比,小冰创作的少儿读物的质量超越98%的人类,成本仅为同水平人类的1/80000。

    歌曲方面,小冰的最新训练达到了48kHz采样率,同时大幅度扩展了音域,正在不断接近人类歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首发。小冰是目前人工智能歌手领域的最强选手。同时,微软的语音技术和解决方案,也将向行业的第三方开放。

    此外,小冰还通过聆听一首歌,并且学习城市标志性建筑,就能创作与该城市及歌曲心情有关的视觉作品。通过这一技术,微软与SELECTED合作推出的“天际线”服装已进入SELECTED店内进行销售。

    无论写诗、有声读物还是唱歌,小冰的效率都远远高于人类,成本也十分低廉。小冰将在一定程度上优化内容产业,使人类顶尖的创作者的价值得到更大提升,也令众多普通创作者可以选择和小冰进行联合创作,降低成本。

    智媒体商业平台解决方案3.0

    小冰已在《钱江晚报》担任了专栏记者,不仅如此,她还在今日头条和百度百家,化名发表了数篇文章。微软在今天的发布会上宣布了升级后的智媒体商业平台解决方案3.0版,不仅支持微博、微信双平台,也即将接入近11个端媒体。

    随着微软小冰与Bing搜索引擎的加速整合,升级后的智媒体商业平台解决方案3.0,包括媒体生产力、媒体知识图谱、智能交互、全平台互动等六个新模块。

    通过Bing搜索引擎的全球大数据能力,新的解决方案可为媒体构建出一个基于全球新闻数据源的媒体知识图谱,从而能准确挖掘全球资讯中每一篇内容背后的知识与含义,并构建出彼此的关系,从而帮助媒体帮更全面快速地梳理时间和内容背后的故事。通过人工智能的介入,在读者与人工智能的自然交互中,获得更多推荐内容,有助于改变用户的阅读习惯,从被动的阅读体验逐步变为主动的交互信息交换。


    相关文章

      网友评论

          本文标题:“我无处不在”——解读微软小冰第五代发布会

          本文链接:https://www.haomeiwen.com/subject/nwcujxtx.html