继10年前乔布斯带领苹果重新定义手机之后,加以AI芯片的诞生,令人工智能手机有了跨越式的进步,人们通过它能够体验到更丰富的功能。智能手机就像个人电脑一样,具有独立的操作系统,可以由用户自行安装软件、游戏等第三方服务商提供的程序,通过此类程序来不断对手机的功能进行扩充,并可以通过移动通讯网络来实现无线网络(Wi-Fi)接入的这样一类手机的总称”。智能手机横空出世,空前的跨越年龄、性别、种族、地域、国家等多个大维度,这个高科技的“大玩具”成为人们生活和工作的必需品。
人们基本上任何场景和时间下都离不开手机,手机市场也随着人们需求的增加而繁荣。越来越多的智能手机厂商加入到了“AI”大军之中,他们的宣传内容基本是给用户灌输一个思想:由于我们的手机加入了AI,所以能力会更加强悍。这其中宣传看多了之后我们容易形成一个观点:AI的作用,就是增强。
一个不算太恰当的比喻,手机不再只是一个机械的工具,而是一个开始有自己思想的仆人。
各大手机厂商产品研发运用了哪些创新性人工智能技术:
当人工智能入驻手机后,AI科技给手机带来的智能化功能变革:
01 手机智能助理
以语音助手的形式出现的自然语言处理,从最早苹果的Siri,微软的Cortana和小冰,这些都是最早出现在手机上的AI智能语音助手。AI语音助手对于我们使用体验的提升是显而易见的,更智能的Siri,Bixby等语音助手,对于我们的帮助都是看得见的,而且通过反复教语音助手还可以让手机按照你的意愿回答问题。
三星的 Bixby 语音助手功能则更是 AI 对 App 整合的一个典型代表。比如语言逻辑很复杂的「用第一张照片发朋友圈并说开会了」,Bixby 能快速识别,并按照这句话的内容配上图库第一张照片,发朋友圈状态「开会了」。
在这一系列动作中,三星 Bixby 调动了图库里的照片,又打开了微信朋友圈,这是一个很典型的多应用联动场景。而在三星的介绍中,Bixby 用户经过自定义设置,早上起床时,遇到需要手机提高亮度、打开音乐、关闭勿扰模式等一系列复杂操作的情况下,仅需一句特殊指令就可以完成所有操作。
通过语音控制手机,有可能是一个媲美iPhone触屏控制手机的杀手级交互应用,这意味着开创出新一代计算中心的可能。谁能将这一块用户体验做好,一方面将大大降低使用门槛,另一方面将极高提高用户效率和用户体验,其成就或许不亚于乔布斯在苹果公司的创新。
02 相机特效
·人脸识别:被提到最多的就是手机的摄像头方面,利用先进的机器学习识别用户样貌的变化,即使用户戴着帽子,留起胡须,或者佩戴眼镜,用户也一样可以使用面部识别功能。人工智能就会自动识别场景,然后将相机自动调节到最合适的参数上。
以荣耀 V10 为例,它的 AI 拍照能力可以自动识别出 13 种场景,系统会匹配专业摄影师拍摄这种场景时的参数,从而帮助用户拍出更出色的照片。用户在使用这项功能的时候,并不会明显感知到,但在无形中,普通用户与专业人士的差距得到了一定程度上的减小。
举个例子,如今的智能手机将面部识别作为 AI 功能的展示方式。而早在 Android 4.X 时代,Google 就在系统中加入了人脸识别。
但实际上,且不论两种识别方式的云泥之别,在逻辑上,两者就有根本不同。Android 4.X 时代的「人脸识别」过程中,用户的脸只是一把用来开锁的钥匙,稍有异样便不能被识别;如今 AI 时代的人脸识别则是,手机通过学习记住了用户的面部特征,然后手机自动为用户打开。
· 场景优化:通过视觉信息的采集,运用人工智能对图形图像做精准地比对分析,让机器进行深度学习、理解和思考,从而以立体显示方式,在手机上创造出更完美、更真实的图像信息。(局部效果增强、局部小草变的更绿)
AI进行拍照风格化和人像深度处理,已经并不新鲜。接下来用AI进行图像增强,处理光影拍摄和动态捕捉会成为新的亮点。
就好比:使用图像语义分割与分区调效的AI技术,使得蓝天更通透,绿草更郁郁葱葱,画面层次更加分明,随手拍出大师级作品;AI智能检测,多人合影亦能精准虚化,智能构图提醒帮你拍住大家都称赞的合影;图像识别的智慧美颜,人景分离带来唯美虚化分区调优令细节更清晰,肤白貌美,拍出自然精致;AI智能补光,让肤色保持一致,给你专属打光师的极致效果。
02 照片分类
人脸识别带来的新功能,是“人物”相册。苹果会自动按照照片中的不同人物,分成不同相册,用户还可以为每个相册添加名字,便于查找。
而对物体和场景的识别,带来的是“强大的搜索”。比如说一张有山有水有人有马的照片,以后就可以根据其中的场景(山、河)和物体(人、马)搜索出来。
这三者结合起来,就有了新“照片”应用中的“回忆”功能。苹果会根据照片的拍摄时间地点、其中的人、物体和场景,将它们以“回忆”的形式组织起来,还附赠苹果帮你配了背景音乐的视频,比如说某次全家出门旅行的照片,就会被自动放在同一个“回忆”中。
AI手机特殊功能背后的技术:
01 人脸识别
人脸识别系统主要包括四个组成部分,分别为:人脸图像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别。
而人脸识别需要积累采集大量人脸图像相关的数据,用来验证算法,不断提高识别准确性,这些数据诸如A Neural Network Face Recognition Assignment(神经网络人脸识别数据)
龙猫数据,为诸多手机厂商采集标注了大量的人脸数据,包括人脸轮廓,五官位置,和人脸关键点等 特征提取,数据准确率在行业内首屈一指!
强大的人脸识别功能通过Face ID 打开您的手机,再也不用担心指纹解锁出现的指纹不清晰时反复按键最后不得不只能输入密码的尴尬情况, 同时也不需要担心Face ID 支付失败或者被盗取,等危急情况发生。
02 NLP自然语言处理
自然语言处理(NLP)是人工智能和语言学的一部分,它致力于使用计算机理解人类语言中的句子或词语。NLP 以降低用户工作量并满足使用自然语言进行人机交互的愿望为目的。因为用户可能不熟悉机器语言,所以 NLP 就能帮助这样的用户使用自然语言和机器交流。
NLP应用于各种领域:
拼写检查
关键字搜索
查找同义词
从网站提取信息,例如:产品价格,日期,地点,人员或公司名称
机器翻译
口语对话系统、
复杂的问答系统
作为人工智能的一个分支,深度学习及大量的数据训练仍是决定NLP的主要因素:
一条基础语料最终将被处理为所归属领域、目的意图、和基础分词,然后将其输入至NLP算法,基于大量的数据训练,最终贡献于各个应用场景。
03 语音识别
语音识别,语音转文本,简称ASR(Automatic Speech Recognition)。应用ASR技术的常见产品包括语音输入法、语音录音工具等,帮助用户快速将语音信息记录为文本。
龙猫数据了解到的中文语音识别产品主要有:搜狗输入法、讯飞输入法、Apple Siri、Google Now(被墙了)和出门问问,微软小冰等,然后还有各种智能音响,吃瓜群众肯定都想知道他们是怎能实现的,其实最重要的两个步骤就是训练和识别:
训练(Training):预先分析出语音特征参数,制作语音模板,并存放在语音参数库中。
识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数。将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别结果。
那么你一定很好奇,训练什么数据,训练的数据是怎么来的。龙猫数据在ASR 数据标注上下足了功夫,为各行业的客户采集了大量的音频数据,包括小孩哭声,车内场景下的对话,家庭场景下的对话 等,并可以对语音进行分类,语音的文本转写、校对、发音人的角色,噪音,语音内容进行标注等。
04 图像识别
图像语义分割可以说是图像理解的基石性技术,在自动驾驶系统(具体为街景识别与理解)、无人机应用(着陆点判断)以及穿戴式设备应用中举足轻重。我们都知道,图像是由许多像素(Pixel)组成,而「语义分割」顾名思义就是将像素按照图像中表达语义含义的不同进行分组(Grouping)/分割(Segmentation)。
语义分割需要的图形样本数据应该是机器学习中比较复杂的一种,也是非常难标注的一种,因为图片中的物体多重多样,场景尤其复杂,龙猫数据针对 语义分割类型的数据处理,特意投入大量研发人员,开发了魔法笔 ,多边形标注 和超像素分割等标注工具,大大提供了标注效率和数据的准确性!
AI手机智能的程度取决于数据质量和效率:
2018年人工智能生态逐渐成熟,而智能手机就是一个重要的“边界”,AI手机的体验也会产生天差地别的变化,最终全能竞赛已然上演,同时第一梯队的AI手机也会和后来者拉开越来越大的距离。
网友评论