语音识别的相关技术,之前已经写过一篇文章,传送门: https://www.jianshu.com/writer#/notebooks/2984481/notes/20590867
今天想聊的,是关于语音搜索的一些个人感受。有可能全错,欢迎讨论。
文字是编码,语音是解码
不知道你有没有发现,文字搜索与语音搜索,用户在使用习惯上是有很大区别的。
文字是思想的编码,用户在互联网漫长的教育中,已经知道了如何将文字精练成【关键字】进行搜索。
一句长长的话,缩减成两三个字的关键词,就是编码,是去掉冗余、压缩信息的过程。这种方式并不天然,是经过后天的训练习得的。
而语音搜索,恰恰相反,是解码的过程。
语言是思想的表述,我们习惯了边说边想,为了让别人理解你,我们的口语是重复的,冗余的,有“嗯啊”之类的口头禅,这帮助我们有多余的时间,整理思绪,帮助对方有多余的时间,消化理解。
所以使用语音搜索,我更习惯说的句子是“额,帮我查一下那个,xxx是什么”,“额帮我找一下,就是xxx大厦在哪个地方”。
这是纯天然的,未经压缩的,口语化的信息。如果是文字搜索,我肯定不会输入这么多,我会直接打关键词,然后在搜索结果里翻看哪些是我想要的。毕竟打字很累。
而语音搜索,如果只说关键词,会让我觉得我没有讲出一句完整的话,这有悖于我平常说话的方式,所以我会选择多说,让一句话能够完整表达我的意图。
所以,语音搜索,要能自动识别关键词,不能说什么搜什么,这样搜索结果一定不好。
语言有套路
语言是思想的表达,每个人的思想都不一样,但是语言有套路,利用套路,就可以降低用户的使用门槛。
深谙此套路的,是Siri。-- 你可以这样问我:
Siri“你可以这样问我”,其实是降低用户使用门槛的方式。给定一个框架,给出提问的范围和模式,用户就知道如何模仿和使用,这就是语言的套路。
语言有套路,套路中的关键是疑问词,比如:
谁?
什么?
多少?
哪里?
什么时候?
怎么?
怎样?
如何?
什么样?
为什么?
找到用户使用频率最高的词语,缩减成简短的语句,划定范围,作为语音搜索的关键句,提示给用户。
换句话说,展现你的优势。没有边界,容易变智障,有了边界和范围,就是智能。
这只是一种方式,一定还有其他更好的方式,值得探索。但是目标明确了,就是在现有的语音搜索技术能力范围之内,以更好的方式,更低的使用门槛,让用户感受更智能化的搜索技术。
以上。
想转ai pm,求推荐~
网友评论