嘿, Siri:语音处理
以 Siri 为例分享了语音处理的一些技术进展。其要点如下:
- 语音处理可以分为语音识别和语音合成两类任务;
- 语音合成过程包括文本分析、音韵生成、单元选择、波形串联等步骤;
- 语音识别过程包括预处理、特征提取、声学模型,语言模型和字典解码等步骤;
- 深度学习和迁移学习等技术都已经被应用在语音处理之中。
语音处理的最终目的不是简单地分析或者合成声音,而是为了更好地和人交互,从而以更简捷的方式解决问题。从交互的角度来看,你认为目前的语音助手还存在着哪些不足呢?
image心有灵犀一点通:对话系统
结合 Facebook 公司公开的资料,和分享了对话系统的发展历程与一些最新进展。其要点如下:
- 早期的对话系统通过模式匹配和智能短语搜索对人类的合适回复;
- 智能个人助理可以帮助用户在多个垂直领域完成任务;
- 社交聊天机器人的作用是满足用户的情感需求;
- 神经网络能够帮助社交聊天机器人实现通用化的学习。
社交聊天机器人的发展也带来了关于道德规范的问题,一些机器人从社交网络上学到的想法需要引起注意与警惕。结合人工智能在无人武器中的规模化应用,对人工智能进行法律约束似乎已经迫在眉睫。那么应该如何看待与应对人工智能带来的伦理问题呢?
image数字巴别塔:机器翻译
结合谷歌公开发表的论文,和分享了机器翻译的发展历程与一些最新进展。其要点如下:
- 早期的机器翻译采用的是逐字对应的方法;
- 语言学的进展使机器翻译转而依赖句法规则;
- 谷歌将神经网络引入机器翻译之中,利用大量数据提升翻译精确性;
- 神经网络可以通过迁移学习“桥接”不同的语言,实现零知识翻译。
在另一个角度上,机器翻译的进展对语言本身的发展也存在着反作用。语言并不是自然出现的,而是人类社会的产物,其发展也势必会受到人类文化的影响。那么人工智能的发展到底会对人类自身产生何种反作用呢?
这是人工智能的终极问题。
image左右互搏:生成式对抗网络
生成式对抗网络的原理与机制。其要点如下:
- 生成式对抗网络是一类运行在零和博弈框架下的无监督学习算法,由生成器和判别器构成;
- 生成器的目的是精确模拟真实数据的分布,判别器的目的是精确区分真实数据和生成数据;
- 生成式对抗网络的主要优点是超越了传统神经网络分类和特征提取的功能,能够按照真实数据的特点生成新的数据;
- 生成式对抗网络的主要问题是理论基础的缺失。
生成式对抗网络的一个重要的潜在应用就是让人工智能在没有明确指导的情况下学习,使算法的学习方式向人类的学习方式转变。那么如何看待生成式对抗网络在通用人工智能研究中的前景呢?
image总结自:人工智能基础课: https://time.geekbang.org/column/62
简宝玉写作群日更打卡第 40 天
网友评论