BasicDecoder类和dynamic_decode decoder文件中定义了Decoder抽象类和dyna...[作者空间]
隐马尔可夫模型的“隐”体现在最终需要知晓的目标状态之间的状态转换概率是无法直接知道的,即被“隐藏”的。而且目标状态...[作者空间]
从图像中提取CNN特征,VGG模型是首选算法 。VGG是牛津大学Visual Geometry Group(视觉几...[作者空间]
一个很酷的tensorflow教程:TensorFlow令人困惑的部件(1)更多关于图的检查TensorFlow令...[作者空间]
Speech Processing for Machine Learning: Filter banks, Mel...[作者空间]
Sequence Modeling With CTC——Awni Hannun (2017.11) 在语音识别中,...[作者空间]
上一篇:transformer再记(编码器)解码器与编码器在细节上有差异。 编码器与解码器的连接:编码器通过处理输...[作者空间]
首先注意力模型可以宏观上理解为一个查询(query)到一系列(键key-值value)对的映射。将Source(源...[作者空间]
Attention Is All You Need(2017.6)本文从微观角度(张量角度)讨论transform...[作者空间]
机器翻译模型的编码器是先读取整个句子后传递到解码器中翻译,对于过长句子序列(例如超过30个词的句子)的记忆能力弱,...[作者空间]
seq2seq顾名思义就是模型的输入和输出均是序列(sequence),机器翻译模型是seq2seq的一典型例子。...[作者空间]
语言模型用来估计句子的可能性(sentence) 语料库(corpus)指的是很大的某种语言(例如英语)句子组成的...[作者空间]
softmax常用来进行多分类,假如有一个4x1向量=[5,2,-1,3],softmax的计算过程如下所示 下式...[作者空间]
句子的常用表示方法有:独热编码(One-Hot)和词嵌入。独热编码存在的问题有:1、词矩阵稀疏,每个向量只有一个值...[作者空间]
不同于GRU的两个门,LSTM有三个门。两者的出现时间LSTM更靠前,GRU可以看做在LSTM基础上的简化版,它更...[作者空间]
是上一时间步的状态,是这一时间步状态,(这三个参数在吴恩达视频中又叫memory cell,取首字母),是此时间步...[作者空间]
首先channel(信道)为1的1x1卷积过滤器就相当于给输入矩阵乘以一个常数。 其次channel不为1的过滤器...[作者空间]
多维池化在卷积神经网络中很常见。池化常用来缩减模型大小、提升计算速度,同时提高所提取特征的鲁棒性(Robust,意...[作者空间]
channel及通道,在某些文献中又叫深度。channel是立方体卷积的一个维度。例如图示输入图像有RGB...[作者空间]
归一化是对训练集数据的预处理操作之一。不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,...[作者空间]