1.1 为什么选择序列模型
x: Harry Potter and Hermione Granger invented a new spell.
y: 1 1 0 1 1 0 0 0 0
1.2 数学符号
1.3 循环神经网络Recurrent Neural Networks
1.4 通过时间的反向传播
1.5 不同类型的循环神经网络
many-to-many: 多对多,识别姓名(、机器翻译
1.6 语言模型和序列生成
language model and sequence processing
1.7 新序列采样
sampling a sequence from a trained RNN
1.8 带有神经网络的梯度消失
gradient clipping梯度修剪:观察你的梯度向量,如果它大于某个阈值,缩放梯度向量,保证它不会太大。
1.9 GRU单元Gate Recurrent Unit
1.10 长短期记忆(LSTM)
long short term memory
1.11 双向神经网络Bidirectional RNN
1.12 深层循环神经网络
2.1 词汇表征 Word representation
visualizing word embeddings 可视化词嵌入
2.2 使用词嵌入
2.3 词嵌入的特性
analogies using word vectors
cosine similarity
2.4 嵌入矩阵embedding matrix
2.5 学习词嵌入
2.6 Word2Vec
I want a glass of orange juice to go along with my cereal.
content c ("orange") —— target t ("juice")
6257 4834
分母部分的求和会很缓慢,解决方案是使用一个分级的softmax分类器(hierarchical softmax classifier)
2.7 负采样
2.8 GloVe词向量 global vectors for word representation
2.9 情绪分类 sentiment classification
2.10 词嵌入除偏
3.1 基础模型 basic models
3.2 选择最可能的句子
greedy search vs beam search
3.3 定向搜索 Beam search
3.4 改进定向搜索
3.5 定向搜索的误差分析
3.6 Bleu得分 bilingual evaluation understudy(s双语评估替补)
Bleu score on n-grams only
combined Bleu score:
3.7 注意力模型直观理解 attention model intuition
3.8 注意力模型 attention model
3.9 语音辨识 speech recognition
attention model for speech recognition
CTC(connectionist temporaral classification) cost for speech recognition