注意力模型的一个实例代码的实现与分析

注意力模型的一个实例代码的实现与分析

作者: 布口袋_天晴了 | 来源:发表于2018-06-17 22:39 被阅读149次

注意力模型的一个实例代码的实现与分析
NSProxy
[算法详解][归并排序]Merge sort
[算法详解][KMP]Knuth–Morris–Pratt字符串
[算法详解][快速排序]Quick Sort
[算法详解][插入排序]Insertion Sort
[算法详解][桶排序]Bucket Sort
[算法详解][快速选择] Quick Select
Trait的使用
iOS isKindOfClass& isMemberOfCla

上一篇文章：关于《注意力模型--Attention注意力机制》的学习是对注意力模型的理论知识进行学习，这一篇文章将结合，在github上找到的一份基于keras框架实现的可运行的注意模型代码：Attention_Network_With_Keras 进行分析，进一步理解Attention模型。

将jupyter的文件转换为.py文件，方便在Pycharm中运行调试，转换方法如下图：

文件转换操作方法

先解决一个问题：

因为Python环境不同，而导致的一个问题，运行程序时会在下图中报一个错：TypeError: softmax() got an unexpected keyword argument 'axis'

1，出问题的地方

2，具体的出错信息

跳转到我目前版本的tensorflow后端softmax()函数没有参数axis：

3，寻找问题的具体原因

4，寻找解决问题的方法

5，解决办法：将K.softmax() 换成 tf.nn.softmax()

问题解决完毕！！！！！

程序分析与理解：

1.获取模型的样子

想获取搭建模型的样子，先按照上图：文件转换操作方法。将文件转换成.py文件，然后在Pycharm中运行程序代码。再参考文章：《kears可视化模块keras.utils.visualize_util 的安装配置与错误解决办法》按照这篇文章处理后，添加语句：plot_model(model,to_file='AttentionModel.png',show_shapes=True)

打印模型图片的语句

模型图1：已获得 github上Attention_Network_With_Keras 搭建模型的样子

2.对模型的思路进行理解分析

以["six hours and fifty five am","06:55"]实例为例进行模型分析：

问题定义：

将人类语言描述的时间，记为X；将标准数字描述的时间，记为Y。即<X,Y>类型，符合Encoder-Decoder框架。 X=["six hours and fifty five am"]，Y=["06:55"] 任务：将X通过模型转换成Y

数据处理：

对数据进行处理。数据集中<X,Y>句对样例有1万个，数据集在Time Dataset.json文件中。X集合，可以由41个不同的字符构成，将这41个字符存为字典类型；Y集合，可以由11个不同的字符构成，将这11个字符存为字典。其实这两个字典数据就存在Time Vocabs.json文件中。

将X、Y数据处理成索引形式，每一个索引对应于一个one-hot向量。比如：

X="six hours and fifty five am" len(X)=27 ,模型中设置了X数据中的最大长度为41，索引len(X)=27<41，得进行索引填充(padding)。

X=['s','i','x',' ','h','o','u','r','s',' ','a','n','d',' ','f','i','f','t','y',' ','f','i','v','e',' ','a','m']

去字典human_vocab查询其索引值，并填充到41的长度，于是：

索引X=[31 22 36 0 21 27 33 30 31 0 14 26 17 0 19 22 19 32 37 0 19 22 34 18 0 14 25 40 40 40 40 40 40 40 40 40 40 40 40 40 40]

同理，Y="06:55"，len(Y)=5，Y数据集的长度都为5，所以不需要填充。

Y=['0','6',':','5,'5']

去字典machine_vocab查询其索引值，得到：

索引Y=[0 6 10 5 5]

然后再将X索引转换为Xoh(one-hot)形式，Xoh维度:(41x41)；将Y索引转换为Yoh(one-hot)形式，Yoh维度:(5x11)。如下图：

模型搭建：

1)通过get_model()函数获得搭建的模型

2)get_model()函数理解

3）attention_layer()获取注意力的实现

4）one_step_of_attention()每一步获取注意力的过程

5）模型训练

6）对各个网络层进行命名后的模型图片，两个下划线'__'后面的表示这个层在哪个函数中。

7）模型图片划分

相关文章

注意力模型的一个实例代码的实现与分析
上一篇文章：关于《注意力模型--Attention注意力机制》的学习是对注意力模型的理论知识进行学习，这一篇文章将...
NSProxy
objc与鸭子对象（上）分析"objc与鸭子对象"代码,该作者使用protocol实现一个模型的协议，使用NSPr...
[算法详解][归并排序]Merge sort
基本思想步骤实例分析伪代码代码实现JAVA 性能分析应用：常见面试题目【基本思想】利用归并的思想实现...
[算法详解][KMP]Knuth–Morris–Pratt字符串
基本思想步骤实例分析伪代码代码实现JAVA 性能分析应用：常见面试题目一个效率非常高的字符串匹配算法 ...
[算法详解][快速排序]Quick Sort
基本思想步骤实例分析伪代码代码实现JAVA 性能分析应用：常见面试题目【基本思想】 Divide an...
[算法详解][插入排序]Insertion Sort
基本思想步骤实例分析伪代码代码实现JAVA 性能分析应用：常见面试题目【基本思想】通过构建有序序列，...
[算法详解][桶排序]Bucket Sort
基本思想步骤实例分析伪代码代码实现JAVA 性能分析应用：常见面试题目【基本思想】将数组分到有限数量...
[算法详解][快速选择] Quick Select
基本思想步骤实例分析伪代码代码实现JAVA 性能分析应用：常见面试题目通常用来在未排序的数组中寻找第k...
Trait的使用
在PHP中代码只能单继承，为了实现类代码的复用因此实现了trait，trait类与普通class不同它自身无法实例...
iOS isKindOfClass& isMemberOfCla
首先看一段代码来我们看下输出结果原理分析看下isKindOfClass的类方法&实例方法实现 isMembe...

网友评论

本文标题：注意力模型的一个实例代码的实现与分析

本文链接：https://www.haomeiwen.com/subject/lkpbeftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

机器学习与数据挖掘

自然语言处理类

热点阅读

机器学习与数据挖掘

我爱编程

自然语言处理类

关于我们|服务条款|联系我们|注意力模型的一个实例代码的实现与分析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！