TensorFlow2.0 tf.keras.layers.At

作者: 又双叒叕苟了一天 | 来源:发表于2021-01-24 14:31 被阅读0次

TensorFlow2.0 tf.keras.layers.At
小象学院深度学习之TensorFlow 2.0编程从入门到实践百
小象学院深度学习之TensorFlow 2.0编程从入门到实践
TensorFlow2.0教程-Keras 快速入门
TensorFlow2.0教程-keras 函数api
TensorFlow2.0教程-使用keras训练模型
tensorflow2.0手册
【完结】TensorFlow2.0 快速上手手册
【TensorFlow2.0】数据读取与使用方式
tensorflow2.0 Failed to get conv

详细的api说明可以参考我的另一篇文章 tf.keras.layers.Attention.

tf.keras.layers.Attention实现的是点乘注意力. 调用方式为:

import tensorflow as tf
import tensorflow.keras as keras
import tensorflow.keras.layers as layers

attention = layers.Attention(use_scale=False, dropout=0)
# [batch_sz, key_dims, dims] = [1, 4, 2]
enc_outputs = tf.constant([[1, 1], [2, 2], [3, 3], [4, 4]], dtype=tf.float32)  
# [batch_sz, value_dims, dims] = [1, 4]
value_mask = tf.constant([[True, True, True, True]], dtype=tf.bool)
# [batch_sz, query_dims, dims] = [1, 1, 2]
dec_outputs = tf.constant([[[1, 1]]], dtype=tf.float32)  

atten = attention([dec_outputs, enc_outputs, enc_outputs], [None, value_mask])
atten
>> <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[3.8448246, 3.8448246]], dtype=float32)>

这里attention([dec_outputs, enc_outputs, enc_outputs], [None, value_mask])包含两组参数:

[dec_outputs, enc_outputs, enc_outputs]: 分别是注意力的 [query, key, value], 其中 value 可以省略, 默认key=value, 即输入 [query, key].
[None, value_mask], 第一个参数为query mask, 第二个参数为value mask.

接下来自己计算一下是否和api调用结果相同:

# 注意力分数
score = tf.reduce_sum(enc_outputs * dec_outputs, 2)
score
>> <tf.Tensor: shape=(1, 4), dtype=float32, numpy=array([[2., 4., 6., 8.]], dtype=float32)>

# 注意力权值
weight = keras.activations.softmax(score, axis=1)
weight
>> <tf.Tensor: shape=(1, 4), dtype=float32, numpy=array([[0.00214401, 0.0158422 , 0.11705891, 0.8649548 ]], dtype=float32)>

# 加权注意力
att = tf.reduce_sum(tf.expand_dims(weight, 2) * enc_outputs, 1)
att
>> <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[3.8448246, 3.8448246]], dtype=float32)>

可以看到结果和调用api是一样的.

value maks

enc_outputs = tf.constant([[1, 1], [2, 2], [3, 3], [4, 4]], dtype=tf.float32)  # [1, 4, 2]
value_mask = tf.constant([[True, True, False, False]], dtype=tf.bool)
dec_outputs = tf.constant([[[1, 1]]], dtype=tf.float32)  # [1, 1, 2]

atten = attention([dec_outputs, enc_outputs, enc_outputs], [None, value_mask])
atten
>> <tf.Tensor: shape=(1, 1, 2), dtype=float32, numpy=array([[[1.880797, 1.880797]]], dtype=float32)>

这里加上了对value最后两个step的mask, value_mask = tf.constant([[True, True, False, False]], dtype=tf.bool)

score = tf.reduce_sum(enc_outputs* dec_outputs, 2) - 1.e9 * (1 - tf.cast(value_mask, dtype=tf.float32))
score
>> <tf.Tensor: shape=(1, 4), dtype=float32, numpy=array([[ 2.e+00,  4.e+00, -1.e+09, -1.e+09]], dtype=float32)>

weight = keras.activations.softmax(score, axis=1)
weight
>> <tf.Tensor: shape=(1, 4), dtype=float32, numpy=array([[0.11920292, 0.880797  , 0.        , 0.        ]], dtype=float32)>

att = tf.expand_dims(weight, 2) * enc_outputs
att = tf.reduce_sum(att, 1)
att
>> <tf.Tensor: shape=(1, 2), dtype=float32, numpy=array([[1.880797, 1.880797]], dtype=float32)>

可以看到结果也是和调用api一样的. 值得注意的是, tensorflow 对mask位置的处理方式是, 对需要mask的位置在计算softmax之前-1.e9.

网友评论

本文标题：TensorFlow2.0 tf.keras.layers.At

本文链接：https://www.haomeiwen.com/subject/tvjmzktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

TensorFlow2.0 tf.keras.layers.At

value maks

相关文章

TensorFlow2.0 tf.keras.layers.At

小象学院深度学习之TensorFlow 2.0编程从入门到实践百

小象学院深度学习之TensorFlow 2.0编程从入门到实践

TensorFlow2.0教程-Keras 快速入门

TensorFlow2.0教程-keras 函数api

TensorFlow2.0教程-使用keras训练模型

tensorflow2.0手册

【完结】TensorFlow2.0 快速上手手册

【TensorFlow2.0】数据读取与使用方式

tensorflow2.0 Failed to get conv

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读