美文网首页
位置编码

位置编码

作者: SimonLiu000 | 来源:发表于2021-08-31 19:55 被阅读0次

    Transformer: 不可学习位置编码

    可以看出不同的column(j)之间,周期不一样

    不同的row(i)之间,值不一样

    且相邻的column之间,相位不一样

    \mathbf{P} \in \mathbb{R}^{n \times d}: p_{i, 2 j}=\sin \left(\frac{i}{10000^{2 j / d}}\right), \quad p_{i, 2 j+1}=\cos \left(\frac{i}{10000^{2 j / d}}\right)

    特点:

    相邻一定距离的位置,可以通过线性变换得到

    \omega_{j}=1 / 10000^{2 j / d}

    \left[\begin{array}{cc}\cos \left(\delta \omega_{j}\right) & \sin \left(\delta \omega_{j}\right) \\-\sin \left(\delta \omega_{j}\right) & \cos \left(\delta \omega_{j}\right)\end{array}\right]\left[\begin{array}{c}p_{i, 2 j} \\p_{i, 2 j+1}\end{array}\right]=\left[\begin{array}{c}p_{i+\delta, 2 j} \\p_{i+\delta, 2 j+1}\end{array}\right]

    BERT:可学习位置编码

    直接设定为可学习的与序列等长的向量即可,可以用随机初始化

    相关文章

      网友评论

          本文标题:位置编码

          本文链接:https://www.haomeiwen.com/subject/lfzziltx.html