美文网首页
1.矩阵求导

1.矩阵求导

作者: origin42 | 来源:发表于2017-12-28 13:43 被阅读0次

本节是自动求导框架技术的第一节,本系列其余文章包括


自动求导框架综述

2. 链式法则与计算图

3. 控制流与其实现思路

4. 自动求导框架的架构

5. 使用自动求导框架实现RNN


    本节内容主要介绍矩阵求导的相关知识主要参考了知乎的矩阵求导术这系列文章。由于自动求导框架是建立在张量(tensor)运算上的,张量在这里理解为一种多维的矩阵,因此矩阵求导的概念是自动求导框架的基础。

1. 概念

    矩阵求导是针对于参数是矩阵的函数,比如函数

其中X,Y,Z都是矩阵。矩阵求导可以看做是单一变量求导的推广,以上面的函数为例, Z 对 X 求导就是 Z 矩阵中的每个元素对 X 矩阵中的每个元素求导,然后做一下简单的合并。假设矩阵 Z 是一个尺寸为 a×b 的矩阵,矩阵 X 是一个 c×d 的矩阵,矩阵 Z 对矩阵 X 的导数矩阵 G_zx 的求解分成了两步:1.求导  2.合并。在求导的时候矩阵G_zx是一个尺寸为 (ab) × (cd) 的二维矩阵,其中第 i 行中的第 j 个元素表示 Z 矩阵中的 i 号元素对 X 矩阵的 j 号元素进行求导,这样就把矩阵求导转化为了单个变量的求导过程:

G_zx在求导步骤时的形态

观察上图中的 G_zx 矩阵,可知对于每一列而言实际上是 Z 矩阵中每个元素对于 X 矩阵的某个元素的导数,则 Z 矩阵整体对于 X 矩阵中某个元素的导数即是把 G_zx 在求导步骤的结果按行相加,得到 尺寸为1 × (cd) 的矩阵,表示 Z 矩阵整体对于 X 矩阵中的 cd 个元素分别求导的结果,这就是合并步骤需要做的事情:

G_zx在合并步骤时的形态

    上面介绍了矩阵之间的求导方法,这个方法可以较为容易的推广到多维矩阵——张量上。

2. 例子

    下面采用矩阵乘法作为例子,回顾一下上述过程。这时候 X 矩阵是一个 2×2 的矩阵,Y 是一个 2×2 的矩阵,Z是一个 2×2 的矩阵,f 函数表示 X 矩阵和 Y 矩阵乘法。通过上述过程我们可以得到以下结果:

矩阵乘法求导结果

相关文章

  • 矩阵的导数运算

    1.矩阵对标量求导 相当于每个元素求导 2.矩阵对列向量求导 3.矩阵对矩阵求导 4.标量对列向量求导 5.标量对...

  • 1.矩阵求导

    本节是自动求导框架技术的第一节,本系列其余文章包括 自动求导框架综述 2. 链式法则与计算图 3. 控制流与其实现...

  • 向量,矩阵,张量求导法则

    向量,矩阵,张量求导向量对向量求导向量对矩阵求导矩阵对矩阵求导使用链式法则总结 向量,矩阵,张量求导 参考:htt...

  • 矩阵求导

    深度学习-矩阵求导的坑闲话矩阵求导

  • 矩阵

    几个常用矩阵求导 矩阵求导矩阵求逆矩阵和行列式特征方程和特征根

  • 数学基础

    奇异值分解矩阵求导_知乎1矩阵求导_知乎2

  • 矩阵向量求导

    本文整理自李建平机器学习中的矩阵向量求导系列和长躯鬼侠的矩阵求导术。 1. 符号说明 默认符号: :标量 : ...

  • 矩阵求导与最小二乘法

    一、矩阵求导 矩阵求导就是对内部每一项求导 , 矩阵的迹有如下性质: 因而可推出如下性质:设 ,相当于分别对和取偏...

  • 数学基础-备忘录

    1.矩阵、向量求导 其实并不是很懂的一个结论:

  • 5. 使用自动求导框架实现RNN

    本节是自动求导框架技术的最后一节,本系列其余文章包括 自动求导框架综述 1. 矩阵求导 2. 链式法则与计算图 3...

网友评论

      本文标题:1.矩阵求导

      本文链接:https://www.haomeiwen.com/subject/dmmmgxtx.html