美文网首页
矩阵求导与最小二乘法

矩阵求导与最小二乘法

作者: 热爱生活的大川 | 来源:发表于2019-09-28 20:56 被阅读0次

一、矩阵求导

  1. 矩阵求导就是对内部每一项求导
    F \in R^{a*b}, X \in R^{m*n}
    \frac{\partial{F}}{\partial{X}} = \left[\frac{\partial{F}}{\partial{x_{ij}}}\right]_{m*n}\frac{\partial{F}}{\partial{x}} = \left[\frac{\partial{f_{ij}}}{\partial{x}}\right]_{a*b}

  2. 矩阵的迹有如下性质:

    • tr(AB)=tr(BA)
    • tr(A^T)=tr(A)

因而可推出如下性质:设x=(x_{ij})_{m*1}

  1. \frac{\partial{x^TA}}{\partial{x}} = A
  2. \frac{\partial{tr(AB)}}{\partial{A}} = B^T
  3. \frac{\partial{tr(ABA^TC)}}{\partial{A}} = C^TAB^T+CAB,相当于分别对AA^T取偏导后相加
  4. \frac{\partial{x^TAy}}{\partial{A}} = \frac{\partial{tr(x^TAy)}}{\partial{A}} = xy^T,分子为标量可看做矩阵的迹

二、最小二乘法

已知X \in R^{m*n}为参数矩阵,对应标签值为y \in R^{m*1}
引入参数\theta \in R^{n*1},构造\hat{y}=X\theta,令最小化目标函数为L=\frac{1}{2}(y-X\theta)^T(y-X\theta),可求出\theta=(X^TX)^{-1}X^Ty.
推导方法:
\begin{align} \frac{\partial{L}}{\partial\theta} & = \frac{\partial{tr((y-X\theta)^T(y-X\theta))}}{2\partial{\theta}} \\ & = \frac{\partial{tr(\theta^TX^TX\theta)}-\partial{tr(2\theta^TX^Ty)}}{2\partial{\theta}} \\ & = X^TX\theta - X^Ty \\ let & = 0 \\ \theta & =(X^TX)^{-1}X^Ty \end{align}

相关文章

  • 矩阵求导与最小二乘法

    一、矩阵求导 矩阵求导就是对内部每一项求导 , 矩阵的迹有如下性质: 因而可推出如下性质:设 ,相当于分别对和取偏...

  • 向量,矩阵,张量求导法则

    向量,矩阵,张量求导向量对向量求导向量对矩阵求导矩阵对矩阵求导使用链式法则总结 向量,矩阵,张量求导 参考:htt...

  • 矩阵求导

    深度学习-矩阵求导的坑闲话矩阵求导

  • 矩阵的导数运算

    1.矩阵对标量求导 相当于每个元素求导 2.矩阵对列向量求导 3.矩阵对矩阵求导 4.标量对列向量求导 5.标量对...

  • 矩阵

    几个常用矩阵求导 矩阵求导矩阵求逆矩阵和行列式特征方程和特征根

  • 数学基础

    奇异值分解矩阵求导_知乎1矩阵求导_知乎2

  • 最小二乘法及矩阵求导

    矩阵的迹定义如下 最小二乘法 最小二乘的概率解释 最小即可。这就解释了线性回归为什么要选用最小二乘作为衡量指标了。...

  • 矩阵求导

  • 矩阵求导

    多元函数导数 基本概念: 一阶导:梯度向量的概念 二阶导:Hessian矩阵 Hf 如果光滑性好,可以交换偏导的顺...

  • 矩阵求导

网友评论

      本文标题:矩阵求导与最小二乘法

      本文链接:https://www.haomeiwen.com/subject/xjitpctx.html