美文网首页
Spurious Local Minima are Common

Spurious Local Minima are Common

作者: 馒头and花卷 | 来源:发表于2019-12-13 22:51 被阅读0次

[TOC]

Safran I, Shamir O. Spurious Local Minima are Common in Two-Layer ReLU Neural Networks[J]. arXiv: Learning, 2017.

@article{safran2017spurious,
title={Spurious Local Minima are Common in Two-Layer ReLU Neural Networks},
author={Safran, Itay and Shamir, Ohad},
journal={arXiv: Learning},
year={2017}}

文章的论证部分让人头疼,仅在这里介绍一下主要内容. 这篇文章关注的是单个隐层, 激活函数为ReLU的神经网络, 且对输入数据有特殊的限制, 数据为:
\sum_{i=1}^k [\mathbf{v}_i^T\mathbf{x}]_+,
其中\mathbf{v}_i是给定的, 而\mathbf{x} \sim \mathcal{N}(\mathbf{0}, \mathbf{I}). 而这篇文章考虑的是:

在这里插入图片描述
即, 这个损失函数是否具有局部最优解.

主要内容

定理1

在这里插入图片描述
注意, 是正交的, 且. 这个时候,损失函数是有局部最优解的, 不过在后面作者提到, 如果, 即overparameter的情况, 这个情况是大大优化的, 甚至出现没有局部最优解(不过是通过实验说明的).

推论1

在这里插入图片描述

引理1 引理2

这部分有些符号没有给出, 如果感兴趣回看论文, 这俩个引理是用来说明, 如何在实验中, 通过一些指标来判断是否收敛到某个极值点了(当然, 这需要特别的计算机制来避免舍入误差带来的影响, 作者似乎是通过Matlab里的一个包实现的).


在这里插入图片描述 在这里插入图片描述

相关文章

网友评论

      本文标题:Spurious Local Minima are Common

      本文链接:https://www.haomeiwen.com/subject/odiqnctx.html