美文网首页模型压缩
模型压缩(三):量化

模型压缩(三):量化

作者: 夕一啊 | 来源:发表于2020-04-29 21:55 被阅读0次
    1. 用更少的bit来存参数,(例如32个bit改成16个bit)

    2. 把参数分群,用更少的bit来代表参数

    3. 通过霍夫曼编码,把出现频率高的值用更少的bit来表示


    只用正一负一两个值来表示网络。
    存一组真实值的参数,还有二值化参数。
    随机初始化一组参数,通过最近的二值化参数计算梯度方向,根据方向优化真实参数,再找最接近的。知道最后一次找到真实参数最近的二值化参数。


    在论文中结果很好,有的数据集比真实参数错误率还低。
    有点像正则化。


    相关文章

      网友评论

        本文标题:模型压缩(三):量化

        本文链接:https://www.haomeiwen.com/subject/rdjowhtx.html