为了学习机器学习就想复习一下统计学的知识
吴老爷子的这本书很薄,基于R语言的,100多页,3-4天就看完了,前面的基础讲的还可以,用了大量的图和案例来讲解一些概念,我终于知道了什么是分布 (distribute), 代码没怎么看,就画了一个直方图就再也没有写过代码。每个概念都有对应的英文,如 error 表示误差等等,方便你以后阅读英文书籍。
前面基本属于扫盲帮助回忆一下高中学习过的知识,看到最后的参数估计和假设检验就有点蒙了,讲的不是很清晰,直接跳过了。
其实传统统计学和现在的机器学习方法还是有很大差别的,传统统计学一般都是先搞模型,研究各种分布的规律等等,要求数据源必须独立同分布等等。而现在机器学习一般都是从大数据中发现模型,是先有数据才有模型。 所以学习机器学习并不要求有很高的统计学知识,高中学的统计学足够,遇到不懂的再查资料就行了。
对于机器学习应用工程师来说,原理大体了解,概念大体清晰,知道怎么训练数据、得出模型、应用到产品中就行了。至于各种算法实现、算法细节交给科学家和算法工程师去研究就行了。要对自己有一个较好的定位。
一本好的书能够更快的帮助我们入门,一本糟糕的数可能会打击我们的信心,阻止我们进一步的学习,我写了一个爬虫,爬取了豆瓣评分和评论较好的一些机器学习、深度学习等方面的书籍,简单整理了一下,有需要的同学可以参考一下下面的链接
网友评论