机器学习,可谓是当今的热词,向往算法工程师高薪和逼格的学生,老师,程序员在学习机器学习知识转职,在互联网等信息产业工作的各类职工由于工作需要也在关注和学习机器学习相关知识,以辅助自己更好的工作和避免被淘汰。
在介绍书单前,先简单介绍下如何创造学习环境避免从入门到放弃,以及mapping学习路线。
1. 创造好的学习环境
古语云,近朱者赤近墨者黑,塑造“学习机器学习”的环境是成功的保证。太多学习者打算学习一门技能都是3分钟热度,往往是从入门到放弃,然后怪罪自己的自制力:这种想法高估了人类的自制力,低估了环境的力量。那么如何创造好的学习环境呢?拿玩游戏做比方,我们玩得时间很长的游戏,或者被称为产生黏性的游戏,我们往往会树立目标(打败敌人,升级),查询资料(qq/微信群,论坛),交流沟通(线上/线下圈子)。
机器学习也是一种game,也需要树立目标(知识点,解决/评价问题),查询资料(网络、书籍),交流沟通(线上/线下圈子)。
以笔者为例,从事互联网产品经理职业3.5年,有众多圈内做机器学习,学习机器学习的朋友和伙伴,最近3个月买了50本书籍(20本机器学习相关,30本其他专业或鸡汤书),一台顺手的笔电。
可以看出笔者资源并不优秀,但是也打造了自己的机器学习环境(偷笑)。下文会重点介绍笔者使用的书籍。
2. 学习路线
以下摘录自《机器学习实战——基于scikit-learn和tensorflow》:
2.1 机器学习是什么?它要解决什么问题?机器学习系统中,主要的分类和基础概念有哪些?
2.2 一个典型的机器学习项目由哪些步骤构成?
2.3 拟合数据进行学习
2.4 优化成本函数(也称为损失函数,cost function)
tips:机器学习是有数据理论和编程方法支撑,两个体系中有大量概念,英文较好的学者在学习中最好记住英文概念,因为有些英文概念的中文翻译会导致误读有碍学习。
2.5 处理、清洗和准备数据
2.6 特征选择和特征工程
tips:做一个机器学习项目拿炒菜类比,准备数据,特征选择和特征工程是准备食材,吃素菜还是肉菜;下文中选择模型则是选择炒菜的方式,炒菜还是炖菜。
2.7 选择模型,并用交叉验证来调整超参数
2.8 机器学习的主要挑战是拟合不足和过度拟合。(偏差/方差权衡)
tips:这时候已经用了不同的食材,不同的炒菜方式,炒了好几道菜,评价这些菜用偏差和方差两个指数。为什么要用两个指数呢?因为提高偏差往往要牺牲方差,提升方差要牺牲偏差,所以这里要有个权衡,而权衡的方式没有死标准。权衡后,便确定了食材和炒菜方式,你就可以炒这道菜来去给丈母娘(婆婆)品尝了(你的最大努力了)。
2.9 降低训练数据的维度以对抗维度灾难
tips:做这道菜要用月亮上的玉兔做食材,30万一斤,恐怕你父母,配偶,配偶家长都不同意,还不如买车呢,吃一道菜不值当。即用合理的计算资源(性价比)去设计机器学习系统。
总结:上面引用的内容,可能对小白学者不太友好,其实没必要畏难,有了笔者以下推荐的书籍,帮助你去mapping你的学习路线,将知识拆解为一个个单元知识,学起来难度就会很小,有些知识需要很深的数据验算,你要相信大部分从业者也不会做,你和他们一样记住结论即可。但是为了方便以后对知识的灵活应用,还是一点一滴学稳比较好,因为拆解后的知识较为简单,建立知识间的联系则需要重复练习,慢慢你就会成为大厨。
3. 推荐书籍
以下都是必买的入门书,相当于少林藏金阁中正规武林秘籍(炒菜大全),买不了吃亏,学不了上当:
3.1 统计学习方法 李航著:这是鸠摩智的小无相功,是机器学习算法的数学基础,推导优美,不懂的地方网上可以搜到,国内机器学习者以极大的热情注解了本书讲的不够详细的地方,可以看出本书的欢迎度。但是缺点也很明显,小无相功是法,不是器,虽然各类功能都能模仿打出,但是由于不包含机器学习系统工程,打多了容易筋脉错乱,这就需要下面这本书。
算法的数学理论基础(涉及统计学,信息学,微积分)
3.2 机器学习实战——基于scikit-learn和tensorflow geron(歪果仁)著:作者是编程届骨灰级玩家,有大量实战,和工程经验,完全有资格coach你做一道菜,相当于黄药师,教你严谨的知识结构,也秀了很多实用技巧,非常之嘚瑟。缺点是基础不牢时,会被他的神展开吓到,药性刚猛,需要其他药剂调和下,不然会被秀飞到弃学。
有丰富的代码,可以照敲。
3.3 机器学习实战 Peter Harrington 著:这位歪果仁就比较老实,不太爱展开知识;缺点也是优点,视角单纯就事论事。是一剂调和药,必买,必买,切记。相当于武林中的华佗,疗伤用(机器学习真吉尔简单,哈哈哈,大误,,,)。
有丰富的代码,可以照敲。
3.4 机器学习 周志华著:这是国内另一个学术大神,可以说天赋异禀,大学老师出身,机器学习届的迈克尔乔丹,他的推导你能理解,但是你模仿不来,各种操作秀得你头皮发麻。宗师级人物教学,必看,有些知识写得详细真挚,有些知识写得囫囵吞枣,也许要天才眼里,有些环节就是一步到位的。还是买了吧,这是本毁誉参半的教材,如果不买相当于你打篮球而不知道迈克尔乔丹,科比,哈登,库里,榜样的力量的强大的,榜样的技巧也是可以学习的。
数学知识,推导相当秀,独秀,陈(周)独秀。(下面是这本书的调剂药)
3.5 深度学习入门——基于python的理论和实现 斋藤康毅著。作者日本人,有着日本学者或工程人员严谨的精神。(现代科学是建立在西方科学体系上的,日本人则发扬鲁迅的拿来主义,把西方科学体系在日本这个国土上重新种植了一遍。)可读性最好的著作,中国人学习深度学习入门的不二之选,写得极为细腻简洁,还符合东方思维,并不拘泥于西方科学形式主义。必买,必看。
有少量数学知识,适量的代码,主要讲的理解,思路非常适合东方人学习。
转载请注明出处。
网友评论