1 简介
李航老师的《统计学习方法》是机器学习领域的经典入门教材之一。
本书分为监督学习和无监督学习两篇,全面系统地介绍了统计学习的主要方法。包括感知机、k 近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM 算法、隐马尔可夫模型和条件随机场,以及聚类方法、奇异值分解、主成分分析、潜在语义分析、概率潜在语义分析、马尔科夫链蒙特卡罗法、潜在狄利克雷分配和 PageRank 算法等。本书通过第 1 章、第 12 章、第 13 章、第 22 章进行总结,其余每章都介绍一种统计学习方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。
2 自学指南
- 建议自学时长:35天
- 自学形式:以教材内容为主,学习与总结知识点;以课后习题为辅,尝试完成习题,巩固知识理论。
-
教程地址
《统计学习方法》(第二版)习题解答 -
学习安排:
Task01(3天):阅读第 1 章统计学习方法概论,总结知识点,完成习题 1.1、习题 1.2
Task02(3天):阅读第 2 章感知机,总结知识点,完成习题 2.1、习题 2.2
Task03(3天):阅读第 3 章 k 近邻法,总结知识点,完成习题 3.1、习题 3.2、习题 3.3
Task04(3天):阅读第 4 章朴素贝叶斯法,总结知识点,完成习题 4.1
Task05(3天):阅读第 5 章决策树,总结知识点,完成习题 5.1、习题 5.2
Task06(3天):阅读第 6 章逻辑回归与最大熵模型,总结知识点,完成习题 6.2、习题 6.3
Task07(3天):阅读第 7 章支持向量机,总结知识点,完成习题 7.1、习题 7.2、习题 7.3
Task08(3天):阅读第 8 章提升方法,总结知识点,完成习题 8.1、习题 8.2
Task09(3天):阅读第 9 章 EM 算法及其推广,总结知识点,完成习题 9.1
Task10(4天):阅读第 10 章隐马尔可夫模型,总结知识点,完成习题 10.1、习题 10.2
Task11(4天):阅读第 11 章条件随机场,总结知识点,完成习题 11.1、习题 11.4
3 环境准备
准备好 jupyter / pycharm / vs code 等编程环境,安装好 numpy / pandas / matplotlib 等常用库,注册好笔记打卡的平台账号,并熟悉一下 markdown 格式文档编辑,避免因环境配置、文档提交等问题影响正常学习的进度。
关于如何写 markdown 和如何把自己的代码上传 github,可以参考这篇文章:如何写好一篇高质量的精选项目?
4 Notebook 运行环境配置
1. Python版本
请使用 python3.7.X,如使用其他版本,requirements.txt 中所列的依赖包可能不兼容。打开命令行窗口,输入 python --version
可查询当前 python 所使用版本。
2. 安装相关的依赖包
pip install -r requirements.txt
3. 安装 graphviz (用于展示决策树)
可参考博客:安装 graphviz 教程及可能存在问题的解决办法
4. docsify 框架运行
docsify serve ./docs
网友评论