第1课 回归问题与应用
知识点1: 机器学习基本概念
知识点2: 线性回归定义和应用
知识点3: 线性回归损失函数
知识点4: 随机梯度下降法和学习率的理解
知识点5: 欠拟合和过拟合
知识点6: 正则化作用
知识点7: 逻辑回归解决分类问题
知识点8: 逻辑回归损失函数
知识点9: 二分类和多分类处理
实战项目: 手写逻辑回归代码
第2课 决策树、随机森林、GBDT
知识点1: 决策树介绍
知识点2: 熵、不纯度的理解
知识点3: ID3、ID4.5、CART算法描述
知识点4: 信息增益、信息增益率介绍
知识点5: Bagging与随机森林算法
知识点6: Boosting与Adaboost算法
知识点7: GBDT与XGBoost算法
实战项目: 用XGBoost预测糖尿病患病概率
第3课 SVM
知识点1: SVM发展史介绍
知识点2: SVM决策边界公式推导
知识点3: SVM函数间隔公式推导
知识点4: SVM目标函数公式推导
知识点5: 拉格朗日求解带约束问题的目标函数
知识点6: 核函数映射、核技巧
知识点7: SVM求解优化算法思想
第4课 最大熵与EM算法(上)
知识点1: 熵概念
知识点2: 交叉熵、条件熵
知识点3: 互信息与KL散度
知识点4: 最大熵模型公式推导
第4课 最大熵与EM算法(下)
知识点1: EM算法概念介绍
知识点2: 隐变量理解
知识点3: 最大似然函数
知识点4: EM算法的迭代求解:E步和M步
知识点5: EM算法的公式推导
知识点6: 混合模型与EM算法、高斯混合模型
知识点7: EM算法的代码实现
第5课 机器学习中的特征工程处理
知识点1: 阿里比赛及特征工程介绍
知识点2: 数据与特征处理:采集
知识点3: 数据与特征处理:格式化与存储
知识点4: 数据与特征处理:数据清洗
知识点5: 数据与特征处理:数据采样与正负样本不平衡的处理
知识点6: 数据与特征处理:数值型处理(幅度调整、统计值、离散化、log变换、统计值、转类别型)
知识点7: 数据与特征处理:离散型处理(one-hot编码、哑变量、hash与聚类、转数值型)
知识点8: 数据与特征处理:时间日期型处理(one-hot编码、哑变量、hash与聚类、转数值型)
知识点9: 数据与特征处理:文本型处理(词袋模型、n-gram、word2vec、tf-idf)
知识点10: 数据与特征处理:统计特征与组合特征
知识点11: 特征选择:过滤型、包裹型、嵌入型
实战项目: kaggle实战:天池电力AI大赛
第6课 多算法组合与模型最优化
知识点1: 数据、模型介绍
知识点2: 数据部分:采样、清洗、处理、选择
知识点3: 模型部分:选择模型、超参数、模型选择、网格搜索GirdSearch
知识点4: 模型优化:欠/过拟合、学习曲线
知识点5: 模型优化:不同欠/过拟合时的处理、bad case分析
知识点6: 模型融合:Bagging、Stacking、Boosting
实战项目: kaggle实战:泰坦尼克号预测
第7课 sklearn与机器学习实战
知识点1: sklearn简介
知识点2: 构建机器学习系统的一般流程
知识点3: 教你学习sklearn库:入门学习、算法指南、API介绍
知识点4: sklearn库整体建模流程
实战项目: 用sklearn库实现KNN算法预测
第8课 高级工具xgboost/lightGBM与建模实战
知识点1: XgBoost简介
知识点2: XgBoost三类重要参数详解:通用参数
知识点3: XgBoost三类重要参数详解:模型参数
知识点4: XgBoost三类重要参数详解:任务参数
知识点5: XgBoost调参指南(欠/过拟合时的参数处理)
知识点6: XgBoost案例的代码实现、参数选择、评估指标
实战项目: kaggle实战:便利店销量预测XgBoost实战
第9课 用户画像与推荐系统
知识点1: 推荐系统简介、结构
知识点2: 推荐系统评估方式(准确率、覆盖率、多样性等)
知识点3: 推荐系统:基于内容方式
知识点4: 推荐系统:基于协同过滤(冷启动问题)
知识点5: 基于用户和基于物品的协同过滤比较
知识点6: 推荐系统:基于隐语义模型(SVD)
知识点7: 推荐系统:基于用户行为序列及Word2vec
知识点8: 推荐系统细节说明、开源库介绍
实战项目: 基于用户的协同过滤算法代码实现
第10课 聚类
知识点1: 无监督学习目标
知识点2: 聚类各个领域的应用
知识点3: k-means算法的目标函数、距离计算公式
知识点4: k-means算法的随机初始化、迭代优化算法Lloyd
知识点5: 改进的k-means++初始化方法
知识点6: 层次聚类原理(自下而上合并和自上而下分裂)
实战项目: k-means算法的代码实现
第11课 聚类与推荐系统实战
知识点1: Kaggle酒店推荐比赛背景说明
知识点2: 数据泄露处理
知识点3: 随机森林建模代码讲解
知识点4: GBDT建模代码讲解
知识点5: SGD建模代码讲解
知识点6: 朴素贝叶斯建模代码讲解
知识点7: 模型Blending处理、提交结果
第12课 贝叶斯网络
知识点1: 机器学习历史(连接主义,符号主义,统计学习,图模型)
知识点2: 贝叶斯定理:诊断案例引入
知识点3: Monty Hall(三扇门)问题
知识点4: 贝叶斯网络
知识点5: 贝叶斯网络应用
知识点6: The sprinkler network(inference in DAG)
第13课 隐马尔科夫模型HMM
知识点1: HMM模型介绍
知识点2: 状态转移概率、初始状态概率、观测概率
知识点3: HMM的两个基本假设
知识点4: HMM的预测问题思路讲解
知识点5: HMM的应用场景介绍
知识点6: RNN和HMM的对比
第14课 主题模型
知识点1: 主题模型的实例的直观解释
知识点2: LDA与贝叶斯模型
知识点3: 先验、后验与似然理解
知识点4: LDA的生成过程和公式解释
知识点5: gamma函数、二项分布、多项分布、beta分布、Dirichlet分布
知识点6: 共轭先验和贝叶斯框架
知识点7: pLSA和LDA区别
实战项目: 用LDA算法一眼看穿希拉里邮件
网友评论