前言:准备按着如下这个表格打钩写博文,重新确定自己的知识树路线走向如何,路线摘自《hulu面试》。
有的点面积巨大,有的点小,我看兴趣,把感兴趣的点更深入的探索下,出于面试的角度,先对每一个算法点做一个总分,比如五星,
* Fck,
** 代表了解基础概要,
*** 代表对公式有深入理解,
**** 代表代码角度理解,
***** 代表对公式与其他公式和各类方法的关联有深入理解。先按这个标准进行学习吧。
机器学习基本概念和分类
基本概念
:假设空间
:训练、测试数据
:标注
:损失函数
按数据分类
:分类
:回归
:序列标注
按监督分类
:监督
:非监督
:强化
按模型分类
:生成式模型
:判别式模型
经典机器学习模型
监督学习
- 经典算法
:SVM
:LR
:DecisionTree- 概率图模型
:NaiveBayes
:最大熵模型
:隐马尔科夫模型
:条件随机场
非监督学习
:层次聚类
:K-Means聚类
:高斯混合模型
:主题模型
集成学习
:Bagging
:Boosting
:RandomForeast
:GBDT
降维算法
采样
深度学习模型
前项神经网络
:MLP
:CNNs
:ResNet
:自组织映射
:受限玻尔兹曼机
循环神经网络
:循环神经网络
:长短期记忆模型
:注意力机制
:Seq2Seq
优化技巧
:批量归一化
:DropOut
:激活函数:Sigmoid、Softmax、Tanh、ReLU.
强化学习
GANs
特征工程
特征离散化与归一化
特征组合
特征选择
词嵌入表示
模型评估
评价指标
A/B测试
过拟合与欠拟合
超参数选择
优化算法
损失函数
正则化
EM算法
梯度下降
反向传播
梯度验证
Momentum
AdaGrad
Adam
数学基础
概率论
:常用概率分布
:大数定理、中心极限定理
:假设检验
:贝叶斯理论
线性代数
微积分
凸优化
信息论
工程能力
数据结构与算法
:树及相关算法
:图及相关算法
:哈希表
:矩阵运算与优化
大数据处理
:MapReduce
:Spark
:HiveQL
:Storm
机器学习平台
:Tensorflow
:Troch
并行计算
数据库和数据仓库
系统服务架构
业务与应用
CV
NLP
Recommendation system
Computational advertising
Intelligent game
网友评论