美文网首页
机器学习(AI)工程师面试--复习要点

机器学习(AI)工程师面试--复习要点

作者: 吴祺育的笔记 | 来源:发表于2019-08-11 12:19 被阅读0次

    这段时间换工作,在家系统的准备了一下面试,从最开始没准备的时候,被面试官问的无地自容,这个也不知道,那个就算知道是什么意思但是也说不清楚,到准备之后,面试官问机器学习相关的东西完全招架的住。
    这次复习重新读了西瓜书,好好研究了一下《统计学习方法》的第二版,然后把《百面机器学习》翻了一大半,外加上以前写的一些博客,知乎的一些收藏,总结了16页纸,现把要点罗列出来,供大家准备面试的时候参考一下。

    以下每个部分都很重要!
    以下每个部分都很重要!
    以下每个部分都很重要!


    Part0 关于面试

    1. 简历上写的一个字都用弄明白,尊重你在简历上写的每一个字,靠谱的公司的面试官也只会围绕简历问,如果不是,要么面试官水平不行要么公司业务不行,这种公司也不要去
    2. 面试会就会,不会就不会,可以和面试官交流,记下问题回去研究一下,结果出来之前不要放弃
    3. 针对不同岗位做不同的简历:如算法、NLP/CV、数据挖掘,项目经历展现不同侧重点
    4. 不可能什么都懂,但是懂得一定要想办法在面试的时候讲出来,不要让面试官猜你会什么东西

    Part1 特征工程

    1. 归一化和标准化相关概念,有什么作用,几种不同归一化的公式
    2. 特征工程
    • filter:方差选择、相关系数、卡方检验、互信息
    • wrapper: 递归消除特征
    • embedded:L1筛选特征的原理(L1和L2的区别,对抗过拟合原理)、树模型进行特征筛选
    1. 文本表示:TF-IDF、LDA、word2vector原理(做NLP的要了解Elmo、Transformer、BERT相关)
    2. 特征缺失时处理 方法

    Part2 模型评估

    1. 准确率和召回率
    2. P-R曲线
    3. ROC曲线、AUC面积
    4. P-R曲线和ROC曲线的区别
    5. 模型检验方法:holdout、k-fold、bootstrap(公式推导)
    6. 参数调优:网格搜索、随机搜索、贝叶斯优化
    7. 欠拟合、过拟合:概念、如何避免(这个一定要好好研究,一定会问)

    这个部分很基础,但是如果面试官经验丰富,完全可以把你问崩溃,而且这些概念一定会在面试中出现,所以务必重视

    Part3 经典算法

    1. SVM:公式推导、对偶和KKT的理解、优劣势
    2. LR:公式推导,和SVM的区别
    3. 决策树:
    • ID3:最大信息增益公式,举例说明
    • C4.5:最大信息增益率公式(最终信息划分选择),和ID3区别,举例说明
    • CART:基尼指数公式、回归树步骤,三种树的区别
    • 预剪枝和后剪枝:概念和作用

    Part4 集成学习

    1. 随机森林:随机性、特点、参数
    2. Adaboost:步骤、特点
    3. GBDT:特点,推导过程
    4. Xgboost:和GBDT的区别、特点

    把GBDT和Xgboost好好研究一番

    Part5 主题模型

    1.pLSA

    1. LDA:概念、原理

    Part6 优化方法

    1. 平方差损失:概念、梯度下降公式推导
    2. 凸函数:概念
    3. 梯度下降
    4. 牛顿法
    5. 正则化和稀疏性:这和问题一定要搞透彻

    Part7 深度学习

    1. CNN
    2. RNN
    3. Attention:self-attention
      (以上三点的基本内容一定要熟悉,做CV就好好理解CNN,包括BP推导,做NLP就好好理解LSTM和Transformer)
    4. dropout、BN、优化器选择等等trick
    5. 深度学习调参方法和步骤

    相关文章

      网友评论

          本文标题:机器学习(AI)工程师面试--复习要点

          本文链接:https://www.haomeiwen.com/subject/tabjjctx.html