美文网首页
大数据——机器学习练习题

大数据——机器学习练习题

作者: G小曲 | 来源:发表于2018-11-02 10:56 被阅读0次

                                                                               更多资料关注科多大数据

    1、下面有关分类算法的准确率,召回率,F1 值的描述,错误的是?

    A、准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率

    B、召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率

    C、正确率、召回率和 F 值取值都在0和1之间,数值越接近0,查准率或查全率就越高

    D、为了解决准确率和召回率冲突问题,引入了F1分数

    正确答案是:C,解析:对于二类分类问题常用的评价指标是精准度(precision)与召回率(recall)。通常以关注的类为正类,其他类为负类,分类器在测试数据集上的预测或正确或不正确,4种情况出现的总数分别记作:TP——将正类预测为正类数    FN——将正类预测为负类数    FP——将负类预测为正类数        TN——将负类预测为负类数  由此: 精准率定义为:P = TP / (TP + FP)  召回率定义为:R = TP / (TP + FN)  F1值定义为:F1 = 2 P R / (P + R)  精准率和召回率和F1取值都在0和1之间,精准率和召回率高,F1值也会高,不存在数值越接近0越高的说法,应该是数值越接近1越高。

    2、以下几种模型方法属于判别式模型(Discriminative Model)的有(  ) 1)混合高斯模型  2)条件随机场模型  3)区分度训练   4)隐马尔科夫模型

    A、2,3

    B、3,4

    C、1,4

    D、1,2

    正确答案是:A,解析:常见的判别式模型有:

    Logistic regression(logistical 回归)

    Linear discriminant analysis(线性判别分析)

    Supportvector machines(支持向量机)

    Boosting(集成学习)

    Conditional random fields(条件随机场)

    Linear regression(线性回归)

    Neural networks(神经网络)

    常见的生成式模型有:

    Gaussian mixture model and othertypes of

    mixture model(高斯混合及其他类型混合模型)

    Hidden Markov model(隐马尔可夫)

    NaiveBayes(朴素贝叶斯)

    AODE(平均单依赖估计)

    Latent Dirichlet allocation(LDA主题模型)

    Restricted Boltzmann Machine(限制波兹曼机)

    生成式模型是根据概率乘出结果,而判别式模型是给出输入,计算出结果。

    3、关于支持向量机SVM,下列说法错误的是( )

    A、L2正则项,作用是最大化分类间隔,使得分类器拥有更强的泛化能力

    B、Hinge 损失函数,作用是最小化经验分类错误

    C、分类间隔为1/||w||,||w||代表向量的模

    D、当参数C越小时,分类间隔越大,分类错误越多,趋于欠学习

    正确答案是:C,解析:A正确。考虑加入正则化项的原因:想象一个完美的数据集,y>1是正类,y<-1是负类,决策面y=0,加入一个y=-30的正类噪声样本,那么决策面将会变“歪”很多,分类间隔变小,泛化能力减小。加入正则项之后,对噪声样本的容错能力增强,前面提到的例子里面,决策面就会没那么“歪”了,使得分类间隔变大,提高了泛化能力。

    B正确。

    C错误。间隔应该是2/||w||才对,后半句应该没错,向量的模通常指的就是其二范数。

    D正确。考虑软间隔的时候,C对优化问题的影响就在于把a的范围从[0,+inf]限制到了[0,C]。C越小,那么a就会越小,目标函数拉格朗日函数导数为0可以求出w=求和ai∗yi∗xi,a变小使得w变小,因此间隔2/||w||变大

    4、在HMM中,如果已知观察序列和产生观察序列的状态序列,那么可用以下哪种方法直接进行参数估计(  )

    A、EM算法

    B、维特比算法

    C、前向后向算法

    D、极大似然估计

    正确答案是:D,解析:EM算法: 只有观测序列,无状态序列时来学习模型参数,即Baum-Welch算法

    维特比算法: 用动态规划解决HMM的预测问题,不是参数估计

    前向后向算法:用来算概率

    极大似然估计:即观测序列和相应的状态序列都存在时的监督学习算法,用来估计参数

    注意的是在给定观测序列和对应的状态序列估计模型参数,可以利用极大似然发估计。如果给定观测序列,没有对应的状态序列,才用EM,将状态序列看不不可测的隐数据。

    5、在Logistic Regression 中,如果同时加入L1和L2范数,不会产生什么效果(   )

    A、以做特征选择,并在一定程度上防止过拟合

    B、能解决维度灾难问题

    C、能加快计算速度

    D、可以获得更准确的结果

    正确答案是:D,解析:L1范数具有系数解的特性,但是要注意的是,L1没有选到的特征不代表不重要,原因是两个高相关性的特征可能只保留一个。如果需要确定哪个特征重要,再通过交叉验证。它的优良性质是能产生稀疏性,导致 W 中许多项变成零。 稀疏的解除了计算量上的好处之外,更重要的是更具有“可解释性”。所以能加快计算速度和缓解维数灾难.

    在代价函数后面加上正则项,L1即是Losso回归,L2是岭回归。L1范数是指向量中各个元素绝对值之和,用于特征选择。L2范数 是指向量各元素的平方和然后求平方根,用于防止过拟合,提升模型的泛化能力。

    相关文章

      网友评论

          本文标题:大数据——机器学习练习题

          本文链接:https://www.haomeiwen.com/subject/xnpqxqtx.html