AI FOR QUANT

作者: 极客与宽客 | 来源:发表于2019-06-17 13:30 被阅读0次

问题:机器学习基本流程有哪些

解答:数据获取(爬虫等)、特征抽取(经验和探索)、数据转换(缺失值填充、标准化、降维)、模型训练、模型选择、模型预测

问题:监督学习做的是什么

解答:使用者给出特征和标签,算法挖掘规律,学习一个模式,并根据此模式预测新的特征对应的标签。包括线性回归、岭回归、 Lasso 回归、逻辑回归、线性判别分析和二次判别分析、支持向量机、决 策树、随机森林、AdaBoost、神经网络、深度学习和 K 最近邻算法在内的 众多监督学习方法。

问题:无监督学习做的是什么

解答:不给标签,算法根据原始特征寻找模式。常用方法包括聚类和降维。聚类:K 均值聚 类、分层聚类和谱聚类。降维包括以主成分分析为代表的线性降维,以及 以流形学习为代表的非线性降维。

问题:特征抽取的应用场景

解答:自然语言识别中, 人们借助 Word Embedding 技术,将以文字表示的词汇转换为以数值表示的向量。在图像识别中,人们首 先从原始的图片里提取出三原色、亮度等信息。在多因子选股中,人们从原始的价量数据 中提取出各类因子,也暗含了特征提取的思想。特征提取有一些基本套路,但是更多时候 基于人的经验和探索。优质的特征能够令模型训练的过程事半功倍。

问题:数据降维做的是什么

解答:降维能够避免特征之间相关 性的影响,也能避免维数灾难的发生。

问题:模型选择中的交互验证是什么

解答:交互验证的核心是将全部样本划分成两部分,一部分用来训练模型,称为训练集,另外一 部分用来验证模型,称为验证集,随后考察模型在训练集和验证集的表现是否接近。交互来进行验证。如果模型在验证时性能和训练时大致相同,那么就可以确信模型真的“学会” 了如何发现数据中的一般规律,而不是“记住”训练样本。这实际上和学生考试的情形类 似,要想考察学生是否掌握了某个知识点,不能使用课堂上讲过的例题,而应当使用相似 的习题。

相关文章

网友评论

    本文标题:AI FOR QUANT

    本文链接:https://www.haomeiwen.com/subject/evhafctx.html