美文网首页机器学习和人工智能入门
最近关于机器学习的总结点

最近关于机器学习的总结点

作者: 小乙集 | 来源:发表于2016-09-22 12:10 被阅读0次

最近在学习用python运算机器学习,顺便开始系统的学习机器学习。

暂时通过教学视频和阿里音乐比赛的总结博客得到几点以前忽略的重点。

1.关于数据分析的目的,要明确业务方向,比如银行信用卡调查问卷,是要去明确找到会办理信用卡的潜在客户的特征,而不是那些不办信用卡的。往往目标人数是少数。

2. 关于数据清洗,以前总喜欢选择删除一些outliers,或者特征值不全的数据。其实不应该删除,missing value 可以用-999之类的无意义值去填充,数据不能少,否则其他特征值就损失了。

3. one hot在建立特征时还是应用挺多的。比如阿里音乐比赛中,先把用户用kmeans聚类,得到十个类以后,把类转化成特征one hot。这个是个很好的用法,比我们当时分类以后按照每个类再进行预测的方法好。基本特征值最后会是一个极大的稀疏矩阵。

4. 归一化和标准化。特征值之间的数值还是要保持在一个数量级上,否则模型会打破每个特征值是同等重要的原则。比如收入和年龄,收入远比年龄数值大,这时候就要标准化特征。

5.模型选取上svm, rf, adaboost,xgboost等。得学习。

6. 模型评估还是很重要的。 一般通过f1评估。 像阿里音乐比赛,那大神用的就是评估函数的极值加到每个播放量上进行预测,分数提高很多。

7. supervised—labled well

unsupervised- cluster well

reinforcement- behavior well

相关文章

  • 最近关于机器学习的总结点

    最近在学习用python运算机器学习,顺便开始系统的学习机器学习。 暂时通过教学视频和阿里音乐比赛的总结博客得到几...

  • 第一章(1.3)机器学习概念图谱

    一、机器学习概念图谱 二、什么是机器学习 机器学习(machine learning)是最近非常火的一个领域,关于...

  • 机器学习入门参考资料

    关于机器学习的火热与发展潜力,大家可能都感受到了,最近也在学习机器学习相关的知识。所以这里给大家分享一些最近在看的...

  • 决策树与随机森林——原理篇(二)

    第一篇我们主要关注了根结点及内部结点的选择第二篇主要关注如何处理“过拟合”现象参考 大致了解机器学习——AI 算法...

  • 决策树

    决策树 决策树是一种树状的机器学习模型,模型中以数据属性做为分支结点,最后的分类结果作为叶子结点。下图是西瓜书里所...

  • 数据结构_知识点_树

    关于树的基本术语 祖先结点,子孙结点 双亲结点,孩子结点 兄弟结点 结点的度 分支节点(度为0),叶子节点(又称终...

  • 机器学习小项目(1)图片风格转移

    简介 这学期开始上《机器学习》相关的课,老师要求每个组都阅读一篇最近发表的关于机器学习的论文,并做展示,其中有很多...

  • 机器学习的发展史

    关于机器学习的详细内容:机器学习入门:概念原理及常用算法 (本课程主要讲解机器学习的概念、原理和应用场景,以及机器...

  • 机器学习之路

    原创:编程TWO编程小兔崽今天 机器学习方法一检索能力 最近有朋友问我是如何学习机器学习的,说最近机器学习、人工智...

  • 机器学习网址

    收藏的觉得不错的关于机器学习网址:github关于机器学习的整理 斯坦福大学公开课

网友评论

    本文标题:最近关于机器学习的总结点

    本文链接:https://www.haomeiwen.com/subject/krjzettx.html