美文网首页
2019-01-15 赛用特征工程总结

2019-01-15 赛用特征工程总结

作者: 吟巧 | 来源:发表于2019-01-15 22:43 被阅读0次

#多看赛经,还有决赛答辩。

#参与练习赛

#EDA数据可视化探索

EDA最大的作用是发现一些异常数据,并可以重新赋值。

其次是得到一些启发。这个启发很微妙因为并不知道会得到什么启发。

#关于解决过拟合

1不要轻易对A榜提交csv做集成。不要玩火。

2 这个世界是存在一些特征工程,通过转换差分target的方法,来增加数据来解决过拟合的。

3 不要迷信调参。大部分调参是无用的,少部分提升一点点的成绩。关注数据和特征更加重要。手动调参和自动调参本质上没有区别。

4 大部分情况下,正则化都有用。

#如果某次比赛没有拿到好名次。不一定是你的实力问题,还有可能是运气问题。但是只要是比赛,细节性的东西一定要注意。你越细心,运气越好。

赛经搜集

#https://zhuanlan.zhihu.com/p/43691981

该文主要是以下观点

把数据转换成图像

    原始数据转换成图像,并把前n位像素作为特征。这是Kaggle竞赛中出现的令人惊叹的特征工程之一。

Meta-leaks

  能发现数据泄漏的情况,代表数据探索分析做的好

表征学习特征

均值编码

转换目标变量

    改变目标变量分布 log(1+目标)和  转回 predictions = np.exmp1(log_predictions)。

#https://jizhi.im/blog/post/kaggle_silver

git 上有ppt

四则运算 时间段特征

地理位置特征

  聚类

文本特征

稀疏型特征

稀疏型特征

相关文章

  • 2019-01-15 赛用特征工程总结

    #多看赛经,还有决赛答辩。 #参与练习赛 #EDA数据可视化探索 EDA最大的作用是发现一些异常数据,并可以重新赋...

  • 风控评估指标浅析与实现 - KS、WOE、IV

    1. 前言 风控工作中,不管是特征工程、特征筛选、建模都常常涉及到的几个指标,简单总结下。 2. KS KS 是用...

  • 特征工程之入门总结

    最近在做天池项目过程中,涉及到最重要的一步骤就是特征工程。本文旨在总结特征工程知识点,项目实战请移步:特征工程详解...

  • 09 特征工程 - 总结

    08 特征工程 - 特征降维 - IDA 数据清洗常见流程 异常数据处理 案例 - 车辆数据预处理 每个样本具有7...

  • 特征工程实践总结

    特征工程是将原始数据,通过业务逻辑理解、数据变换、特征交叉与组合等方式,量化成模型训练和预测可直接使用的特征的过程...

  • MyISAM和InnoDB的区别

    简单总结MyISAM和InnoDB的区别 2019-01-15更新:

  • 机器学习入门

    特征工程完全总结(Python 源码) 那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从...

  • Recommendation_System_news赛题理解+B

    赛题理解 赛题理解是切入一道赛题的基础,会影响后续特征工程和模型构建等各种工作,也影响着后续发展工作的方向,正确了...

  • 对于初步洗完后的数据后续处理的流程图

    具体内容见我之前总结的特征工程中的常用方法。使用Xmind画,:

  • 2018-04-03-机器学习相关

    No.1 特征工程 (1)使用sklearn做单机特征工程 - jasonfreak - 博客园 (2)特征工程实...

网友评论

      本文标题:2019-01-15 赛用特征工程总结

      本文链接:https://www.haomeiwen.com/subject/dikudqtx.html