美文网首页
数据处理

数据处理

作者: Rainysong | 来源:发表于2019-01-10 15:02 被阅读0次

1、缺失值填充

我只用过方法1.png
代码调包示例.png
ps,链接:https://blog.csdn.net/shunqixing/article/details/80045189

2、sklearn预处理包:https://blog.csdn.net/weixin_40807247/article/details/82793220

3、数据归一化:https://blog.csdn.net/bbbeoy/article/details/70185798

4、异常值检测:https://blog.csdn.net/panda_zjd/article/details/71810859
4.1、异常值替换法:统计学Bootstrap方法:https://www.applysquare.com/topic-cn/QlJiMm6X5/ ; 连续变量用均值替代,离散变量用中位数/众数替代。
异常值检测及处理:https://wenku.baidu.com/view/4c9a5a13910ef12d2bf9e703.html
https://wenku.baidu.com/view/d75046d176eeaeaad1f330aa.html
差分:https://segmentfault.com/q/1010000005888855
OneClassSVM【异常值检测、解决极度不平衡数据】:https://www.cnblogs.com/coshaho/p/9925862.html
https://www.cnblogs.com/damumu/p/7320334.html
https://blog.csdn.net/YE1215172385/article/details/79750703
https://blog.csdn.net/tandelin/article/details/88784501

箱线图(tukey's method)检验异常值:https://blog.csdn.net/zhuiqiuuuu/article/details/82721935

(Q1-1.5IQR, Q3+1.5IQR), IQR=Q3-Q1.png

SKLEARN异常检测:https://blog.csdn.net/hustqb/article/details/75216241

5、数据仓库:星型VS雪花型:https://blog.csdn.net/ecjtuxuan/article/details/6273983

6、数据分布假设性检验:https://segmentfault.com/a/1190000007626742
正态分布检验:https://blog.csdn.net/cyan_soul/article/details/81236124

7、VLOOKUP:
http://club.excelhome.net/forum.php?mod=viewthread&tid=575333&extra=page%3D1%26filter%3Dtypeid%26typeid%3D22%26typeid%3D22

解释十分生动形象,不用担心源数据不见,vlookup函数取的值也不见的问题了~~.png

相关文章

  • js实现数组对象去重并统计重复个数

    数据处理前 数据处理后

  • 大数据学习导图

    数据获取 数据获取与查看 数据处理 数据处理I:缺失值填补 数据处理II:数据转换 数据处理III:无量纲化 特征...

  • 第一章 spark-streaming的概述

    section 1 spark-streaming是什么 //数据处理的方式角度 流式数据处理 批量数据处理 //...

  • 大数据学习路线

    一、大数据处理流程 上图是一个简化的大数据处理流程图,大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应...

  • swift JSON转model 使用Codable

    简单数据处理 定义模型名称 json数据定义 数据解析 复杂数据处理 定义json 定义模型 解析数据处理 列表数...

  • Spark Streaming 1.基本操作

    1. 数据分析分类: 流式数据处理:多条数据缓冲一起处理批量数据处理:一条数据一处理 实时数据处理:数据处理延迟时...

  • Python| Pandas

    01 强大的数据处理能力 Python有强大的数据处理能力。我们都使用过Excel,它的数据处理能力已经非常强大,...

  • 实战篇--有关做大数据项目的开发流程

    前言 有关做大数据项目的开发流程数据处理--->后端调用--->前端展示 一、数据处理 数据处理主要负责:看数据是...

  • 无标题文章

    DataEngine数据处理流程 DataEngine数据处理流程包含如下步骤: changevalidatepu...

  • Kaggle_01_Titanic

    1. 数据处理 简单分为三种:缺失数据处理、新特征生成和数据归一化 1.1 缺失数据处理: (1) 直接丢掉 - ...

网友评论

      本文标题:数据处理

      本文链接:https://www.haomeiwen.com/subject/kudarqtx.html