美文网首页
等宽分箱与等深分箱

等宽分箱与等深分箱

作者: 郭彦超 | 来源:发表于2021-03-09 15:44 被阅读0次

数据处理中的等宽分箱与等深分箱

  • 等宽分箱
    每组数据的上边界与下边界差值一样
  • 等深分箱
    每组数据中包含的条目数近乎一样
import numpy as np
import pandas as pd

df = pd.DataFrame(data = np.random.randint(0,150,size = (100,3)),
 columns=['Python','Tensorflow','Keras'])

# 1、等宽分箱
pd.cut(df.Python,bins = 3)

# 指定宽度分箱
pd.cut(df.Keras,#分箱数据
 bins = [0,60,90,120,150],#分箱断点
 right = False,# 左闭右开
 labels=['不及格','中等','良好','优秀'])# 分箱后分类

# 2、等深分箱
pd.qcut(df.Python,q = 4,# 4等分
 labels=['1','2','3','4']) # 分箱后分类

相关文章

  • 等宽分箱与等深分箱

    数据处理中的等宽分箱与等深分箱 等宽分箱每组数据的上边界与下边界差值一样 等深分箱每组数据中包含的条目数近乎一样

  • 数据预处理之分箱操作

    分箱离散化 一种无监督离散化方法 分为两类,1 等距离分箱 2 等频度分箱 等距离分箱即等宽度分箱,设有K个空间,...

  • SQL :使用sql直接分箱

    记录用: 一.等距分箱/等宽分箱 1.概念:将变量的取值范围分为k个等宽的区间,每个区间当作一个分箱。 2.方法 ...

  • dataframe中连续数值的离散化

    通过等宽分箱得得方法对df连续型数值进行离散化 使用:

  • 机器学习第二课_数据预处理

    数值型特征分箱(数据离散化) 2.1 无监督分箱法 等距分箱 import pandas as pddf = pd...

  • 快速分箱方法

    python 分箱的一种方法 2018.08.02 R语言中有smbining可以进行最优分箱,python中分箱...

  • 风控建模之woe分箱

    一、自动分箱-粗分箱方法介绍 约定初始化分箱的个数为10。定义:,代表箱子。 1.1 iv 算法-1.初始化10箱...

  • metawrap

    Microbiome:宏基因组分箱流程MetaWRAP简介 MetaWRAP分箱流程实战和结果解读

  • 评分卡模型

    逻辑回归 评分卡模型https://zhuanlan.zhihu.com/p/36539125总结: 数据分箱分箱...

  • 数据的分箱,pd.cut和pd.qcut

    对于数据分箱,常用到的一个函数叫做pd.cut(),这个函数可以通过指定分箱个数或者每个箱体的分界值对数据进行分箱...

网友评论

      本文标题:等宽分箱与等深分箱

      本文链接:https://www.haomeiwen.com/subject/tphbqltx.html