美文网首页
Python 数值分组/统计每个区间的数值个数 pandas.c

Python 数值分组/统计每个区间的数值个数 pandas.c

作者: 王叽叽的小心情 | 来源:发表于2022-11-02 11:33 被阅读0次

    背景需求:将数值分割并排序到容器中,比如将连续变量转换为类别变量或者是转换为指定的分组

    函数官网:pandas.cut

    主要参数:pandas.cut(*x*, *bins*, *right=True*, *labels=None*, *retbins=False*, *precision=3*, *include_lowest=False*, *duplicates='raise'*, *ordered=True*))

    注意:默认区间分割是前开后闭(],即前面是大于,后面是小于等于;如需修改可设置include_lowest变量

    用法示例:

    # 输出每个分类的个数
        file = r"E:\Result.csv"
        df = pd.read_csv(file, header=0, encoding='gbk')
        intervals = [0, 0.1, 0.4, 0.5, 0.6, 0.9, 1.0]
        sequence = pd.cut(df['col'], intervals)
        print(sequence.value_counts())
    

    在使用pd.cut之后,多加了一个value_counts统计个数,更多例子参见函数官网pandas.cut

    相关文章

      网友评论

          本文标题:Python 数值分组/统计每个区间的数值个数 pandas.c

          本文链接:https://www.haomeiwen.com/subject/fftetdtx.html