美文网首页数据蛙数据分析每周作业
【Python学习】No.7 Pandas常用函数(一)

【Python学习】No.7 Pandas常用函数(一)

作者: LL_路上 | 来源:发表于2019-03-24 16:48 被阅读0次

    1.cut

    pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3,include_lowest=False)

    • x:类似数组排列
      输入要binned的阵列。 它必须是一维的。
    • bins : int,标量序列,或区间索引
      如果bins取一个int整数,它定义了在x范围内的等宽bins的数量。然而,在这种情况下,x的范围在每一边扩展了0.1%,包含了x的最小值或最大值。如果bins是一个序列,它就定义了bins的边界即宽度,允许不均匀的bins宽度。在这种情况下没有扩展x的范围。
    • right:boolean 值,可选
      表明bins是否包括最右边缘。 如果right == True(默认值),则bin[1,2,3,4]表示(1,2],(2,3],(3,4]。
    • labels :数组或布尔,默认无
    • indicators ['ɪndə,ketɚ] n. 指示器(indicator的复数);指示灯
      (计算机) 指示剂、指针
      用作结果bins的标签。 必须与得到的bins的长度相同。 如果为False,则只返回bin的整数指示符。
    • retbins:boolean值,可选
      是否返回bins? 如果bins是给定的一个标量,可以使用它。(retbins就是return bins的缩写,即这个参数是表示是否返回bins参数的内容,true就返回,false就不返回)
    • precision :int,可选的
      存储和显示bins标签的精度
    • include_lowest :bool,可选

    2.concat

    pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False,copy=True)

    • objs:Series,DataFrame或Panel对象的序列或映射。如果传递了dict,则排序的键将用作键参数,除非它被传递,在这种情况下,将选择值(见下文)。任何无对象将被静默删除,除非它们都是无,在这种情况下将引发一个ValueError。
    • axis:{0,1,...},默认为0。沿着连接的轴。
    • join:{'inner','outer'},默认为“outer”。如何处理其他轴上的索引。outer为联合和inner为交集。
    • ignore_index:boolean,default False。如果为True,请不要使用并置轴上的索引值。结果轴将被标记为0,...,n-1。如果要连接其中并置轴没有有意义的索引信息的对象,这将非常有用。注意,其他轴上的索引值在连接中仍然受到尊重。
    • join_axes:Index对象列表。用于其他n-1轴的特定索引,而不是执行内部/外部设置逻辑。
    • keys:序列,默认值无。使用传递的键作为最外层构建层次索引。如果为多索引,应该使用元组。
    • levels:序列列表,默认值无。用于构建MultiIndex的特定级别(唯一值)。否则,它们将从键推断。
    • names:list,default无。结果层次索引中的级别的名称。
    • verify_integrity:boolean,default False。检查新连接的轴是否包含重复项。这相对于实际的数据串联可能是非常昂贵的。
    • copy:boolean,default True。如果为False,请勿不必要地复制数据。

    3.iloc与loc

    pandas以类似字典的方式来获取某一列的值,比如df['A'],这会得到df的A列。如果我们对某一行感兴趣呢?这个时候有两种方法,一种是iloc方法,另一种方法是loc方法。loc是指location的意思,iloc中的i是指integer。这两者的区别如下:
    • loc works on labels in the index.
    • iloc works on the positions in the index (so it only takes integers).
    也就是说loc是根据index来索引,那么loc就根据这个index来索引对应的行。iloc并不是根据index来索引,而是根据行号来索引,行号从0开始,逐次加1。

    相关文章

      网友评论

        本文标题:【Python学习】No.7 Pandas常用函数(一)

        本文链接:https://www.haomeiwen.com/subject/atbuvqtx.html