1.cut
pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3,include_lowest=False)
- x:类似数组排列
输入要binned的阵列。 它必须是一维的。 - bins : int,标量序列,或区间索引
如果bins取一个int整数,它定义了在x范围内的等宽bins的数量。然而,在这种情况下,x的范围在每一边扩展了0.1%,包含了x的最小值或最大值。如果bins是一个序列,它就定义了bins的边界即宽度,允许不均匀的bins宽度。在这种情况下没有扩展x的范围。 - right:boolean 值,可选
表明bins是否包括最右边缘。 如果right == True(默认值),则bin[1,2,3,4]表示(1,2],(2,3],(3,4]。 - labels :数组或布尔,默认无
- indicators ['ɪndə,ketɚ] n. 指示器(indicator的复数);指示灯
(计算机) 指示剂、指针
用作结果bins的标签。 必须与得到的bins的长度相同。 如果为False,则只返回bin的整数指示符。 - retbins:boolean值,可选
是否返回bins? 如果bins是给定的一个标量,可以使用它。(retbins就是return bins的缩写,即这个参数是表示是否返回bins参数的内容,true就返回,false就不返回) - precision :int,可选的
存储和显示bins标签的精度 - include_lowest :bool,可选
2.concat
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False,copy=True)
- objs:Series,DataFrame或Panel对象的序列或映射。如果传递了dict,则排序的键将用作键参数,除非它被传递,在这种情况下,将选择值(见下文)。任何无对象将被静默删除,除非它们都是无,在这种情况下将引发一个ValueError。
- axis:{0,1,...},默认为0。沿着连接的轴。
- join:{'inner','outer'},默认为“outer”。如何处理其他轴上的索引。outer为联合和inner为交集。
- ignore_index:boolean,default False。如果为True,请不要使用并置轴上的索引值。结果轴将被标记为0,...,n-1。如果要连接其中并置轴没有有意义的索引信息的对象,这将非常有用。注意,其他轴上的索引值在连接中仍然受到尊重。
- join_axes:Index对象列表。用于其他n-1轴的特定索引,而不是执行内部/外部设置逻辑。
- keys:序列,默认值无。使用传递的键作为最外层构建层次索引。如果为多索引,应该使用元组。
- levels:序列列表,默认值无。用于构建MultiIndex的特定级别(唯一值)。否则,它们将从键推断。
- names:list,default无。结果层次索引中的级别的名称。
- verify_integrity:boolean,default False。检查新连接的轴是否包含重复项。这相对于实际的数据串联可能是非常昂贵的。
- copy:boolean,default True。如果为False,请勿不必要地复制数据。
3.iloc与loc
pandas以类似字典的方式来获取某一列的值,比如df['A'],这会得到df的A列。如果我们对某一行感兴趣呢?这个时候有两种方法,一种是iloc方法,另一种方法是loc方法。loc是指location的意思,iloc中的i是指integer。这两者的区别如下:
• loc works on labels in the index.
• iloc works on the positions in the index (so it only takes integers).
也就是说loc是根据index来索引,那么loc就根据这个index来索引对应的行。iloc并不是根据index来索引,而是根据行号来索引,行号从0开始,逐次加1。
网友评论