1.
(1)只有Series可以to_frame()
(2)列转行:to_frame().T
(3)lambda用作选择条件
(4)同时写入header和skiprows;如果header在skiprows下方,则skiprows无效(不显示header上方的内容)
(5)keep_default_na:空值为NAN
2.获取行
(1)df.set_index():将XX列作为索引
(2)loc[]实际索引[],iloc[]0,1,2索引[)
(3)bool作为索引,显示True的数据
bl=条件;df.loc[bl]; 例子:bl=df['年龄']<30
df[df[‘年龄’]<30]
2.获取列
(1)df[].head()——head选取前5行
(2)df[]——[)——获取行
(3)df.loc[行,列]/df.iloc[](可用切片)
(4)replace更改数据:
df.replace ({列名:{原值:改值}},inplace=True)
(5)df.sort_values()只能对一列排序
多列排序df.sort_values([‘name’,’height’],ascending=[True,False])
(6)del df[列名]——删除列
df.drop(labels=行序号)
(7)修改一列值
df.随意=df[列名].map({原值:改值…})
df.replace({原值:改值…},inplace=True)
(8)生成m*n的随机矩阵(df=,赋值后运行不直接显示)
pd.DataFrame(np.random.random((m*n)))
【注意】pandas运行先后顺序可控制,运行后数据即存在,即使运行后删掉之前运行语句,也不影响后续语句运行;但每次打开都需从头运行
网友评论