-
从Excel表获取数据:
xls_file = pd.ExcelFile(self.path)
df = pd.read_excel(xls_file)
-
对df进行操作
- 判断df是否为空
df.empty
return bool
- 筛选符合条件的数据为新的df
筛选日期在20190803到20190804之间的数据
new_df = df[(df['日期'] >=pd.to_datetime('20190803')) & (df['日期'] < pd.to_datetime('20190804'))]
- 修改指定位置的值
df.loc[行数,列名] = 目标值(改为该值)
-
对行的操作:
- 计算各行数据总和并作为新行添加到末尾
df.loc['Row_sum'] = df.apply(lambda x: x.sum())
-
对列的操作:
-计算各列数据总和并作为新列添加到末尾
df['Col_sum'] = df.apply(lambda x: x.sum(), axis=1)
- 修改列的值
若col_a列修改2为3
df.loc[df["col_a"] =="2", "col_a"] ="3"
- 根据一列的值修改另一列
df.loc[df["col_a"] =="2", "col_b"] =True
当col_a=2时,修改col_b=True
- 获取列名:
df.columns
例如:if "date" in df.columns: do something
网友评论