美文网首页
pandas笔记

pandas笔记

作者: lalalasa | 来源:发表于2020-09-26 13:14 被阅读0次
    • 从Excel表获取数据:

    xls_file = pd.ExcelFile(self.path)

    df = pd.read_excel(xls_file)

    • 对df进行操作

    • 判断df是否为空

    df.empty
    return bool

    • 筛选符合条件的数据为新的df

    筛选日期在20190803到20190804之间的数据
    new_df = df[(df['日期'] >=pd.to_datetime('20190803')) & (df['日期'] < pd.to_datetime('20190804'))]

    • 修改指定位置的值

    df.loc[行数,列名] = 目标值(改为该值)

    • 对行的操作:

    • 计算各行数据总和并作为新行添加到末尾

    df.loc['Row_sum'] = df.apply(lambda x: x.sum())

    • 对列的操作:

    -计算各列数据总和并作为新列添加到末尾

    df['Col_sum'] = df.apply(lambda x: x.sum(), axis=1)

    • 修改列的值

    若col_a列修改2为3
    df.loc[df["col_a"] =="2", "col_a"] ="3"

    • 根据一列的值修改另一列

    df.loc[df["col_a"] =="2", "col_b"] =True
    当col_a=2时,修改col_b=True

    • 获取列名:

    df.columns
    例如:if "date" in df.columns: do something

    相关文章

      网友评论

          本文标题:pandas笔记

          本文链接:https://www.haomeiwen.com/subject/dltxuhtx.html