美文网首页
EXCEL表根据日期范围进行数据筛选的py代码V1.0

EXCEL表根据日期范围进行数据筛选的py代码V1.0

作者: 人艰不扌斥 | 来源:发表于2021-04-11 09:27 被阅读0次
    • 原数据表共有3份,其中的1份内容如下图:

      图片.png
    • 最终实现效果如图:

      图片.png
    • 以下为代码部分:
    # 加载pandas库并简写为pd
    # 关闭警告显示
    import warnings
    
    import pandas as pd
    
    warnings.filterwarnings ('ignore')
    
    # ===========================================================================
    
    # 第一步:将日期列设置为索引列;
    # 第二步:设置日期这里列的格式:parse_dates=['日期']
    # 第三步:进行排序,
    原始数据1 = pd.read_excel ('E:/111111111111111/月报案例/A.xlsx',
                           header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
    数据1 = 原始数据1.sort_values ('日期')
    
    原始数据2 = pd.read_excel ('E:/111111111111111/月报案例/B.xlsx',
                           header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
    数据2 = 原始数据2.sort_values ('日期')
    
    原始数据3 = pd.read_excel ('E:/111111111111111/月报案例/C.xlsx',
                           header=1, usecols='A:O', index_col='日期', parse_dates=['日期'])
    数据3 = 原始数据3.sort_values ('日期')
    
    # --------------------------------------------------------------------------
    # # 查询2020年10月的数据
    # print(原始数据1_1['2020-10'])
    # print('----------------------------------')
    # # 查询某个日期之后的数据,包含当天
    # print(原始数据1_1.truncate(before='2020-10-1'))
    # print('----------------------------------')
    #
    # # 查询某个日期之前的数据,包含当天
    # print(原始数据1_1.truncate(after='2020-10-1'))
    # print('----------------------------------')
    # ----------------------------------------------------------------------------
    
    
    # 查询某个 开始日期:结束日期 之间的数据,包含当天
    开始日期 = input('请输入开始日期,格式为:YYYY-MM-DD')
    结束日期 = input('请输入结束日期,格式为:YYYY-MM-DD')
    
    
    筛选结果1 = 数据1.loc[开始日期:结束日期]
    筛选结果2 = 数据2.loc[开始日期:结束日期]
    筛选结果3 = 数据3.loc[开始日期:结束日期]
    
    # 参数axis=0表示上下合并,1表示左右合并,ignore_index=True表示忽略原来的索引
    # 筛选结果 = pd.concat([筛选结果1,筛选结果2,筛选结果3],axis=0,ignore_index=False).sort_values('日期')
    
    # 或者使用append方法合并,如下:
    筛选结果 = 筛选结果1.append ([筛选结果2, 筛选结果3], ignore_index=False)
    
    
    
    
    
    # 删除指定列数据
    数据清洗 = 筛选结果.drop (columns=['序号', '结束日期', '事件\n状态', '事件\n级别', '备  注'])
    
    # print(数据清洗)
    
    
    # ------------------------------------
    
    #
    # 筛选结果1_1 = 筛选结果1.reset_index()
    # print(筛选结果1_1)
    # print(筛选结果1_1['日期'])
    #
    # print(type(筛选结果1_1['日期']))
    
    
    # ------------------------------------
    
    # # 用query方式设置条件筛选时,不能将‘日期’设置为索引列
    # # 日期筛选条件与其他条件同时设置,请注意 and 的位置
    # 条件5 = (
    #     '@数据.日期.dt.year == 2020 and'
    #     '@数据.日期.dt.month >= 9 '
    #     'and 部门 == "少儿部"'
    #
    # )
    # print(数据.query(条件5))
    # ------------------------------------
    
    # print(数据清洗)
    
    
    
    # 将筛选结果保存工作簿,index=False表示不写入索引列
    数据清洗.to_excel ('筛选完成.xlsx', index=True)
    
    
    新数据 = pd.read_excel ('E:/111111111111111/月报案例/筛选完成.xlsx')
    
    print(新数据)
    
    #将date列中的日期转换为没有时分秒的日期
    新数据["日期"] = 新数据["日期"].dt.date
    
    
    新数据.to_excel("筛选完成.xlsx", index=False)
    
    
    
    print('==================================================')
    
    # 加载openpyxl库
    from openpyxl import load_workbook
    
    # 打开筛选后的工作簿
    工作簿 = load_workbook ('筛选完成.xlsx')
    
    # 获取活动工作表
    工作表 = 工作簿.active
    
    
    # ---------------------------------------------------------
    # 设置并添加表头
    # late_header = ['日期', '部门', '房号', '联系人', '运维类型', '事件级别', '事件类型', '故障对象',
    #                '事件现象', '详细处理过程', '事件状态', '结束日期', '受理人', '备注']
    
    # 新建工作簿
    # new_wb = Workbook()
    # 获取新工作簿中的工作表
    # 工作表 = new_wb.active
    # 将表头写入新工作簿的工作表中
    # 工作表.append(late_header)
    
    # 返回三份表的第2行至末行,第2列(B列)至第15列(M列)这个范围的所有单元格对象,将其写入新工作簿的工作表内
    # for row in 工作表.iter_rows(min_row=2, min_col=2, max_col=15, values_only=True):
    #     工作表.append(row)
    # ---------------------------------------------------------
    
    # 加载表格样式
    from openpyxl.styles import PatternFill, Alignment, Side, Border
    
    # 定义表头颜色样式
    header_fill = PatternFill ('solid', fgColor='c8e6c6')
    
    # 定义表中颜色样式为淡黄色
    # content_fill = PatternFill('solid', fgColor='FFFFE0')
    
    # 定义对齐样式横向居中、纵向居中
    align = Alignment (horizontal='center', vertical='center')
    
    # 定义边样式为细条
    side = Side('thin')
    
    # 定义表头边框样式,有底边、顶部、和左边、右边
    border = Border(bottom=side, top=side, right=side, left=side)
    
    # 调整列宽
    工作表.column_dimensions['A'].width = 14
    工作表.column_dimensions['B'].width = 16
    工作表.column_dimensions['C'].width = 16
    工作表.column_dimensions['D'].width = 8
    工作表.column_dimensions['E'].width = 25
    工作表.column_dimensions['F'].width = 10
    工作表.column_dimensions['G'].width = 16
    工作表.column_dimensions['H'].width = 40
    工作表.column_dimensions['I'].width = 40
    工作表.column_dimensions['J'].width = 8
    
    # 循环第一行单元格,调整表头样式
    for cell in 工作表[1]:
        # 设置单元格填充颜色
        cell.fill = header_fill
        # 设置单元格对齐方式
        cell.alignment = align
        # 设置单元格边框
        cell.border = border
    
    # 获取最后一行行号
    row_num = 工作表.max_row
    
    # 循环读取行,并设置行高
    for n in range (row_num + 1):
        工作表.row_dimensions[n].height = 30
    
    # 从第二行开始,循环到末行
    for row in 工作表.iter_rows (min_row=2, max_row=row_num):
        # 循环取出单元格,调整表中样式
        for cell in row:
            cell.alignment = align
            cell.border = border
    
    # 保存工作簿为【append_demo.xlsx】
    工作簿.save ('筛选完成.xlsx')
    print('保存完毕!')
    

    • 此代码还有不少可以优化的地方,欢迎大家相互交流指导

    相关文章

      网友评论

          本文标题:EXCEL表根据日期范围进行数据筛选的py代码V1.0

          本文链接:https://www.haomeiwen.com/subject/waxakltx.html