最近收到12个excel文件,内容都是图书目录,需要把它们合并成一个,手动太麻烦啦,python救我。
import os
import pandas as pd
#遍历文件夹内所有文件,文件名存储在列表中
for dirpath,dirnames,filenames in os.walk('books'):
file_list = filenames
#读取全部excel文件,并拼接
dict_data = {
'ISBN':'',
'title':'',
'author':'',
'price':'',
'publisher':''}
book_list = pd.DataFrame(dict_data,index=["0"])#创建空白DataFrame,为拼接做准备
for f in file_list:
df = pd.read_excel(f'books/{f}')
book_list = pd.concat([book_list,df])
#去掉ISBN为空值的行
book_list = book_list.dropna(axis = 0,subset = 'ISBN')
#保存拼接后的excel
book_list.to_excel(excel_writer = 'book_list.xlsx')
网友评论