由于数据更新的需要,往往需要将新日期获取的数据合并到原有的数据中,pandas中的concat函数能很好的完成合并工作,再通过使用drop_duplicates方法去除重复的数据即可。
实际运用中通常获取最后的更新日期,从该日期后进行查询,可以使用day+1的方法规避重复数据,也可以应用上述方法,去除重复
# -*- coding: utf-8 -*-
import pandas as pd
import tushare as ts
#获取第一个df
df1 = ts.get_k_data('510050', start='2014-02-21',end='2014-04-01',ktype='D',autype='qfq')
#重构索引
df1.set_index(['date'], inplace = True)
#获取第二个df
df2 = ts.get_k_data('510050', start='2014-01-01',end='2014-04-01',ktype='D',autype='qfq')
#重构索引
df2.set_index(['date'], inplace = True)
#两个dataframe合并
df_new=pd.concat([df1, df2])
#检查去重
df_new = df_new.drop_duplicates()
#按照索引[日期]进行排序,升序
print(df_new.sort_index(ascending = True))
网友评论