美文网首页金融数据分析
用Python验证指数基金定投策略

用Python验证指数基金定投策略

作者: 活用数据 | 来源:发表于2019-05-07 20:25 被阅读113次

    提出问题

    本文主要针对以下两个问题进行探讨:

    1. 如果投资者“不幸”从最高点开始定投指数基金,那么是否还能盈利?
    2. 周定投和月定投哪个更好?

    获取数据

    注意:本文为了简单起见,直接用指数代替了指数基金。

    Step1 打开网址JoinQuant聚宽,登录帐号

    聚宽首页

    Step2 进入研究环境

    研究环境

    进入研究环境之后,会发现是一个类似于Jupyter Notebook的开发界面。

    Step3 新建一个Python3的Notebook

    后面所有操作和Jupyter Notebook一样。

    Step4 在新建的Notebook中写入代码

    获取指数数据函数

    导入所需要用到的库

    import pandas as pd
    import matplotlib.pyplot as plt
    

    定义获取指数数据的函数

    # 获取股票数据函数
    def get_stock_data(code, start_date, end_date):
        """
        :param code: 需要获取数据的指数代码,注意使用的是上交所的指数代码
        :param start_date: 开始获取数据的日期
        :param end_date: 结束获取数据的日期
        :return: 返回从开始到结束日期每天的指数数据
        """
        df = get_price(code+'.XSHG', start_date=start_date, end_date=end_date, frequency='daily') 
        df = df.dropna()    # 删除缺失值
        df.to_csv(code+'.csv')    # 保存为csv格式
        return df
    

    获取指数数据示例

    # 获取沪深300指数,从2005年4月8日开始到2019年4月20日结束的日级交易数据
    df300 = get_stock_data(code='000300', start_date='2005-04-08', end_date='2019-04-20')
    df300
    

    运行结果:


    沪深300指数

    运行代码之后返回到Jupyter Notebook的主页,就能看到保存的000300.csv文件,可以下载到本地进行操作,也可以直接在聚宽的研究环境中进行操作。

    下载csv文件

    数据探索

    先对我们获取到的沪深300指数数据进行一番了解,方便后续分析。
    查看沪深300指数的总体信息

    df300.info()
    
    沪深300info

    查看沪深300指数收盘价的大体情况

    df300['close'].describe()
    
    沪深300收盘价describe.png

    查看沪深300指数的历史走势图

    # 设置参数,将图形格式设置为‘svg’,能够输出更加清晰的图
    %config InlineBackend.figure_format = 'svg'
    
    # 建立画布
    fig = plt.figure(figsize = (12,6))
    
    # 用收盘价绘制折线图
    plt.plot(df300.index, df300['close'])
    
    沪深300指数历史走势图

    找出收盘价极大值点的函数

    # 筛选出指数价格的极大值点
    def find_max(stock_data, start_date, end_date):
        """
        :param stock_data: 需要筛选出极大值点的指数数据
        :param start_date: 筛选范围的开始日期
        :param end_date: 筛选范围的结束日期
        :return:返回极大值点对应当天数据
        """
        max_price = stock_data[start_date:end_date]['close'].max()    # 极大值点的收盘价
        return stock_data[stock_data['close'] == max_price]    # 极大值点对应当天数据
    

    找出沪深300指数收盘价极大值点的示例
    从上面的沪深300的历史价格走势图可以看出,在2008年左右有一个价格的顶峰,接下来找出具体那一天的数据。

    # 筛选出沪深300指数2007-2009年的极大值点对应当天的数据
    find_max(df300, '2007/1/1', '2009/1/1')
    
    沪深300指数的一个极大值点

    数据分析

    高点定投,能否盈利?

    按月自动定投函数

    # 按月定投函数
    def auto_invest_monthly(stock_data, start_date, end_date):
        """
        :param stock_data: 需要定投的指数数据
        :param start_date: 开始定投的日期
        :param end_date: 结束定投的日期
        :return: 返回从开始定投到结束每天的资金数据
        """
        # 截取股票数据
        stock_data = stock_data[start_date:end_date]
        
        # 修改stock_data的index的数据类型,这样才能和temp进行合并
        stock_data.index = stock_data.index.astype('period[D]')
    
        # 每月第一个交易日定投
        buy_month = stock_data.resample('M', kind='period').first()
    
        # 定投购买指数基金
        trade_log = pd.DataFrame(index=buy_month.index)
        trade_log['基金净值'] = buy_month['close'] / 1000    # 将收盘价除以1000作为基金净值
        trade_log['定投资金'] = 1000    # 每月投入1000元申购该指数基金
        trade_log['基金份额'] = trade_log['定投资金'] / trade_log['基金净值']    # 买入份额等于买入金额除以基金净值
        trade_log['持有份额'] = trade_log['基金份额'].cumsum()    # 累计申购份额
        trade_log['累计投入'] = trade_log['定投资金'].cumsum()    # 累计投入金额
        
        temp = trade_log.resample('D').ffill()    # 将交易记录填充为日级数据
        
        # 计算每个交易日的资产(等于当天的基金份额乘以单位基金净值)
        daily_data = pd.merge(stock_data, temp, left_index=True, right_index=True, how='left')
        daily_data = daily_data[['close', '定投资金', '基金份额', '持有份额', '累计投入']]
        daily_data['基金净值'] = daily_data['close'] / 1000
        daily_data['持有基金价值'] = daily_data['基金净值'] * daily_data['持有份额']
        
        # 将daily_data的index修改为datetime类型,否则无法使用matplotlib绘图
        daily_data.index = daily_data.index.astype('datetime64')
    
        return daily_data
    

    按月自动定投示例

    假设投资者运气非常糟糕,从2007年10月16的沪深300指数历史最高点5877开始定投,一直定投到2009年7月末,此时沪深300指数跌至3734点,几乎腰斩。

    # 每月定投沪深300指数
    df300m = auto_invest_monthly(df300, '2007/10/16', '2009/7/31')
    df300m
    
    月定投沪深300指数

    按月定投沪深300指数数据可视化

    # 建立画布
    fig = plt.figure(figsize = (12,6))
    
    # 绘制主坐标轴图表
    plt.plot(dfm.index, dfm['close'], linestyle='dotted', label="沪深300指数")
    
    plt.legend(loc='upper left')    # 设置主坐标轴图表的图例
    
    # 调用twinx方法
    plt.twinx()
    
    # 使用次坐标轴
    plt.plot(dfm.index, dfm['累计投入'], label="累计投入资金")
    plt.plot(dfm.index, dfm['持有基金价值'])
    
    plt.legend(loc='upper right')    # 设置次坐标轴图表的图例
    
    月定投沪深300指数走势图

    从上面的图片可以看出,即使是在如此极端的情况下,投资者也能在大概2009年的五六月份开始获得收益。

    周定投PK月定投?

    周定投

    按周自动定投函数

    # 按周定投函数
    def auto_invest_weekly(stock_data, start_date, end_date):
        """
        :param stock_data: 需要定投的指数数据
        :param start_date: 开始定投的日期
        :param end_date: 结束定投的日期
        :return: 返回从开始定投到结束每天的资金数据
        """
        # 截取股票数据
        stock_data = stock_data[start_date:end_date]
        
        # 修改stock_data的index的数据类型,这样才能和temp进行合并
        stock_data.index = stock_data.index.astype('period[D]')
    
        # 每周第一个交易日定投,如果整周都是休息日,则跳过本周
        buy_week = df.resample('w', kind='period').first().dropna()
    
        # 定投购买指数基金
        trade_log = pd.DataFrame(index=buy_week.index)
        trade_log['基金净值'] = buy_week['close'] / 1000    # 将收盘价除以1000作为基金净值
        trade_log['定投资金'] = 250    # 每周投入250元申购该指数基金
        trade_log['基金份额'] = trade_log['定投资金'] / trade_log['基金净值']    # 买入份额等于买入金额除以基金净值
        trade_log['持有份额'] = trade_log['基金份额'].cumsum()    # 累计申购份额
        trade_log['累计投入'] = trade_log['定投资金'].cumsum()    # 累计投入金额
        
        temp = trade_log.resample('D').ffill()    # 将交易记录填充为日级数据
        
        # 计算每个交易日的资产(等于当天的基金份额乘以单位基金净值)
        daily_data = pd.merge(stock_data, temp, left_index=True, right_index=True, how='left')
        daily_data = daily_data[['close', '定投资金', '基金份额', '持有份额', '累计投入']]
        daily_data['基金净值'] = daily_data['close'] / 1000
        daily_data['持有基金价值'] = daily_data['基金净值'] * daily_data['持有份额']
        
        # 将daily_data的index修改为datetime类型,否则无法使用matplotlib绘图
        daily_data.index = daily_data.index.astype('datetime64')
    
        return daily_data
    

    按周自动定投示例

    # 每周定投沪深300指数
    df300w = auto_invest_weekly(df300, '2007/10/16', '2009/7/31')
    df300w
    
    周定投沪深300指数走势图

    周定投PK月定投函数

    # 按周定投vs按月定投
    def weekly_pk_monthly(dfw, dfm):
        """
        :param dfw: 周定投函数返回的数据
        :param dfm: 月定投函数返回的数据
        :return: 返回周定投和月定投的收益率
        """
        temp = pd.merge(dfw[['累计投入', '持有基金价值']], dfm[['累计投入', '持有基金价值']], left_index=True, right_index=True)
        dfvs = pd.DataFrame(index=temp.index)
    
        dfvs['周定投累计投入'] = temp['累计投入_x']
        dfvs['周定投基金价值'] = temp['持有基金价值_x']
        dfvs['周定投收益率'] = (dfvs['周定投基金价值']-dfvs['周定投累计投入']) / dfvs['周定投累计投入']
    
        dfvs['月定投累计投入'] = temp['累计投入_y']
        dfvs['月定投基金价值'] = temp['持有基金价值_y']
        dfvs['月定投收益率'] = (dfvs['月定投基金价值']-dfvs['月定投累计投入']) / dfvs['月定投累计投入']
        
        return dfvs
    

    周定投PK月定投示例

    dfvs = weekly_pk_monthly(df300w, df300m)
    dfvs.head()
    
    周定投pk月定投

    将周定投和月定投的收益率绘制成曲线:


    周定投&月定投的收益率曲线

    从图中可以明显的看出,虽然周定投的收益率和月定投的收益率差距不大,但是在大多数情况下,周定投的收益率还是明显优于月定投到的收益率的。

    得出结果

    从上面的数据分析过程,我们已经可以回答文章开头提出的两个问题:

    1. 即使投资者是从最高点开始定投,只要有足够的耐心,最终依然能够获得盈利。
    2. 周定投大概率比月定投能获得更好的收益,但两者区别不大,特别是当投资时间拉长时,两者的差距会越来越小。

    后续如果能够获得指数的基本面数据,比如PE,那么将能进行更为深入的分析。

    注意:本文并不构成任何投资建议,投资有风险,入市需谨慎。

    相关文章

      网友评论

        本文标题:用Python验证指数基金定投策略

        本文链接:https://www.haomeiwen.com/subject/dpzyoqtx.html