Alhpa 模型的实质是通过找到因子或因子组合与未来收益率之间的关系,从而训
练出较为稳定的收益预测函数,选取优质个股组合。例如,通常用的线性回归模
型就是通过线性回归系数将因子映射到收益率上,从而筛选优质个股,但是其问
题在于,长期来看,多数因子与收益率之间往往不存在稳定线性关系,甚至单调
性也不能保证,所以线性模型的前提条件往往不能满足。个股分类的方法实际是
将连续函数离散化,放松了对模型的限制,只要满足分类组合的加权平均收益有
较高的区分度便可以达到模型的目的。在金融领域广泛应用的逻辑回归便是一种
良好的分类模型,虽然因子之间仍然是线性叠加,但是输出结果却是分类的概率,
因此,它可以作为向高阶分类方法的过度的参照物。更进一步的离散化可以将因
子也分组归类,找出因子分组与未来收益分组之间的关系,进一步放松对模型的
限制。下面,我们以动量因子为例,阐述因子到收益的映射过程。如图2 所示,
图中很难直观看出单个动量因子对未来收益的关系,线性拟合在长训练序列中虽
然可能得到显著系数,但由于非线性或非单调性造成的预测误差也十分明显。相
对而言,二元分类法的输出是分类概率,我们希望通过概率大小分组,构造组合
证券研究报告
请务必阅读正文后免责条款部分 8
收益具有良好区分度的组合。另外,对因子进行分组也省去了回归方法中对原始
因子数据的标准化、去极值等过程。我们的分组方法是对训练序列每一期的横截
面数据进行分组,使得不同时期数据具有可比性。与原始因子数据类似,分类本
身并不会影响因子与未来收益之间的内在关系如图2 中第三个子图所示。分组数
据之后会通过模型训练得到因子分位值与决策函数之间的关系图2 中第四子图
所示。最后,通过决策函数结果筛选优质个股,而图2 中第五子图是决策函数对
应未来收益的散点图,其线性关系明显提高。另外,值得注意的是,对比图3 中
第四子图所示(逻辑回归结果)的因子分组均值和收益之间的关系,AdaBoost
算法所示结果具有明显的非线性拟合能力,这也是该算法的突出优点之一。逻辑
回归是将因子与决策函数强制定义为对数线性,但在图中所示的结果中,效果要
弱于AdaBoost 算法。



米筐量化交易平台:http://www.ricequant.com
量化炒股QQ群:484490463 群内大神每日在线讲解代码,用Python自动赚钱!
网友评论