IPO之AI炼金术

作者: 24dad4e49e4f | 来源:发表于2018-05-17 00:21 被阅读2次
ipoai.png

注:题图来自banter.fun[1]。

最近这一年,AI非常火爆,从智能音响[2]到自动驾驶[3],席卷全球。那么作为投资者,职业病犯了,投资如何和AI结合起来,如何实践操作呢?目前来看,智能投顾[4]可能看起来是比较接近的。但是能否打败市场,还是需要时间来检验的。美股人工智能ETF[5]已经上线了,可以投资了。

但是就个人投资者而言,这些的对于投资策略的帮助可能不是特别大。笔者最近研究发现,有一个投资场景也许比较有前景。那就是IPO打新。

IPO打新,这里面机会也许比较吸引人,理由如下:

  1. 涉及的因素比较多,因素种类也许有几十种。例如股东,发售股份量,行业,估值,同行对标,财务指标,大市情绪等等。人工来判断,容易丢三落四,不容易全面考虑。
  2. 新股的波动性往往比较强,根本原因在于新股无论市值大小,关注度都是比同规模的其他股票要高出很多的。注意力就是机会,更多的注意力就是更大的机会。
  3. 获利周期性比较,一般从新股认购到上市也就两周左右的时间,甚至更快。这种资金利用率角度来讲,也许是更加高效的。
  4. 专业IPO打新的团队获利都不错,这也就证明了这个方向是没问题的。也间接证明了存在可行,可持续稳定盈利的打新策略。
  5. 对于某些投资者,比如笔者,不太愿意天天盯盘,不愿意让心情随着市值的波动而波动。对,就是这样心累。

接下来,就动手开始搞,大概分几个步骤:

数据收集

数据收集,包括了原始数据收集以及辅助数据收集。原始数据包括IPO文件等。IPO文件来源均以港交所为准。港交所在新股开始募股的时候会上传招股书[6]。辅助数据包括当时的申购情况,超额认购倍数,中签率,大市的气氛如何等等。这些数据需要全部量化,便于后续计算。

需要指出的是在特征筛选之前的数据清洗也是很重要的,因为原始数据的总是有这样或那样的不完整,残缺或者错误。缺失的数据处理需要谨慎,目的在用不能因为这个缺失值引起模型效果的巨大差异。另外不同特征的数值量纲也不一样,不存在可比性,因此需要无量纲化。

特征筛选

这只新股的属性有很多,列举出几十种没有一点难度。据说业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已[7]。足以看出特征选择的重要性[8]。当特征的数量比较多时,穷举就不太实际了,因为需要穷举的集合太多了。

模型选择

一旦确定了特征集合,选择模型就比较关键了。不同模型的差异之大,可以用天上地下来形容。好在有牛人画了一张选择模型的指导图[9],这样大家大概率就不会迷路了。针对本次IPO数据,数据量只有几百条,又是预测涨跌幅,于是就是回归问题了。那么选择RidgeRegression即可。不过,考虑到神经网络并没有出现在这个指导图里,因此,神经网络作为一个后备方案。神经网络和RidgeRegression的效果哪个好就用哪个。

笔者看到一篇文章[10]中提到多因子建模,似乎也有一点希望。毕竟这个多因子模型在赛马上应用成功。

参数调整

这个环节比较重要的是虽然希望能提高正确率,但是也不是越高越好。过高的准确率带来一个潜在的风险,即过拟合风险。这个风险会导致模型的迁移性不好,即过度贴合测试数据,泛化性能不好。导致在数据集上测试效果很好,实战时就被坑了。参数调整也是一个学问,如何调,如何有目的地调,是非常有讲究的。

实战验证

最好对于模型预测的结果,是否可以解释,这个不一定。谷歌的AlphaGo的棋艺在其他人看来,也许根本理解不了,但是这并不防碍它基本围棋世界冠军。实战验证的时间预计至少需要一年以上,因为这里涉及到比较多的步骤,各个环节都可能出错。不同环节出错暴漏的明显程度不同,时间太短容易仅仅把容易暴露的问题解决,而把其他不容易暴露的问题,也许更加重要的问题隐藏了。

总的来说,IPO打新这个场景,是存在AI算法去发现IPO打新的默认规则,在统计大概率的情况下,尝试获得稳定可观的收益回报。这就是AI炼金术。

参考资料

  1. Banter Fun https://banter.fun/7-reasons-to-attend-5th-world-machine-learning-and-deep-learning-congress-in-dubai

  2. 小爱音响 https://www.mi.com/aispeaker/

  3. Waymo https://waymo.com/

  4. 金融业的AI场景 https://zhuanlan.zhihu.com/p/33389870

  5. 人工智能ETF https://wallstreetcn.com/articles/3061131

  6. 港交所披露易 http://www.hkexnews.hk/listedco/listconews/mainindex/SEHK_LISTEDCO_DATETIME_TODAY_C.HTM

  7. 特征选择的工程方法 https://www.zhihu.com/question/28641663

  8. Machine Learning Cheat Sheet https://findcareerinfo.com/cheat-sheets-machine-learning-deep-learning-ai-data-science-maths-sql/

  9. 赛马赢了10亿美金 http://www.gelonghui.com/p/179686

  10. Feature Engineering https://elitedatascience.com/feature-engineering-best-practices

相关文章

网友评论

    本文标题:IPO之AI炼金术

    本文链接:https://www.haomeiwen.com/subject/lsjvdftx.html