金融场景结合“新且多元”的大数据实践应用,最具有幽默感的案例之一,就是本世纪初几名美国有线电视新闻网(CNN)财经记者,对时任美联储主席格林斯潘的公文包厚度和联储加息相关性研究的分析报道。他们发现了一个规律,但凡格林斯潘的公文包是鼓的,很厚,联储当日或者当季的加息决定可能性就很大,从而会影响一系列市场金融产品的价格和大盘走势。这一指标,后来也被学界定义为“格林斯潘公文包”指标。它突破了当时研究美国股票市场溢价因子和利率市场期限结构对传统数据源的依赖思维,而且研究成果也具备相当的说服力和显著性。
再例如美国诺特丹大学著名华人学者笪治、高芃杰以及约瑟夫三位教授,在2010年发表在国际顶级金融研究学术期刊上的文章,就将金融资产定价理论研究结合了谷歌互联网搜索热度指数,并且成功验证了二者之间有效关系的显著性。笪治教授将社会大众对于在美国证券交易所上市的股票(罗素3000指成分股)在谷歌上的搜索频率做成了“热搜指数”(SVI),通过统计回归,发现“热搜指数”不仅仅对预测股票在短期内高额回报有相当大的显著性,对于股票长期的价值回归也具备统计有效的预判性,他们的究结果同时也适用于新上市的次新股。
与此类似,我和同事发表在2018年金融研究评论(The Review of Financial Studies) 的文章,将新闻报道的历史文本数据做成了“舆情指标”,并且通过研究发现了市场化运作的财经媒体所报道的“舆情指标”,对于中国上市公司的股票回报率和高管层替换等重大事件都具有显著且有效的相关性。
“新且多元”的大数据,目前不仅仅成为了金融研究理论突破的重要资源,对于不同场景中的金融实践,也开始慢慢承担起了商业战略决策不可或缺的论证依据。
美国华尔街日报在2014年的一篇报道中介绍了一家高科技数据分析公司,该公司专门向金融市场和机构提供各种各样的另类数据和分析报告,并帮助用户通过这些报告在金融市场实践操作中获取了不菲的投资回报。他们提供的数据和应用场景,包括通过商业卫星对地球测绘扫描的图像,获得零售业巨头沃尔玛实体店门口停车场占用率数据,并且将该数据时间序列化后比对过往沃尔玛公司的盈利情况,从而能主动预测下一季度沃尔玛公司的财务公告。同时他们建议投资者根据结论提前交易布局,获得盈利。再者,同样是利用卫星的地球测绘光谱成像数据,获得美国农业产区各类农产品生长要素(水源,气候,灾害等)的变化数据,根据数据来判断农产品现货市场的真实供需关系,帮助贸易商和期货投资者交易决策做出科学判断。
大数据对金融监管和风险防范的应用,也不断地刷新着人们思想创新意识的边界高度。
大数据征信技术就是当前在金融监管领域属于前瞻性的课题。传统的征信模型往往依赖的数据源比较单一,除了个人在不同商业银行过往的贷款信用记录,就是一些水、电、煤气、网络或者手机的欠费记录。这些数据不能完整地表现出企业或者个人的信用曲线,依据这些数据所做的征信结论,往往偏向事后风险管理,对事前、事中的风控指导意义并不是很大。
但是如果可以引进能从不同角度反应企业或者个人的“新且多元”的大数据,则能给整个征信工作带来全新的改变。例如,很多征信模型开始引入社交软件的通讯数据,模型将根据用户平时社交聊天的关键词,来判断一个人对于诚信问题的态度,同时结合各种媒体过往的文本信息,去系统性追溯被征信人过去是否在不同城市和地点有过信用污点的报道和司法纠纷(中国目前对个人出境旅游是否产生有损国格的行为以及乘坐高铁是否有影响行车安全的记录,都是以文本信息的形式存在),最后人脸数据和识别技术可以帮助金融机构科学地判断拟授信人和被征信人是否一致等。这样大数据征信,不仅可以帮助金融监管机构动态地掌握被征信人实时信用状况,同时也把征信工作从事后风险管理,推向了事前、事中的风险预防,从而大幅度降低整体社会的金融风险。
网友评论