“ 预测,就是数据领域的圣杯。
没几个人见过真货,
但这不妨碍我们努力追寻。 ”
文:屠夫1868
欢迎关注:基业长红1868
= 欢迎关注 · 收藏 · 分享 =
转载需获本人授权,并注明作者和出处
现在早已是大数据时代。
在企业、在职场【让数据说话】的情况越来越普遍。甚至数据驱动决策、用数据挖掘新需求一类更“高大上”的数据用法,也正在渐渐普及。
投资领域对数据的依赖,更深。
【基业长红1868】就有好几篇数据相关文章:
数据可视化的《2018 · 大数据》;
蒙特卡洛模拟的“硬币赌博三部曲”;
人工智能的《机器学习 · 聚类分析》……
但如《宽客人生》的作者德曼教授所说,“数据不能自言其身”。
许多人即便知道要用数据,却不知从何下手。
今天,屠夫就来聊聊这个话题:
让数据说话,你说对了吗?
01:让数据说话,怎么说?
金融,可能是数据运用为普及的行业。
从财务报表到量化策略,都离不开数据的支持。哪怕是追涨杀跌的小韭菜,也要看看K线图吧?
之前曾有球友提问:
如何在投资中运用数据?
屠夫当时做了简略的回答,后来仔细归纳了一下,发现无非是4种用法:
【预测】根据历史数据推断未来;
【启发】从数据引发猜想和假设;
【验证】构造数据试验验证想法;
【评估】通过数据对比形成判断。
这4种用法分别可以用四个单词表示,首字母连起来正好是:F.I.V.E.
F = Forecasting 预测
I = Inspiring 启发
V = Validating 验证
E = Evaluating 评估
下面,屠夫将逐个介绍。
02:F · 预测
预测,可能是对数据运用的最高级形态。
著名宽客、《宽客人生》作者伊曼纽尔·德曼如是说:
任何领域内寻找科学规律背后的目的是什么?
很明显,是预测——
预测未来,并掌控未来。
所有对数据的运用,其最终目的都是预测。
从数据获得【启发】,最终要用于预测;
构造试验进行【验证】,最终要用于预测;
对比数据进行【评估】,最终还是希望预测……
但是预测,是最难的事。
因果倒置、强加因果、以偏概全……《逻辑要义》里大部分错误,都与预测相关。
提升预测准确性,是个大的话题,屠夫今天先不做展开。
大家记住一件事就好:
预测,就是数据领域的圣杯。
没几个人见过真货,
但这不妨碍我们努力追寻。
03:I · 启发
预测不是凭空而来的,其起点往往是F.I.V.E中的后三者。
所谓启发,也可以理解为“获得灵感”和“总结规律”。
屠夫向来推荐指数基金,尤其是宽基指数(如标普500、沪深300);
因为这类指数呈现出长期上涨的【规律】,而且是经过验证的
——无论过程有多曲折,每一轮的“底部”必定比前一次的高。
标普500最近15年走势(来源:新浪财经) 沪深300最近17年走势(来源:新浪财经)运用数据找出规律,通常会借助“可视化”这一工具;以更直观的方式看数据,也更容易找规律。
【启发】式的数据用法,通常都是“数据 - 可视化 - 提出假设”的套路。
《一梦十二年》的南丁格尔玫瑰图、《2018 · 大数据》的结对散点图、小提琴图等,皆是如此。
但是,“启发”只是帮助我们提出假设;
由此总结出来的所谓“规律”,有可能只是巧合。
这时候,就需要使用数据进行“验证”了。
04:V · 验证
提出假设和想法后,构造试验进行测试和修正,就是数据的【验证】用法。
屠夫的“硬币赌博三部曲”使用的蒙特卡洛模拟,就是验证式用法的常规套路。
尤其是《完结篇》这种超级反直觉的结论,即便有严谨的数学证明,使用海量数据构造试验,可以加深我们的理解。
蒙特卡洛模拟的应用非常广泛,甚至圆周率和微积分的计算,都有蒙特卡洛模拟解法。
但是大家千万别以为,验证式用法就是“玩数据游戏”。
验证的过程中逐步修正和完善自己的想法,这是【验证】式用法最宝贵的地方。
比如量化分析师通过程序导入历史数据进行回测,在此过程中可以不断优化量化策略;
又比如,屠夫在《机器学习 · 聚类分析》中运用人工智能,将35种资产“一一对应”的相关性分析拓展为“自动分类”,可以更精准地挑选配置的资产。
不过,“验证”的天花板是“absence of evidence”
——“没有证据证明您有癌症”和“有证据证明您没有癌症”,不是一码事。
(感兴趣的同学可以看看《不靠预测盈利》中的详细解释)
所以,通过验证的结论,也无法保证未来一定对。
05:E · 评估
看过《选股择时的纵与横》的同学应该记得【纵向对比】和【横向对比】。
通过对比判别当前状况,就是对数据的“评估”式应用。
事实上,生活中运用数据进行评估的例子非常多:
今年a数据同比增长x%,环比增长y%……
本周b数据创下了历史新高……
当前c数据超过了z,处在十年低位……
数据的“评估”式用法,实际上是将历史数据构造出一个框架,再将新的数据放进框架之中,看看处在什么位置。
这是非常安全的一种用法,但是局限性也很明显——
史上未有过的极端情况,会成为你的“黑天鹅”。
大家想想看,所有的历史记录,必然是突破了之前的记录,才成为历史记录的。
“史上最高”出现之前,必然有另一个“最高”;
后来的“最高”是突破了原有的框架,才成为“史上最高”。
也正因为这样,屠夫在运用数据进行评估时一定会放大框架:
把史上最低再往下拉低x%,
把史上最高再往上抬高y%,
给自己留出安全边际。
永远要假设会出错——
错的不是数据,而是自己。
以上就是屠夫总结的数据4用法,希望能给大家一点启发。
无论工作还是投资,假如你要让数据说话,不妨从F.I.V.E.考虑起。
[ 作者简介 ]
屠夫1868,一个秉持价值理念、专攻资产配置、追求财务自由的量化投基者。
更多投资思考、心得分享和「半天候资产配置」在【基业长红1868】更新,欢迎关注。
网友评论