“对于资产配置来说,相关性分析是重中之重。”
文:屠夫1868
欢迎关注:基业长红1868
= 欢迎关注 · 收藏 · 分享 =
转载需获本人授权,并注明作者和出处
*于2018年12月、2019年1月首发于雪球,本文为合集,有修改
2018年的最后一个交易日已经过去,又是雪球上充斥各种年终总结的时间。
无论各位的投资收益是好是坏,都已经过去了,咱们还是要往前看。
年末了,屠夫整理了一些有用的图表,希望为各位提供一点参考。
对于资产配置来说,相关性分析是重中之重。
尤其是希望“分散配置”、“对冲风险”的同学来说,如果错误地买入多个正相关的资产,那就南辕北辙了。
上次屠夫在《资产配置 · 聚类分析》一文用技术的方法进行了聚类和相关性可视化。
可毕竟依赖AI完成了计算和分析,数据的表现上不够直观透明。
这次就拿最原始的价格数据,用结对散点图、小提琴图和相关性热图等方式,向大家呈现。
老样子,38种资产全部取收盘价,获取数据最多追溯到365*13天。大宗商品类价格数据来自新浪API,其他指数数据来自雪球API。
由于Azure Notebooks的图表不支持中文,部分指数名称使用了拼音,请见谅。
01 十年资产价格 · 结对散点图 · Pair Plot
散点图是最简单粗暴的原始数据展现,原汁原味不带任何分析。对任何分析持有怀疑态度的同学,不妨从这种原始数据散点图看起。
所谓结对散点图,就是把多个变量两两结对,分别作为x轴和y轴展现。
为了便于讲解,这里使用5个指数的缩小版结对图。
点击本文底部的【阅读原文】,可以下载完整版(38种资产)。
1-1 单色结对图
上图展示了沪深300、恒生指数、标普500、NYMEX原油和COMEX黄金这5种资产的价格分布。
【1】位于对角线的5张核密度图,展示的是单一资产在十年范围内的价格分布。
比如COMEX黄金在这十年里,主要集中在1200美元(金价)左右波动,是比较明显的正态分布。
而标普500则呈现出1000点和2000点的双峰分布,并不是我们想当然认为的正态分布。
【2】处于右上方的10张散点图,展示的是十年范围内,每一天的两两资产价格分布。
比如第2行第3列的图,呈现的是恒生指数和标普500指数的价格分布,呈现出明显的正相关关系——恒生指数走高(散点靠右)时,标普500往往也走高(散点靠上)。
散点图可以展现相关关系,无法透视因果关系。
所以大家不必纠结到底谁是因、谁是果——图上没说。
【3】处在左下方的10张核密度图(KDE),展示的是十年范围内,每一天的两两资产价格分布。
认真的同学会发现,上面的5*5共25张图其实是沿对角线对称的,第2行第3列的图和第3行第2列的图等价。
因为核密度是经过计算的,从图形角度来说跟散点图几乎等价,只是换一种呈现形式。
1-2 彩色结对图
上图展示了沪深300、恒生指数、标普500、NYMEX原油和COMEX黄金这5种资产的价格分布,按年份用三种不同的颜色进行区分。
蓝色表示的是2009~2011年的数据,橙色是2012~2015年的数据,绿色是2015年~2019年2月3日的数据。
之所以划分不同时间段,是考虑到股市周期的问题。
其实上面的划分也只是粗略地将十年等分开来,毕竟不同市场牛熊周期有别,这个信息是有意义的。
比如第1行第2列的图,展示的是沪深300指数和恒生指数的十年价格分布。
虽然在单色散点图里看不出明显的关系,但是划分了时间段后,可以看出,两者在2009~2011,2015~至今两个时间段里都呈现明显的正相关关系,只是2012~2015年脱节。
回想一下,2012~2015年间,正好经历了上一轮A股疯牛、港股低迷。而回到2015年以后,两者的相关性似乎又强了起来。
02 十年资产价格 · 小提琴图 · Violin Plot
忽略时间维度,仅看期间的价格分布,小提琴图可以直观地展示资产和指数价格的分布区间。
小提琴图展示概率密度函数,频率越高则图形越宽。
中心轴上的黑色粗线其实是箱线图,展示中位数和四分位数。
2-1 原始收盘价分布
2-2 归一化后的收盘价分布
归一化的详细介绍可以参考《资产配置 · 聚类分析》。
总的来说,归一化可以化解掉量纲差别,更容易看出不同资产的分布规律。
03 十年资产价格 · 相关性热图 · Heat Map
使用Pearson方法计算相关性,红正蓝负,深强浅弱。详细介绍见《资产配置 · 聚类分析》。
比如:
- 上证50和上证180对应的格子为深红色,这两个指数呈高度正相关,重复配置不能分散风险。
- 上证50和国债指数对应的格子为浅红色,这两个指数呈轻度正相关,风险分散效果有限。
- 上证50与黄金对应的格子为浅蓝色,呈现负相关或无关,两者组合可以起到风险对冲作用。
对于第2个例子,达利欧已经解释过“股债平衡对冲风险只是错觉”,屠夫不重复解释了,不认同的同学直接找达利欧理论去。
3-1 相关性热图
3-2 相关性热图:层次聚类版
与上图等效,只是按层次聚类结果重新排列。
3-3 计算相关性所使用数据量的热图
再次提醒:点击【阅读原文】可以下载完整版38种资产的结对散点图哦。
***
你可能还喜欢
***
[ 作者简介 ]
屠夫1868,结合价值理念和量化工具的指数投基者。
更多投资思考、心得分享和「半天候资产配置」在【基业长红1868】更新,欢迎关注。
网友评论