美文网首页投基取巧读书
大数据 · 38种资产的10年相关性透视

大数据 · 38种资产的10年相关性透视

作者: 屠夫1868 | 来源:发表于2019-05-21 06:37 被阅读3次

对于资产配置来说,相关性分析是重中之重。

文:屠夫1868

欢迎关注:基业长红1868

= 欢迎关注 · 收藏 · 分享 =

转载需获本人授权,并注明作者和出处

【原文地址】https://mp.weixin.qq.com/s?__biz=Mzg5ODE4NjYyMQ==&mid=2247483787&idx=1&sn=5389de73a5da65de51d2e1ac858c4b4c&chksm=c0672d99f710a48f1c27de58d60505dc61c81f5b3342ec3f24500969fcb580cbbbc3f40f726c#rd

*于2018年12月、2019年1月首发于雪球,本文为合集,有修改

2018年的最后一个交易日已经过去,又是雪球上充斥各种年终总结的时间。

无论各位的投资收益是好是坏,都已经过去了,咱们还是要往前看。

年末了,屠夫整理了一些有用的图表,希望为各位提供一点参考。

对于资产配置来说,相关性分析是重中之重。

尤其是希望“分散配置”、“对冲风险”的同学来说,如果错误地买入多个正相关的资产,那就南辕北辙了。

上次屠夫在《资产配置 · 聚类分析》一文用技术的方法进行了聚类和相关性可视化。

可毕竟依赖AI完成了计算和分析,数据的表现上不够直观透明。

这次就拿最原始的价格数据,用结对散点图、小提琴图和相关性热图等方式,向大家呈现。

老样子,38种资产全部取收盘价,获取数据最多追溯到365*13天。大宗商品类价格数据来自新浪API,其他指数数据来自雪球API。

由于Azure Notebooks的图表不支持中文,部分指数名称使用了拼音,请见谅。

01  十年资产价格 · 结对散点图 · Pair Plot

散点图是最简单粗暴的原始数据展现,原汁原味不带任何分析。对任何分析持有怀疑态度的同学,不妨从这种原始数据散点图看起。

所谓结对散点图,就是把多个变量两两结对,分别作为x轴和y轴展现。

为了便于讲解,这里使用5个指数的缩小版结对图。

点击本文底部的【阅读原文】,可以下载完整版(38种资产)。

1-1 单色结对图

上图展示了沪深300、恒生指数、标普500、NYMEX原油和COMEX黄金这5种资产的价格分布。

【1】位于对角线的5张核密度图,展示的是单一资产在十年范围内的价格分布。

比如COMEX黄金在这十年里,主要集中在1200美元(金价)左右波动,是比较明显的正态分布

而标普500则呈现出1000点和2000点的双峰分布并不是我们想当然认为的正态分布。

【2】处于右上方的10张散点图,展示的是十年范围内,每一天的两两资产价格分布。

比如第2行第3列的图,呈现的是恒生指数和标普500指数的价格分布,呈现出明显的正相关关系——恒生指数走高(散点靠右)时,标普500往往也走高(散点靠上)。

散点图可以展现相关关系,无法透视因果关系

所以大家不必纠结到底谁是因、谁是果——图上没说。

【3】处在左下方的10张核密度图(KDE),展示的是十年范围内,每一天的两两资产价格分布。

认真的同学会发现,上面的5*5共25张图其实是沿对角线对称的,第2行第3列的图和第3行第2列的图等价。

因为核密度是经过计算的,从图形角度来说跟散点图几乎等价,只是换一种呈现形式。

1-2 彩色结对图

上图展示了沪深300、恒生指数、标普500、NYMEX原油和COMEX黄金这5种资产的价格分布,按年份用三种不同的颜色进行区分。

蓝色表示的是2009~2011年的数据,橙色是2012~2015年的数据,绿色是2015年~2019年2月3日的数据。

之所以划分不同时间段,是考虑到股市周期的问题。

其实上面的划分也只是粗略地将十年等分开来,毕竟不同市场牛熊周期有别,这个信息是有意义的。

比如第1行第2列的图,展示的是沪深300指数和恒生指数的十年价格分布。

虽然在单色散点图里看不出明显的关系,但是划分了时间段后,可以看出,两者在2009~2011,2015~至今两个时间段里都呈现明显的正相关关系,只是2012~2015年脱节

回想一下,2012~2015年间,正好经历了上一轮A股疯牛、港股低迷。而回到2015年以后,两者的相关性似乎又强了起来。

02  十年资产价格 · 小提琴图 · Violin Plot

忽略时间维度,仅看期间的价格分布,小提琴图可以直观地展示资产和指数价格的分布区间。

小提琴图展示概率密度函数,频率越高则图形越宽。

中心轴上的黑色粗线其实是箱线图,展示中位数和四分位数。

2-1 原始收盘价分布

2-2 归一化后的收盘价分布

归一化的详细介绍可以参考《资产配置 · 聚类分析》。

总的来说,归一化可以化解掉量纲差别,更容易看出不同资产的分布规律。

03  十年资产价格 · 相关性热图 · Heat Map

使用Pearson方法计算相关性,红正蓝负,深强浅弱。详细介绍见《资产配置 · 聚类分析》。 

比如:

- 上证50和上证180对应的格子为深红色,这两个指数呈高度正相关,重复配置不能分散风险

- 上证50和国债指数对应的格子为浅红色,这两个指数呈轻度正相关风险分散效果有限

- 上证50与黄金对应的格子为浅蓝色,呈现负相关或无关,两者组合可以起到风险对冲作用

对于第2个例子,达利欧已经解释过“股债平衡对冲风险只是错觉”,屠夫不重复解释了,不认同的同学直接找达利欧理论去。

3-1 相关性热图

3-2 相关性热图:层次聚类版

与上图等效,只是按层次聚类结果重新排列。

3-3 计算相关性所使用数据量的热图

再次提醒:点击【阅读原文】可以下载完整版38种资产的结对散点图哦。

***

你可能还喜欢

***

不靠预测盈利:另一种角度看投资

资产配置:35种指数相关性和聚类分析的机器学习实验

人性难移,周期不息:霍华德·马克斯的《周期》

[ 作者简介 ]

屠夫1868,结合价值理念和量化工具的指数投基者。

更多投资思考、心得分享和「半天候资产配置」在【基业长红1868】更新,欢迎关注。

相关文章

  • 你好,数据透视表——小白聊财务(4)

    你好,数据透视表你好,数据透视表你好,数据透视表你好,数据透视表你好,数据透视表你好,数据透视表你好,数据透视表你...

  • 资产配置最核心的问题 | 《有效资产管理》分享

    我们知道,资产组合或资产配置的最核心的问题是不同类别资产的相关性。当然,不同资产的相关性越低越好。 如何理解“将你...

  • 2019-04-14

    4月14日 Day17 第三大部分 数据透视表及图表 认识数据透视表 数据透视表-数据分析更轻松,快速,高效,灵活...

  • 大数据 · 38种资产的10年相关性透视

    “对于资产配置来说,相关性分析是重中之重。” 文:屠夫1868 欢迎关注:基业长红1868 = 欢迎关注 · 收藏...

  • 数据透视表12月3日

    数据透视表 12月3日 本节学习目录 数据透视表的概念 数据透视表的特点 数据透视表的运用技巧 一、数据透视表的概...

  • 数据透视表-第9节

    创建数据透视表 创建数据透视表1.jpg 认识透视表工具 1.数据透视表字段 2.数据透视表使用 3.调节数据透视...

  • 数据透视表及美化

    一、 创建数据透视表: 1 插入→数据透视表 2 数据透视表选项→显示→选择经典透视表 3 拖动字符 4 数据透视...

  • Day21数据透视表

    数据透视表-基本介绍四点 创建数据透视表、数据透视表的整理、转换为普通表格、刷新所有数据透视表 在对数据透视表处理...

  • 打卡23天

    数据透视表 (1) 如何插入数据透视表:选中任意数据——插入数据透视表—如需要经典模式(数据透视表选项——显示——...

  • 认识数据透视表

    Day 17 认识数据透视表&数据透视表布局及美化 2019.01.26 认识数据透视表 一、数据透视表(数据分析...

网友评论

    本文标题:大数据 · 38种资产的10年相关性透视

    本文链接:https://www.haomeiwen.com/subject/uairzqtx.html