美文网首页股神财务自由之路投资理财
基于大数据的全行业盈利能力量化分析

基于大数据的全行业盈利能力量化分析

作者: BarryTan | 来源:发表于2018-07-13 14:36 被阅读46次

1.目的

男怕入错行,女怕嫁错郎!
当今社会上有哪些行业?各个行业的现状如何?究竟什么样的行业是好行业了?什么样的行业是落后行业?
怀着以上的问题,我在网上搜了一圈,没有找到十分满意的答案。
“那就自己来吧”,小红母鸡说。
“好的,不做伸手党,我自己来吧”,我自己说。

基于大数据的全行业盈利能力量化分析

2.思路

总体思路是,能够持续5年获得高利润率的行业,就是好行业。 具体的思路是:

  1. 按某一个行业分类方法,得到该行业所有的上市公司的、最近5年的利润率,
  2. 计算每个行业利润率的中位数,来代表该行业的利润率情况
  3. 按照中位数对行业进行排序,最高的前10名,为好行业。最后的10名,为落后行业。
  4. 对数据可视化
  5. 对图表进行初步分析
  6. 初步结论

3.工具

  1. 使用聚宽量化交易平台来获取所有A股上市公司近5年的财报数据
  2. 使用Python语言进行分析(多亏几个月自学了点三脚猫python, 可以实现简单的想法)

4.数据获取与处理(可跳过不用看)

  1. 确定行业的分类方法 目前行业的划分方法有很多。官方的有国家标准《国民经济行业分类与代码(GB/T 4754-20117)》。许多证券公司也有自己的划分。本研究采用常用的申银万国行业分类标准。申万分类分为一级、二级、三级三种,我们采用中间申万二级行业分类。在聚宽平台上,可以使用get_industries(name="sw_l2"),轻松地获得申万二级的110个行业代码。

  2. 获取行业的股票代码 在聚宽平台上,可以使用get_industry_stocks(industry_code, date=None), 获得每个行业的所有股票代码。

  3. 获取股票财务数据 我们使用get_fundamentals(query_object, date=None, statDate=None),获取股票的财务数据。query_object是一个sqlalchemy.orm.query.Query对象,我们在其中可以轻松指定想要获取的所有股票2005年以后的财务数据。在这里我们主要取indicator表中的net_profit_margin净利润率作为我们的分析对象。

  4. 数据处理 拿到数据后,我们按前面思路的顺序,计算行业利润率中位数,然后排序。获得前10名的好行业和后10名的落后行业。然后制作Boxplot图表以方便进行分析。


    取数据的核心代码,供参考。我是刚入门小白,欢迎大神指正

5 数据分析 (数据来源:所有A股股票2013~2017年财报)

  1. 所有A股行业的利润率情况


    全行业利润率分布
  2. 前10名的优秀行业利润率情况


    前10名行业利润率分布
前10名行业利润率中值
  1. 后10名的落后行业利润率情况


    后10名行业利润率分布
后10名行业利润率中值

6 结论

  1. 男怕入错行,女怕嫁错郎是一句真理。行业盈利能力之间的差异是巨大的。
  2. 360行,行行出状元也是真理。在各行业,即使是落后的行业,也有盈利能力相对较好的公司。只是好公司多少的差异较大。努力很重要,有选择的努力或许更重要。
  3. 行业是变迁的、有周期性的。根据历史数据得出来的结论,只说明过去,不能说明未来。我所在的船舶与海洋工程行业,2008年前后多么辉煌,现在沦落为倒数几名。
  4. 用python对大数据进行分析,相对于传统的Excel手工分析来说,就是收割机之于镰刀。

相关文章

网友评论

    本文标题:基于大数据的全行业盈利能力量化分析

    本文链接:https://www.haomeiwen.com/subject/tlijpftx.html