美文网首页test
数据分析场景 -- 异常数据分析

数据分析场景 -- 异常数据分析

作者: ArnoChanszu | 来源:发表于2020-08-12 16:26 被阅读0次

      对于异常数据的分析,相信每位数据分析师都不陌生,对于业务部门来说同样很希望了解数据分析的思路。去年同期也写过类似的一篇异常数据分析文章,过了一年后有了更进一步的思路和想法,因此再次分享一下,对于数据分析师常见的“异常数据分析”。

      分析思路包括以下5个步骤:

      1. 确定这是不是问题?

      2. 判断问题严重吗?

      3. 具体问题具体分析,找出原因

      4. 拉齐业务,对症下药

      5. 形成SOP或数据产品

      下面来细说下每个步骤的分析内容:

      1. 确定这不是问题?

      一般来说,业务数据下降这类问题会是业务方主动提出的。当然作为数据分析师也可能凭借数据敏感,发现异常数据。

     这个步骤主要思考4个小问题:

     1)什么叫异常数据?

     2)异常数据真的是问题吗?对比标准是什么:KPI?去年同期?竞争对手等等

     3)数据出口、指标计算口径是一致的吗?

     4)数据的真实性如何?有没有宕机、传输有没有丢包、数据流转是否有预警等等

      2. 判断问题严重吗?

      如果确实存在问题后,需要再判断问题是否严重,这决定了下一步工作的优先级和分析程度。实战中,一方面需要判断与对比标准的差距到底有多大,另一方面也需要拉长时间线来看趋势变化,毕竟下降的时间越久,问题也越严重。

      下图是之前的一个分析思路,结合问题严重程度和紧急程度做的步骤拆解:

     

      3. 具体问题具体分析,找出原因

      分析原因和分析方法一定是结合着具体场景的。

      大致来说,可以从这几个角度切入分析:

     1)指标拆解,即把结果指标拆解为一个个过程指标,对过程指标逐个分析

      以DAU为例,DAU=DNU+昨日的次日留存用户数+前N日的N日回流用户数(N>=2),可以分别计算出每部分变化的影响系数,即哪部分变化是最大的,先从变化最大的入手

      2)内外部分析,即从分析对象的内外部影响因素入手

      例如文章点击量时,从内部来说可以从产品功能(是否版本迭代、新功能未满足需求等)、渠道来源(是否某个主要渠道推广出现限制等),外部影响因素包括整个行业宏观环境、竞争对手策略以及产品用户

      3)主谓宾分析,即从分析对象所处环境整体把握分析(PS:这个方法是我个人所悟,可能还不是很成熟)

      具体来说可以从这三个主谓宾进行分析:使用主体是用户(可以再拆解新老用户、用户画像、访问渠道、访问时段等等),使用 载体即产品本身(产品功能分析),使用行为也就是用户在产品上的行为(例如停留时长、启动次数等)

      分析方法和视角有很多,如果时间允许还可以做深度分析,找到切入点做假设,以数据验证假设,以找到原因。

     

      4. 拉齐业务,对症下药

      针对具体分析出的原因提出相应的改进策略,毕竟数据从业务中来,需要返回业务中执行,需要拉齐业务部门制定出可执行的解决方案,并落地执行,才可能让数据朝健康方向发展。

      5. 形成SOP或数据产品,不断迭代优化

      前面4步主要还是单次分析,结合自己之前做数据产品的经验,可以更进一步:梳理好分析维度,指标,业务流程等内容,健全相应的一些监控报表,加入一些对比标准进行预警,持续观察一段时间,特别要留意的是数据指标缓缓下降的情况,提前介入分析原因,否则越到后期问题往往也越严重。

      当然业务是在不断变化的,行成的SOP或数据产品也需要迭代优化,跟得上业务发展。

      小结:异常数据分析属于“事后诸葛亮”式的后验分析,做得好也是可以发现业务中存在问题的,但同时提需要提醒数据一定要形成闭环,即从业务中来,更需要回到业务中去,落实到业务执行,分析才不会白费

      附1:异常数据分析流程(去年)

      附2:此图为一些分析视角,仅供参考

相关文章

  • 数据分析场景 -- 异常数据分析

    对于异常数据的分析,相信每位数据分析师都不陌生,对于业务部门来说同样很希望了解数据分析的思路。去年同期也写过...

  • Python数据分析 | 数据描述性分析

    目录: 数据准备 类别型数据分析 数值型数据分析查看数据分布查看异常值描述性统计分析数据分布模型 相关性分析 1....

  • 数据异常分析过程

    背景: 数据异常分析是数据分析工作中最常见且重要的分析主题,通过一次次的异常分析来明确造成数据波动的原因,建立日常...

  • 2019-08-19

    一、数据质量分析 脏数据: 缺失值 异常值 不一致的值 重要数据含有特殊符号的数据 1.异常值分析 (1)简单统计...

  • 数据处理-利用 python进行异常值分析

    异常值分析是检验数据是否有录入错误数据和不合常理的数据。不加剔除的把异常值代入数据分析过程中,会对结果产生不良影响...

  • 第三章:数据探索

    3.1餐饮销售额数据异常值检测 2数据特征分析 分布分析:分布分析能揭示数据的分布特征和分布类型;定量数据的分布分...

  • 0002 产品经理数据分析学习笔记文章

    一. 数据分析的应用场景 1. 需求分析阶段:利用数据分析确定需求价值 2. 产品设计阶段 设计前:利用数据分析,...

  • 【练习】信用卡欺诈检测

    1 数据分析与预处理 建立逻辑回归模型,对正常交易数据和异常交易数据进行分类。 1.1 数据读取与分析 从csv文...

  • Hive基础知识-2

    Hive使用场景: 离线数据 处理大数据 延迟高 数据的离线处理;比如:日志分析,海量结构化数据离线分析… Hiv...

  • spark第二天作业

    基站数据分析案例 [TOC] 本节任务 场景解读练习数据维度分析 教学目标 使用案例练习Spark算子通过基站数据...

网友评论

    本文标题:数据分析场景 -- 异常数据分析

    本文链接:https://www.haomeiwen.com/subject/qukmdktx.html