美文网首页
同样是数据分析师,他靠“打标签”总被夸,我天天加班取数还被骂

同样是数据分析师,他靠“打标签”总被夸,我天天加班取数还被骂

作者: 数据分析不是个事儿 | 来源:发表于2022-03-22 09:20 被阅读0次

转载/码工小熊

大家好,我是爱学习的小熊妹。

今天跟大家分享一个和指标体系同等重要的技能:构造标签(俗称:打标签)。打标签能力,是区分真数据分析师和sqlboy的重要能力

一、什么是标签?

标签是对事物的概要性描述。就像商品标签上会写商品分类、主要原料一样。虽然一件商品有很多属性,但是我们只通过几个有限的标签,就能锁定我们想要的商品,这就是标签的作用。

二、有哪些标签?

从复杂程度上看,标签有四类:

1、事实型标签。比如商品的颜色、人的性别。这些是事实描述,可以直接拿来用。

2、规则型标签。比如把“消费1000元以上”定义为:高消费群体。规则类标签,往往是基于一个数据指标,然后根据特定的规则进行分类。

3、复合型标签。比如“高富帅”,就是一个典型复合型标签,它基于N个指标,进行综合计算,最后得出一个标签结果。

4、预测型标签。注意,以上三类标签,用的都是已经发生的数据进行计算。预测型标签则是对未来情况的估计。可以用算法进行预测,也能人工预测。比如对用户进行分类,然后打个标签“预计流失用户”,就是指该用户会在未来XX时间内流失掉。

这四类标签的复杂程度是不同的:预测型>复合型>规则型>事实型。相应的打标签的难度也不一样。

三、要怎么打标签?

打标签是个通俗说法,它指的是生产标签的过程。如果是简单的事实型标签,则直接拖过来用即可。其他三类,都得经过打标签的动作,越复杂的标签,生产起来越麻烦。

打标签有四个标准步骤:

明确打标签的对象

明确标签的用途

明确标签规则

明确标签的名称

举个最简单的例子:小熊妹还没有男朋友,我想找个高富帅。

高富帅,就是个复合型标签,按四步走:

1、打标签对象:男人,活的

2、明确用途:选个潜在蓝盆友

3、明确规则:这是最复杂的一步,因为高富帅有三个维度。首先得一个维度一个维度,单独讲清楚,然后再想办法综合。

这里,高相对容易,看身高然后给个标准即可。

帅,也相对容易,看到照片自己觉得还行,手工打个标签即可。

富,就很纠结了。有的人挣得多,可也花得多呀。不能光看收入,还得看负债。

这样,先对三个维度各自打标签,再进行综合(如下图)。

综合的方法,可以用优先级排序,或者做综合评分(如下图):

看起来综合评分似乎更科学,但实际决策时候并不是!比如我,看到帅哥就走不动道了,管他富不富呢。综合评分有可能选出来平庸的个体,这个要注意哦。

4、明确标签的名称:高富帅、非高富帅

搞掂!

可以看出,在生产标签的过程中,明确规则是最麻烦的一步。但实际上,麻烦不限于此。

四、打标签,难在哪?

看完上边的小例子,很多人会觉得:“打标签很简单呀,我一个上午能打1000个出来”。如果只是往数据库里添加1000个新字段,确实很容易。

但是,这1000个字段:

有几个能被业务部门用起来?

用完以后能提升业务表现?

还有多少业务想要的标签,没有在其中?

这才是真正的难题。

反正我是见过,供应商傻乎乎的打了几百个标签,结果除了上线汇报ppt外,业务部门看都不看一眼的,更不要提用了。

一个好的标签,一定是:

业务高频使用

指向明确动作

产生明显效果

就像小熊妹一听人介绍“高富帅”,就会顶着周五熬夜煲剧的黑眼圈起床化妆俩小时出门一样。这才是高频使用,有驱动力,产生明显效果的标签!

肯定有小伙伴问,业务上有没有这种标签,当然有,比如我个人很喜欢的:促销敏感型用户(是/否),这个标签。专门区分:没有促销不买,有促销高概率买的薅羊毛体制用户。拿来解释日常消费转化率,事前预计活动效果,事后复盘达成情况,都好用(先卖个关子,之后专门分享这个)。

实际业务问题经常很复杂,很难用一个标签描述情况,因此需要围绕一个业务场景。构造若干个标签,形成标签体系,驱动业务工作。

我是“数据分析不是个事儿”,常年分享数据分析干货,不定期分享好用的职场技能工具,点击关注,精彩内容不要错过!

相关文章

  • 同样是数据分析师,他靠“打标签”总被夸,我天天加班取数还被骂

    转载/码工小熊 大家好,我是爱学习的小熊妹。 今天跟大家分享一个和指标体系同等重要的技能:构造标签(俗称:打标签)...

  • 【2020-06-16】sqlite3和sqlitebrowse

    SQL取数重要性 数据分析是数据科学家基础 SQL取数是数据分析基础 数据科学家、模型开发人员、数据分析师80%的...

  • 中国教育与美国留学

    每天看着那些天天骂中国教育,夸西方教育的人,替他们干着急。他们骂也骂不对,夸也夸不到点子上。今天我们就是想夸一夸中...

  • 转载左灯右右右行

    致郁金香的郁友们: 《我在精神病院打妖怪》在郁金香平台连载了3月有余。 实话说,这3月来,是夸也被夸惯了,骂也被骂...

  • 复盘:项目管理周贴士(八月中)

    1. 项目需要数据分析师取数,要什么样的数据需要有人定义口径,需要有人提供数据宽边,分析师会给出结论,结论肯定是需...

  • 天天被夸

    近来,因给小宝送饭事宜,天天被夸。 今天,那些校门口店老板又聚拢来,一个个指指点点,说很少见我这样的家长,送来这么...

  • 我所理解的互联网数据分析师

    本文目录: 数据分析师的工作内容数据分析师的能力要求数据分析与数据挖掘数据分析师的困境数据分析师的推荐资料总结 数...

  • 如何提高取数的效率

    所谓取数需求,就是业务团队根据业务需要,提出的希望分析师能从数据库中提取的数据内容。在一些业务快速发展的企业,数据...

  • 身为数据分析师,如何避免成为一台“取数机”?

    文章来源:傅一平 @与数据同行 取数是数据工作的一个基础内容,也是大多数“入门”级别数据工作人员(例如数据分析师)...

  • 数据分析常用函数

    作为数据分析师,SQL是必备技能,因为数据分析第一步是从数据库中获取数据,而SQL是方便的取数工具。那如何学...

网友评论

      本文标题:同样是数据分析师,他靠“打标签”总被夸,我天天加班取数还被骂

      本文链接:https://www.haomeiwen.com/subject/uhtfjrtx.html