美文网首页数据分析
大数据标签系统看这一篇就够了(建议收藏)

大数据标签系统看这一篇就够了(建议收藏)

作者: 岩杉Shawn | 来源:发表于2019-11-19 11:13 被阅读0次

    什么是标签?

    标签是一种数据特征。比如用户的年龄、性别、地区等。

    这些特征在数据中具有一定的通用性和价值。

    为什么说是“一种”数据特征呢,因为针对的目标不同,会有不同的标签,比如用户标签、订单标签、收货地址标签(办公or家庭)。但是订单、地址这些是无法营销落地的(无法闭环也就无法体现数据价值),所以最后还是会落实到用户标签上来。后面讲到的也都是用户标签。

    标签在系统中的存在形态?

    标签是数据库中标签表的列,行是用户。

    标签的意义?

    标签其实是一种预统计,针对有价值的信息提前统计,应用时速度快。

    因为很多标签是有运算逻辑的,比如高净值用户标签,需要取分析用户的历史所有订单后才能得到,如果采用实时SQL查询会非常非常非常慢,且非常非常非常耗硬件资源。

    标签是怎么来的

    在讲这个之前,先讲下标签的大中小。简单举例:

    标签:女性用户(性别标签)

    标签:深圳的女性用户(性别标签+地区标签)

    标签:深圳的女白领(性别标签+地区标签+消费能力标签)

    在实际应用中,针对不同需求,会有标签组合使用的情况。方便你理解下文中提到的标签标注或为什么标签需要标注。

    标签的生产流程:

    1. 标签定义

    人工标注:更多的依赖于人的经验,通过人为定义给出标注规则。

    机器标注:更多的依赖于机器学习算法,通过将影响因子提供给机器算法模型,通过机器的自学习给出不同权重并形成标签。

    2. 标签分类

    按数据的时效性分

    静态标签:又可以称为定性标签,指不会随着时间以及用户行为变化而变化的标签,如用户的性别标签、年龄标签,这些标签都是不会随着时间或用户行为而变化的。

    动态标签:又可以称为定量标签,指会随着时间以及用户行为变化的标签,如用户活跃度标签,会根据特定时间段内用户特定行为的变化而变化。

    按数据提取维度分

    事实标签:从生产系统获取数据,定性或定量描述用户的自然属性、产品属性、消费属性、资源属性等,以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。

    模型标签:对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。

    预测标签:基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行打标,实现营销适时、适机、适景推送给用户。如用户在过去一段时间经常访问汽车类APP,那么可以依据用户行为给用户打上有买车需求的标签。

    按标签的添加方式分

    手动标签

    系统标签

    3. 标签生产

    标签逻辑的开发

    开发后对数据进行清洗,请看文末

    4. 标签更新

    人工标注:标签的更新往往通过标签实际效果以及具体使用标签人的经验对标签标注规则进行更新。

    机器标注:更为智能,通过数据的不断更新,机器会根据标签的反馈效果自动更新标签的规则。

    5. 标签检索

    标签的查询

    6. 标签管理

    标签的增删改

    【标签体系架构】

    完整体系架构&数据清洗,在公众号回复“标签体系”查看~~~

    转自公众号:岩杉Shawn

    公众号:岩杉Shawn

    相关文章

      网友评论

        本文标题:大数据标签系统看这一篇就够了(建议收藏)

        本文链接:https://www.haomeiwen.com/subject/smrwictx.html