美文网首页
数据分析学习记录W31——画像的初步理解

数据分析学习记录W31——画像的初步理解

作者: 演奏的船长 | 来源:发表于2021-02-14 11:03 被阅读0次

画像是数据挖掘常见的应用方式,通过对目标群体的标签信息进行聚类,来寻找目标群体的共同特征;


通过这段时间的学习思考,我总结了画像的一般步骤

  1. 建立数据集
    也就是确定要对多大范围内的人进行画像操作。可以是搜集到的所有人,也可以是通过一些筛选条件的识别出的部分人;
  2. 匹配特征数据
    将数据集内的人与其特征行为数据进行管理,比如他的行为数据;
  3. 对特征数据进行标签化
    将各维度的特征是数据转化为更易识别的标签。常见的处理方式包括:
  • 将维度数据直接转化为标签,比如星座、性别
  • 将度量数据切分为数据桶,然后为数据桶打标签,比如将年龄划分为18-,18-35,35-50,50+,然后打上未成年、青年、中年、老年等。这个操作最考验分析人员对业务的理解
  1. 将所有标签标准化
    将所有维度的标签映射为1,2,3……的数据,以便进行聚类
  2. 进行聚类操作
    通过算法工具进行聚类
  3. 观察聚类后的各群体构成,总结其标签,提炼该群体核心和特征。

相关文章

网友评论

      本文标题:数据分析学习记录W31——画像的初步理解

      本文链接:https://www.haomeiwen.com/subject/bzngtltx.html