用户画像初探
个人笔记分享,如有错误请指出
数据运营的三个阶段
-
探索期
在这个阶段,更多是通过一些简单的版本更迭和新功能的上线后,查看基础的用户数据。比如上线了一个圈子的功能,用户的日活跃有没有上去,使用时长有没有增加
-
成熟期
当来到这个阶段后,数据颗粒度会更加的小。比如涉及到每一个用户的行为,给每一个用户画像。进而调整产品的用户人群,或者调整产品的界面功能等。
-
变现期
当上一个阶段的用户画像积累一段时间后,产品需要一个变现的手段。这时候就需要基于用户画像去推荐广告,推荐内容等
用户画像的基本流程
![](https://img.haomeiwen.com/i3345015/0b22b8bd1cce0d91.png)
1.首先我们需要确定画像的类型,基于统计还是算法或者两者皆可
2.进行用户标签的规划
- 静态标签---位置,性别等
- 动态标签 ---行为所产生:喜欢的频道,使用时间段
- 预测标签---可能会喜欢的相关内容等
3.标签的提取
4.标签的处理(图中还缺用户统一识别,用户不一定使用同一个设备,需要合并不同设备,历史和现在的标签)
- spark graphx
5.标签的使用测试
业务流程
![](https://img.haomeiwen.com/i3345015/5f08342c9b96c072.png)
用户标签举例
下图为视频网站的标签举例
![](https://img.haomeiwen.com/i3345015/8424bc5bfe88adfc.png)
用户行为(动态)标签设计
![](https://img.haomeiwen.com/i3345015/6731085bf6b82d1a.png)
属性标签就按一般的er图的思想就可以。
![](https://img.haomeiwen.com/i3345015/a911166bdcf50ca6.png)
用户标签权重打分
用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重
推荐算法分类
![](https://img.haomeiwen.com/i3345015/8562e44c7802d10a.png)
基于spark ALS 协同过滤算法流程
![](https://img.haomeiwen.com/i3345015/64ff2110ea078b48.png)
基于用户和视频标签相似度算法流程
![](https://img.haomeiwen.com/i3345015/b52b78bea10a4a3d.png)
关键词的提取和查找同义词
python jieba.analyse工具包
python synonyms 工具包
网友评论