美文网首页
数据采集08

数据采集08

作者: Nefelibatas | 来源:发表于2022-04-17 13:15 被阅读0次

构建物品画像

物品画像同用户画像一样,把物品画像构建简单地理解为物品信息标签化的过程。

在这个过程中需要挖掘物品结构化标签,再通过各个维度把结构化标签进行有序组织,最终形成物品画像。

物品画像主要分为基本信息、供给侧信息、存储侧信息、消费侧信息这 4 个层面。

下面我们以 58 同城到家精选服务画像为例,

  • 基本信息包括类目属性、价格信息、店铺信息、商家信息等;
  • 供给侧信息包括商家供给数、商家服务能力分等;
  • 存储侧信息包括库存数、库存金额等;
  • 消费侧信息包括订单数、下单用户数、销量信息、优惠券金额、实付金额等,这些信息经过不同维度提取后,最终构成了完整的物品画像。

用户画像与物品画像匹配

用户画像与物品画像都构建好之后,我们就可以通过个性化流量分发体系实现快速匹配了,如搜索、推荐、精准推送等

比如 58 同城到家精选用户标签中有价格段偏好,物品画像标签中也有价格段偏好,如果用户经常下单 100~200 元的保洁服务,用户画像中就会产生一个 100~200 元保洁服务的标签。而如果物品画像中保洁服务的 SKU 正好是 100~200 元,我们就可以利用个性化流量分发体系将用户标签与物品标签对齐,最终实现个性化、精准化匹配。

在利用画像将用户和物品进行打通时,用户画像和物品画像之间往往存在着很多交集和联动,这就要求我们通过大数据对画像系统进行查询组合处理。比如我们需要通过画像找到物品的目标用户,再将物品推荐或推送给用户,这个过程两者之间就存在着很多交集与联动。

而查询组合的过程其实就是一个树形结构(如下图所示),其中叶子节点是具体查询条件,它用来记录查询条件,如查询字段、条件符、值等。根节点是条件符;在该条件基础之上根节点又会与新查询条件聚合,并创建出一个新的叶子节点,后续并以此类推。而关系节点连接叶子节点,用来记录左查询条件、交集并集操作符及右查询条件。

在查询组合时是多状态的,为了简化查询业务流程,就需要我们对查询条件进行一定的封装,那我们又该如何对查询条件进行封装呢?查询条件封装过程分为 4 个步骤,具体如下图所示:

查询条件创建叶子节点;

与其他节点取交集/并集运算;

创建新节点(当前节点为左节点,设置运算符,其他节点为右节点);

返回新节点。

总的来说,在用户画像与物品画像匹配的过程中,精细化、个性化才是根本

相关文章

  • 数据分析实战45讲 笔记四

    08 | 数据采集:如何自动化采集数据? 数据采集是数据挖掘的基础,没有数据,挖掘也没有意义。很多时候,我们拥有多...

  • Python网络数据采集之登录采集处理|第08天

    User:你好我是森林Date:2018-04-08Mark:《Python网络数据采集》 网络采集系列文章 Py...

  • 数据采集08

    构建物品画像 物品画像同用户画像一样,把物品画像构建简单地理解为物品信息标签化的过程。 在这个过程中需要挖掘物品结...

  • 数据仓库搭建

    全流程:数据采集->数据存储->数据分析->数据呈现 数据采集 首先我们从数据采集来说,数据采集的数据主要来自于日...

  • 产品要懂点数据分析(三)- 分析过程

    数据采集 数据分析的对象就是数据,通过数据采集来获得数据。数据采集在《产品要懂点数据分析(一)-数据采集和数据指标...

  • Python网络数据采集之图像识别与文字处理

    网络采集系列文章 Python网络数据采集之创建爬虫Python网络数据采集之HTML解析Python网络数据采集...

  • 用数据驱动产品和运营 之 数据处理流程

    数据处理流程: 数据金字塔:数据采集——数据建模——数据分析 (一)数据采集 数据采集问题:不准确、不完备、不细致...

  • 第一章 总述

    大数据系统体系:数据采集、数据计算、数据服务、数据应用 一. 数据采集层: 1)web端日志采集技术方案:Aplu...

  • 大数据之数据采集

    大数据体系一般分为:数据采集、数据计算、数据服务、以及数据应用 几大层次。 在数据采集层,主要分为 日志采集 和 ...

  • 扩展json

    json 计划 0:一次性数据 计划 1:采集数据 计划 2:计数 采集数据字典 0:方法内部采集 采集数据字典 ...

网友评论

      本文标题:数据采集08

      本文链接:https://www.haomeiwen.com/subject/tjclertx.html