【数据埋点01】数据埋点概述

作者: 草帽小子_一个数据人的自留地 | 来源:发表于2019-11-22 11:52 被阅读0次

一、概述

简介

埋点是一种常用的数据采集的方法，其目标在于采集更多的数据来创造业务价值。

数据可分为两大类：

1）流量数据：以用户访问产品，记录用户浏览行为核心的埋点数据日志

三者共同构成了，什么样的用户who在什么时候when对什么样的内容做了什么事what。

业务数据的用户信息：user_name sex

内容信息：item_tag

行为埋点：evet

2）业务数据：以生产系统内存储的业务表单数据为核心的业务库数据记录

即用户访问产品时的交互“动作”触发的是埋点的流量数据；如“点击广告”是动作事件，能够产生一条埋点数据。

用户访问产品看到的“内容”是业务数据；如我们看到的广告内容是“游戏”信息，游戏信息是被存储的业务数据。

我们学习埋点知识，就是为了设计“记录”用户“动作”的方案，记录用户“动作”发生的场景，探索用户“动作”背后的意图。

web日志数据：用户浏览的每个网页，都会想服务器发送请求，服务器会将交互记录下来，称为日志。

127.0.0.1 - - 123456[20/Jul/2017:22:04:08 +0800] "GET /news/index HTTP/1.1" 200 22262 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.66 Safari/537.36"

二、案例

数据埋点的形式多种多样，但数据埋点但原理是相同的。很多时候我们在观察和分析一个埋点但时候，首先要了解这个埋点信息采用的什么数据埋点方案，不然我们会因为信息不足导致无法判断。

案例一：常用的站内数据埋点方式，适用于各种平台WEB、APP、小程序

数据埋点形式和参数说明

[{

//Part1:配置信息

''user_id":"123",//埋点负责人的账号id

"business":"商品页面",//埋点数据的业务分类

"lable":"标签属性",//对埋点数据进行分类，对每个分类打标签

//Part2:环境信息

"uid":"123", //用户唯一ID，只要访问就生成一个新的身份标示

"user_id":"123", //用户的账户ID，仅登录用户可获取得到

"name":"joker",//用户的账户名称，仅登录用户可获取得到

"city_id":"2",//如果用户访问的页面有城市属性，这里可以获取页面的城市属性id

"city_name":"上海",//如果用户访问的页面有城市属性，这里可以获取页面的城市属性值

"locate_city_id":"1",//用户访问时候所定位的城市id

"locate_city_name":"北京",//用户访问时候所定位的城市属性值

"wifi":"on",//用户访问时候wifi的开关状态

"app_version":"10.9.2",//用户当前使用的app版本

"os_version":"11.8.2", //用户当前手机系统的版本

"os_souce":"android" //用户当前的手机系统（Android，iPhone，小程序、web…）

//Part3:事件信息

"evs":[{

"id":"a1234"//坑位模块的全app唯一标示id

"val_val":{ //以下所有数据为同时携带的想要获取的数据内容

"user_id":"123", //访问用户的账号id；

"content_id':"123234",//商品唯一id标示//商品标题；

"title":"conklab连帽潮牌oversize情侣装",

"price":"298",//商品价格；//商品分类属性id

"business":"女装",//商品分类属性

"strategy":"abc123"//不同策略的策略id，用于区分不同策略的数据效果

"shop_id":"123",//商品所属的店铺id

"mark":"双十一",//个性化的数据标签，比如双十一代表此商品正在参加双十一活动

"position":"2",//商品在列表中展示排序的第几个位置

}

}]

数据触发时间上报策略说明：

1.露出上报采用实际展示曝光上报策略，只有当事件本身实际曝光显示在屏幕当中才需触发上报策略（露出像素>0px）；

1）滑动：在页面内上下滑动时，不重复记录

2）刷新：刷新当前页面时，重复记录曝光

3）翻页：下拉到新一页后再返回上一页，上下滑动不重复记录

4）返回：事件点击落地页后，从落地页返回（包括返回按钮返回、滑动返回、支付等行为后自动跳转返回），不重复记录曝光

5）唤醒：

a）手机锁屏被打开，直接展示事件所在页面，不重复记录曝光

b）应用或浏览器在后台被唤醒，展示广告所在页面，不重复记录曝光

2.没有特殊限制定义，埋点需要根据坑位颗粒逐条上报，不做去重处理

备注：数据埋点中的“点击事件”在触发“点击”动作的时候上报埋点数据，触发条件很明显，不容易有歧义，所以很少单独强调。

解读

在案例1中我们很容易总结出数据埋点的数据分为三个重要组成部分：

数据埋点的业务配置信息

用户访问环境信息

数据埋点动作信息（事件信息）

用户访问我们的产品的时候，触发单个“动作”事件信息的时候，我们会记录用户的所在城市、客户端，APP版本，埋点ID，以及很多其他的参数。

通过长期的总结和经验及常识分析，我们会发现用户在一次会话访问中城市不会发生改变，只需获取一次即可，不必每次“动作”时间的出发重复的获取用户的地理位置计算一个所属城市。

因此我们优化一下数据的获取方式，将城市作为环境信息在一次会话中仅获取一次，后在加工处理数据的时候将一次会话内的所有“动作”事件信息补全它所属的城市场景。

同样道理类推，我们会发现不仅城市拥有这个规律和常识，用户的wifi，APP版本，登录账号，手机系统，手机品牌的等等属性都是类似的，所以，我们将其统一归为环境数据信息，在一次会话中仅收集获取一次（特殊的业务场景除外，比如定位信息可能主动、被动的多次触发）。

和环境信息比较类似的是业务信息，我们在通过工具或者各种记事本管理数据埋点的时候，我们对埋点的业务定义已经明确，比如埋点数据的事件id，我们很清楚的知道它是谁负责的，中文名称是什么，所以我们在用户访问产品，触发埋点的时候完全可以选择不上报这部分数据，从而减少数据上报量。等我们将埋点数据收集采集到数据库的时候，同我们已知的明确的定义信息进行一次关联即可。

案例二：常用的站外，站内数埋点方式，多用于WEB、小程序平台

假设我们有网址：https://www.xxxabc.com/about/1.html（运营促销活动），我们针对这个活动在某网站投放广告引流，最有效的数据埋点方法是对URL添加埋点参数如下：

例如：运营促销活动的URL添加参数如下：

https://www.xxxabc.com/about/1.html?source=sina_joker_ad_about_01

参数说明：

?：问号后面是我们的埋点参数，以问号分割的作用是不影响正常的访问链接

source：埋点字段的命名，source表示参数的名字，source后面是参数的值

sina：表示来源的渠道，如果是sohu，那么这里是搜狐即可

joker：表示来源渠道的负责人

ad：表示为广告类型，这里以ad表示一类广告

about：表示对应的是此次about这个活动

01：如果我们对这个资源位做了很多不同的广告图片素材，我们可以对素材编号为01，02……

解读

案例2本身通俗易懂，重点就是在于将参数安排在URL中，通过收集访问的URL日志来解析我们希望获取的埋点信息。

案例2可以延伸出很多种不同的数据埋点方式，以上述埋点的参数为例，我们也可以将其在进行一次整合优化。

比如：

运营促销活动的URL添加参数如下：

https://www.xxxabc.com/about/1.html?source=sina_joker_ad_about_01

修改为：

运营促销活动的URL添加参数如下：

https://www.xxxabc.com/about/1.html?source=abc123

备注：abc123=sina_joker_ad_about_01的含义可以维护在工具或者其他地方，这样就避免了URL过长，参数过多的数据现象。

案例三：数据埋点中的一种透传方案，主要用于统计站内的来源入口，适用于WEB、APP、小程序。

storymark://业务场景标示，可以对应到不同的业务类型场景

“key1:”value"//页面跳转的时候传递的参数，采用key：value的形式写入参数值

“key2:”value"//保留尽可能多的keyxid，写入更多参数值

“key3:”value" //保留尽可能多的keyxid，写入更多参数值

……

数据触发上报说明：

我们希望统计浏览小视频的来源入口，比如通过首页的“搜索”还是“关注”进来的。我们需要在做如下2件事情。

1.当用户通过“搜索”进行内容筛选查找小视频的时候，在触发搜索任务的时候上报如下埋点数据。

storymark://业务场景标示，可以对应到不同的业务类型场景

“index:”search" //key（index）定义为是首页，value（search）标示是来自搜索功能

“content:”美女" //key（conten）定义的是携带的内容参数，value（美女）标示内容参数

2.当用户向下访问的时候，尤其是在到达“浏览小视频”目标页的时候，触发上报埋点参数。

同样原理类推如果想统计通过“关注”到达浏览小视频的目标页，埋点数据如下：

storymark://业务场景标示，可以对应到不同的业务类型场景

“index:”guanzhu" //key（index）定义为是首页，value（guanzhu）标示是来自guanzhu功能

“content:”guanzhu" //key（conten）定义的是携带的内容参数，value（guanzhu）标示内容参数

备注：

1.“关注”的埋点参数“content:”guanzhu" ，vlaue可以为空（“content:”“ ）

2.这种埋点有很严格和复杂的”抹除“逻辑，需要有很强的层级概念，比如用户通过”搜索“进入结果页但是未能再进一步，选择返回首页通过”关注“最终到达”浏览小视频“目标页，那么”搜索”相关的参数需要在“回退”的时候抹除，写出最新的“关注”埋点参数。

解读

统计 x 页面的来源，统计 x 页面的分类，统计用户的访问路径。这是不同的数据概念模型，且依赖的数据埋点方案会存在差异

三、埋点文档参考示例

后续进行展开。

mixpanel里可以新建埋点事件，进行可视化展示，比较直观https://mixpanel.com/report/2074601/setup/quick

参考文章：埋点概述https://mp.weixin.qq.com/s/giPfYrpv5bm0l1klXBiGUQ

网友评论

@认知·互联网

本文标题：【数据埋点01】数据埋点概述

本文链接：https://www.haomeiwen.com/subject/vqefwctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

【数据埋点01】数据埋点概述

一、概述

简介

web日志数据：用户浏览的每个网页，都会想服务器发送请求，服务器会将交互记录下来，称为日志。

二、案例

案例一：常用的站内数据埋点方式，适用于各种平台WEB、APP、小程序

解读

案例二：常用的站外，站内数埋点方式，多用于WEB、小程序平台

解读

案例三：数据埋点中的一种透传方案，主要用于统计站内的来源入口，适用于WEB、APP、小程序。

解读

三、埋点文档参考示例

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

@认知·互联网