美文网首页
数据收集

数据收集

作者: Delia时之沙 | 来源:发表于2019-05-22 19:03 被阅读0次

    1、数据运营的步骤规划

    数据化运营步骤

    2、常见的数据获取方式

    当我们从各种网站分析的报表中解读各种指标和数据时,需要去了解他们的定义和计算规则,其中必须具备的基础知识便是在网站中通常以何种形式获取数据。

    2.1 数据的来源

    网站的日志文件

    网站的应用服务器输出的日志所记录的其实是用户终端为了满足用户的访问需要,对服务期发起的所有的资源请求,这些资源不仅包括页面请求,页面展现的所有相关元素请求也会被记录。如图片、CSS、文件,另外一些iframe也会被当成请求记录。

    Web Beacons

    在需要统计的网站页面或者模块上嵌入一个1*1 像素的透明图片,用户完全察觉不到,当用户访问该网页的同时会请求透明图片,并完成页面访问的记录工作,就像是在纸上画了一个不易看到的小点。

    JS页面标记

    JS页面标记同样需要在页面端处理,只是嵌入的不再是图片,而是JS标记代码。

    2.2 日志格式解读

    Apache 日志格式解读

    3、数据采集内容介绍

    3.1 动作事件介绍

    Web平台:用户通过在网站应用的一个页面上:点击了一个页面元素;浏览了一个页面元素;

    提交了一个表单;修改了某个输入框

    移动平台:用户在移动应用中:点击了一个控件元素;浏览了一个控件元素

    小程序平台:用户在微信中访问了小程序的一个页面上:点击了一个页面元素;提交了一个表单;修改了某个输入框

    3.2 动作事件内容

    用户信息:描述用户的信息,如:用户ID(访问 or 登录)

    时间信息:事件发生的时间

    行为信息:用户做了什么样的行为,比如,浏览、点击、输入了文本框

    行为对象信息:用户的行为作用在哪些对象上,比如:点击了按钮 A;浏览了页面 B;修改了文本框 C,那么 A, B, C分别就是用户行为作用对象。

    行为内容信息,比如是哪个产品?下的订单号是多少?

    4、数据采集的来源

    4.1  无埋点属性

    4.1.1 访问事件的属性

    用户设备信息、操作系统及版本、设备品牌、设备型号、设备类型(手机/平板)、设备制造商、浏览器及版本、系统语言、屏幕大小、设备方向、用户位置信息、国家、地区、城市名称、国家代码、用户访问的应用信息、网站/手机应用、App版本、用户落地页信息、域名、

    页面、访问来源、页面来源

    4.1.2 页面事件的属性

    用户当前访问的页面信息、域名/包名、页面、查询、页面来源、动作事件的定义

    4.2 埋点事件的分类

    一个埋点事件由以下几个部分构成:

    用户信息;时间信息;埋点事件标识;埋点事件属性

    按照埋点事件的发送位置不同,埋点事件可以分为 客户端埋点和服务端埋点两大类:

    客户端埋点:

    服务端埋点:

    4.3 外部访问来源的采集

    对于PC端来说,常见的访问渠道有直接访问、搜索引擎和外部链接。浏览器会记录下访问来源,从而判断出用户的访问渠道。

    UTM是一套标准的跟踪渠道流量的参数,全名是Urchin Tracking Module,设定好UTM参数,即可追踪网站/活动的流量来源,不同流量来源所占的比例等。你可以通过它来跟踪访问你网站的流量来自于哪些渠道、哪些媒介等。

    UTM有五大参数,详情介绍如下:

    ● 来源(utm_source) :用来标识流量来源网站、搜索引擎或其他来源。示例:utm_source=baidu

    ● 媒介(utm_medium) :用来标识媒介,比如电子邮件或每次点击费用。示例:utm_medium=cpc

    ●名称(utm_campaign):用来标识特定的产品推广活动。示例:utm_campaign=summer_spread

    ● 关键字(utm_term):常见于付费关键字广告所使用的字词或是连结名称/图片的替代文字。示例:utm_term = web+analysis

    ● 内容(utm_content) :使用utm_content区分指向同一个网址的广告或链接。示例:utm_content=logolink或utm_content=textlink

    UTM参数包括了utm_source在内的5个参数,分别是:

    参数名称描述

    比如,我们做了一个主题为「免费试用」的市场活动,针对这个活动,我们还做了A、B两个版本用于测试,然后我们将这个活动信息通过朋友圈进行自传播。 那么,这个活动的链接就是:

       http://zhugeio.com/tryfree?

        utm_source=pengyouquan&  //来源:朋友圈

        utm_medium=SNS&  //媒介:社交网络

        utm_campaign=tryfree&  //活动:免费试用

        utm_content=A  //内容:A

    常用问题的解答:

    https://www.ichdata.com/guidelines-for-the-use-of-utm-parameters-for-google-analytics.html

    网址构建器:

    https://ga-dev-tools.appspot.com/campaign-url-builder/

    3.2 用户识别

    网站分析的主体对象是用户,用户的一次下单或访问,一笔业务的谈成。

    对于用户的识别,分网页和APP、访客和注册用户。

    访问用户

    网页的访问用户识别依据为cookie,APP的访问用户识别为设备ID。

    其次还有IP,但IP识别存在着公用IP的情况,所以对于用户的识别并不那么精准,可作为参考。

    登录用户

    一旦成为注册用户,就能获取到用户的邮箱、电话、手机、身份证号等。相对来说,这些身份信息更为精准。

    偏效果的分析,可使用注册账号来分析;偏行为的分析,可使用cookie和设备ID等。数据采集中关键在于不同日志

    车牌也是线下的身份识别依据。

    3.3 点击流模型

    相关文章

      网友评论

          本文标题:数据收集

          本文链接:https://www.haomeiwen.com/subject/jzkmbqtx.html