不知道大家在访问网站的时候,会不会疑惑为什么我的所有信息都会被网站“看到”呢?比如说我上网的地理位置、点击了哪个页面、在网站停留了多长时间、花了多少钱等等。其实我们的所有操作都会被网站“看到”,也就是被统计起来,网站统计之后的数据就是大家常常听到的 UV、PV、Session 等等之类的网络术语(之后我会展开阐述各个概念),但是作为一名求知欲旺盛的少年,怎么能止步于 What 层面,我们还要知道 Why and How。
网站是如何看到用户的问题,其实专业来讲,是用户识别的问题。接下来,我们一一来展开分析。
一般而言,我们会使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作为识别用户身份的手段。这些方法都有各自的优劣,比如,移动端常用 Mobile Mumber、SIM ID 等来识别用户,网站常用 Cookie 来识别用户。而在此,我们也关注 IP 和 Cookie,重点阐述下两者的概念和优劣。
因此,特将常用网站数据分析方面的概念整理出来,分享给大家。
IP,Internet Protocol,独立IP
IP 为计算机网络相互连接进行通信而设计的协议,是连接到网上的所有计算机网络实现相互通信的一套规则,我们每台可以上网的电脑都有一个 IP,且在全世界范围内是唯一的。因此 IP 的唯一性被用来作为网站表现的一个指标。
插播插播:在向具体说明IP和Cookie的使用之前,先向大家介绍一个实用的工具 GA,知道 GA 是什么的小伙伴儿可以直接略过这段了。GA,即 Google Analytics,是 Google 提供的一个统计网站、App 等互联网产品数据的数据分析工具,可以对用户的年龄、性别、地理位置,PV、UV、访问时长、访问页面、跳出率、等指标进行统计,对分析网站或是 App 有很好的帮助作用。 如果还是比较抽象的话,可以理解成国外的百度统计,当然百度统计要比 GA 开发的晚得多了。之前做过网站站长或是App运营的人可能使用过这个工具,但由于 Google 如今退出中国,可能有很多小伙伴儿们不太清楚 GA 是什么,因此插播此段。
GA 不使用 IP 地址来识别访问者的身份,但是会追踪每个访问者的 IP 地址信息,且整个追踪过程是在 Google 服务器端完成的,不会在 GA 的返回数据中看到。那么 GA 统计 IP 地址的意义仅是用来识别访问者的地理位置信息。这个地理位置信息会以地图的方式展现给我们,告诉我们用户活跃的大致位置。
Cookie,浏览器缓存
Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user's computer by the user's web browser while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.
网站为了辨别用户身份,追踪 session 等数据跟踪而预先储存在用户本地终端上的通常经过加密的数据。Cookie 是网站以一小段文本的形式存放在用户本地终端的信息,以便网站之后的读取,基本能够唯一对应到用户的访问终端,但要预先写入访问终端,同时还是在用户允许使用 Cookie 的前提下。
听起来 Cookie 也有劣势,那为什么我们要放弃使用 IP 的统计而转向使用 cookie 的方式呢?
IP 和 Cookie 的比较显而易见,Cookie 比 IP 更准确,这也就是为什么网站现在都使用 Cookie 来识别用户了。那么问题来了,网站是如何通过 Cookie 来识别用户身份的呢?
当用户使用客户端第一次访问某个网站服务器时,比如 Baidu.com,那么 Baidu.con 的网站服务器就会预先写入一段 Cookie 到客户端上。GA 通过随机数和时间戳来生成字符串来唯一标识用户,且还会记录一些访问信息,比如访问的页面、访问的时间等,而当我们再次访问 Baidu.com 的时候,服务器会直接找到 Cookie 信息,更新一些访问信息,但是并不会更改唯一表示的用户信息。之后也会使用 Cookie 对用户的 session、UV、PV 等数均进行统计,也就是生成了大家平日里常见的数据指标了。
网友评论