网站是如何看到用户的

作者: 产品美景 | 来源:发表于2017-12-08 12:09 被阅读154次

    不知道大家在访问网站的时候,会不会疑惑为什么我的所有信息都会被网站“看到”呢?比如说我上网的地理位置、点击了哪个页面、在网站停留了多长时间、花了多少钱等等。其实我们的所有操作都会被网站“看到”,也就是被统计起来,网站统计之后的数据就是大家常常听到的 UV、PV、Session 等等之类的网络术语(之后我会展开阐述各个概念),但是作为一名求知欲旺盛的少年,怎么能止步于 What 层面,我们还要知道 Why and How。

    网站是如何看到用户的问题,其实专业来讲,是用户识别的问题。接下来,我们一一来展开分析。

    一般而言,我们会使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作为识别用户身份的手段。这些方法都有各自的优劣,比如,移动端常用 Mobile Mumber、SIM ID 等来识别用户,网站常用 Cookie 来识别用户。而在此,我们也关注 IP 和 Cookie,重点阐述下两者的概念和优劣。

    因此,特将常用网站数据分析方面的概念整理出来,分享给大家。

    IP,Internet Protocol,独立IP

    IP 为计算机网络相互连接进行通信而设计的协议,是连接到网上的所有计算机网络实现相互通信的一套规则,我们每台可以上网的电脑都有一个 IP,且在全世界范围内是唯一的。因此 IP 的唯一性被用来作为网站表现的一个指标。

    插播插播:在向具体说明IP和Cookie的使用之前,先向大家介绍一个实用的工具 GA,知道 GA 是什么的小伙伴儿可以直接略过这段了。GA,即 Google  Analytics,是 Google 提供的一个统计网站、App 等互联网产品数据的数据分析工具,可以对用户的年龄、性别、地理位置,PV、UV、访问时长、访问页面、跳出率、等指标进行统计,对分析网站或是 App 有很好的帮助作用。 如果还是比较抽象的话,可以理解成国外的百度统计,当然百度统计要比 GA 开发的晚得多了。之前做过网站站长或是App运营的人可能使用过这个工具,但由于 Google 如今退出中国,可能有很多小伙伴儿们不太清楚 GA 是什么,因此插播此段。

    GA 不使用 IP 地址来识别访问者的身份,但是会追踪每个访问者的 IP 地址信息,且整个追踪过程是在 Google 服务器端完成的,不会在 GA 的返回数据中看到。那么 GA 统计 IP 地址的意义仅是用来识别访问者的地理位置信息。这个地理位置信息会以地图的方式展现给我们,告诉我们用户活跃的大致位置。

    Cookie,浏览器缓存

    Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user's computer by the user's web browser while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.

    网站为了辨别用户身份,追踪 session 等数据跟踪而预先储存在用户本地终端上的通常经过加密的数据。Cookie 是网站以一小段文本的形式存放在用户本地终端的信息,以便网站之后的读取,基本能够唯一对应到用户的访问终端,但要预先写入访问终端,同时还是在用户允许使用 Cookie 的前提下。

    听起来 Cookie 也有劣势,那为什么我们要放弃使用 IP 的统计而转向使用 cookie 的方式呢?

    IP 和 Cookie 的比较

    显而易见,Cookie 比 IP 更准确,这也就是为什么网站现在都使用 Cookie 来识别用户了。那么问题来了,网站是如何通过 Cookie 来识别用户身份的呢?

    当用户使用客户端第一次访问某个网站服务器时,比如 Baidu.com,那么 Baidu.con 的网站服务器就会预先写入一段 Cookie 到客户端上。GA 通过随机数和时间戳来生成字符串来唯一标识用户,且还会记录一些访问信息,比如访问的页面、访问的时间等,而当我们再次访问 Baidu.com 的时候,服务器会直接找到 Cookie 信息,更新一些访问信息,但是并不会更改唯一表示的用户信息。之后也会使用 Cookie 对用户的 session、UV、PV 等数均进行统计,也就是生成了大家平日里常见的数据指标了。

    相关文章

      网友评论

      • Leeyc1992:很好奇他们收集之后是按什么方式存的。就比如说淘宝,要是按每个用户访问了哪些模块那样存数据,数据库记录这么多数据得多大啊。。
        Leeyc1992:@产品美景 感谢,长知识了
        产品美景:@Leeyc1992 肯定不会把所有的浏览记录都存下来的,浏览记录应该是以缓存的方式在用户本地存储一些,还可以有专门的缓存服务器。再加上精准的推荐算法,每个账户看起来真的越来越有个性。当然,逻辑是这样的,淘宝怎么实现的应该就有故事的多了……
      • 产品美景:不要脸地给自己点个赞,不然都没动力了。

      本文标题:网站是如何看到用户的

      本文链接:https://www.haomeiwen.com/subject/nvkeixtx.html