美文网首页IAPP CIPT认证
CIPT基础知识-用户跟踪(1/2)-常用标识符

CIPT基础知识-用户跟踪(1/2)-常用标识符

作者: 遥望潇湘 | 来源:发表于2022-09-16 14:31 被阅读0次

    在现在这样一个全面数字化的时代,大家在使用产品与服务时对自己主动提交给企业的数据是有明确意识的,比如我们使用短视频时的观看记录,电商平台上的购买与评价。但你不知道的是这些科技企业使用用户跟踪技术收集和处理了我们更多的个人数据,无论是在线上还是线下的场景中。本文希望可以帮助大家理解目前被广泛使用的用户跟踪与数据采集方式。

    用户跟踪标识符

    用户跟踪技术更新最主要的推动力量是各广告公司,包括谷歌,Meta,BATJ这样的媒体平台,也包括广告生态内的其他科技企业。与此同时,随着竞争的加剧,各品牌企业对于更多采集消费者数据,进行精准营销和针对性产品与服务提升也有强烈的动力。为了实现这些目的,它们会缓慢但持续的收集我们日常生活中的各类数据点(网络浏览行为,购买记录,行踪等),通过汇聚分析,针对每个用户构建用户画像,用以反映用户的个人属性,行为特征,兴趣爱好与预测分析。下图是某平台的身份标签示意图,可以看到其中绝大部分信息并不是用户主动提供,而是通过其他信息的聚合分析而来。

    图1-用户画像示例-来自JD

    要实现构建真实用户的画像,不仅要求收集全面的信息,同时要满足每次收集的信息都包含个人身份标识符,才能实现数据正确关联回特定消费者,支持后续的聚合分析。

    用户跟踪过程中,可以使用直接标识符(手机号码,社媒账号等),也可以是间接标识符(设备号,IP等),只要这些标识符能够指向具体某个消费者或消费者的设备。 

    下面是用户跟踪技术中常用的标识符

    1-Cookie

    Cookie本身是浏览器在浏览页面时存储的一个短文本,它临时存储一些用户在当前浏览网站的信息,用于提升网站使用体验,比如判断是否访问过当前页面或记录临时ID减少重复登录。

    Cookie还有一方cookie和三方cookie之分,访问网站A的时候,A域名下的cookie是一方数据,其他域名下的cookie数据被称为三方cookie。三方cookie是网站浏览时实现跨域跟踪的核心方式。细节我们下一节详细介绍。

    图2 - Cookie

    2-IP地址

    所有的设备联网都会被分配P地址,它也是最容易被采集的识别信息,每次网络信息交互都需提供给对方真实IP地址。虽然我们大部分人使用的IP地址都是联网时由ISP(网络服务提供商:电信,移动)临时分配,所以并不是永远固定。但它在一段短时间内(比如几小时内)是稳定的,且能通过共用IP地址反映不同上网设备间的关系,所以它仍然是有效的跟踪ID。

    3-浏览器指纹

    浏览器指纹是设备指纹中的一种,它通过在浏览器上运行特定代码,采集当前设备和浏览器的多种信息,来形成一个独特的可识别ID,来区分用户所用的设备。浏览器的设备指纹通过在浏览器执行js或在flash代码,获取设备信息。比如UserAgent、时区、屏幕大小、浏览器插件、系统安装字体、浏览器的canvas的特征、浏览器的webgl特征,然后计算后输出为一个特定ID。因为这些参数在单个设备上会保持稳定,且不同设备间会略有差异,所以浏览器指纹的有效识别率可以超过99%。

    请注意它不是设备自带的ID,而是网站通过在网页中嵌入代码来完成计算和采集的。浏览器指纹的生成和采集成本低(开源代码+网页嵌入),用户完全无感知,是一种非常高校的用户跟踪方式,被广泛使用在风控场景中。

    4-电话号码

    电话号码在国内被普遍用于实名身份认证,是最能指向具体消费者的标识符。在用户不主动填写的情况下,无论是网站还是APP是无法直接采集回用户手机设备的电话号码。只有部分灰产能利用运营商的接口,在你的网络流量数据中获取到你真实手机号码,即当你用手机网络访问某些网页时,网站后台不仅能记录你的访问行为,且能通过运营商获取到你真实的手机号码。

    5-手机设备标识符-IMSI&IMEI

    国际移动用户识别码(IMSI:International Mobile Subscriber Identification Number)是SIM卡绑定的标识符,它和电话号码是一一对应的。而IMEI(International Mobile Equipment Identity)是移动设备国际身份码的缩写,移动装备国际辨识码,是由15位数字组成的"电子串号",它是手机设备本身的识别码。

    理论上手机APP可以通过操作系统授权获取IMSI和IMEI,但现在iOS已经不再提供该功能,而andriod10以后安卓app也再拿不到真实IMEI了。

    6-广告标识符

    因为设备ID的不可更改个性,手机操作系统推出了各种可重置的广告ID来支持用户跟踪。iOS上是IDFA(Identifier For Advertising),但从iOS14开始,每个APP想采集IDFA,都会弹框让用户给出明确授权。所以现在iOS平台上基本也采集不到IDFA。

    安卓平台上有Andriod_ID(谷歌推的)和OAID(Open Anonymous Device Identity, 信通院联合国内手机厂商推的标识符)。国内只能使用OAID,考虑到这个ID可以由用户自己手动重置,也算是能部分保护用户隐私,比以前每个APP都能获取IMEI要好很多。

    7-MAC地址

    MAC(Media Access Control)地址是每一个上网设备都有的唯一硬件识别码。象手机/电脑上的有网卡以及蓝牙设备都有自己独特的MAC地址。

    手机操作系统以及不再允许APP获取自身的MAC地址。但为了发现周边网络和设备,无线网卡和蓝牙设备会一直向外发送广播,该广播就包含了自己的MAC地址,这会暴露设备信息。

    8-SSID

    SSID(Service Set Identifier)是无线网络的标识,我们家中的wifi都有一个独特的SSID。无线路由器会持续广播SSID,便于家中其他设备发现和连接进入网络。

    桌面应用和移动app都可以采集到wifi的SSID,利用它可以猜测出设备间的关系。比如休息时间一直连接同一个wifi的设备很可能属于同一个家庭。通过设备周围的SSID信息,也能推断出设备的大致位置,因为我们的路由器更换频率低。如果你的手机能发现某个已知位置的wifi,那就能知道你也在这个位置周边。

    下图是这些跟踪用标识符的特性对比

    图3 - 标识符特性

    在实际使用场景中,数据汇聚时会结合多个标识符利用算法与规则做身份识别(Identity Resolution),创建出OneID后,再关联所有信息计算标签,生成用户画像。请继续阅读下一章 - 常见用户跟踪手段

    参考资料

    1. CIPT官方教程 - 《An Introduction to Privacy for Technology Professionals》

    2. EFF基金会 - A Deep Dive Into the Technology of Corporate Surveillance

    3. 简书 - IMSI与IMEI的区别 作者:石小泉

    相关文章

      网友评论

        本文标题:CIPT基础知识-用户跟踪(1/2)-常用标识符

        本文链接:https://www.haomeiwen.com/subject/mhhjortx.html