客户端请求通过Nginx负载均衡发往Tomcat服务器,在Tomcat服务器中产生日志。
日志字段
字段名称 | 说明 |
---|---|
date | 日期,代表这个用户点击行为是在哪一天发生的 |
user_id | 用户 ID,唯一标识某个用户 |
session_id | Session ID,唯一标识某个用户的一个访问 session |
page_id | 页面 ID,点击了某些商品/品类,也可能是搜索了某个关键词,然后进入了某个页面,页面的 id |
action_time | 动作时间,这个点击行为发生的时间点 |
search_keyword | 搜索关键词,如果用户执行的是一个搜索行为,比如说在网站/app 中,搜索了某个关键词,然后会跳转到商品列表页面; |
click_category_id | 点击品类 ID,可能是在网站首页,点击了某个品类(美食、电子设备、电脑) |
click_product_id | 点击商品 ID,可能是在网站首页,或者是在商品列表页,点击了某个商品(比如呷哺呷哺火锅 XX 路店 3 人套餐、iphone 6s) |
order_category_ids | 下单品类 ID,代表了可能将某些商品加入了购物车,然后一次性对购物车中的商品下了一个订单,这就代表了某次下单的行为中,有哪些商品品类,可能有 6 个商品,但是就对应了 2 个品类,比如有 3 根火腿肠(食品品类),3 个电池(日用品品类) |
order_product_ids | 下单商品 ID,某次下单,具体对哪些商品下的订单 |
pay_category_ids | 付款品类 ID,对某个订单,或者某几个订单,进行了一次支付的行为,对应了哪些品类 |
pay_product_ids | 付款商品 ID,支付行为下,对应的哪些具体的商品 |
city_id | 城市 ID,代表该用户行为发生在哪个城市 ,和城市信息表做关联 |
日志数据(user_visit_action.csv)采样
2019-05-05,60,be4f888f-9c0b-44c7-8ecc-1865379b85d9,6,2019-05-05 01:18:12,,18,84,,,,,2
2019-05-05,60,be4f888f-9c0b-44c7-8ecc-1865379b85d9,23,2019-05-05 01:20:00,,14,15,,,,,25
2019-05-05,60,be4f888f-9c0b-44c7-8ecc-1865379b85d9,11,2019-05-05 01:29:37,,9,36,,,,,26
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,8,2019-05-05 01:38:17,,17,73,,,,,3
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,18,2019-05-05 01:41:04,,5,95,,,,,26
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,11,2019-05-05 01:48:45,,5,77,,,,,13
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,46,2019-05-05 01:52:50,,2,87,,,,,6
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,14,2019-05-05 01:53:25,,14,62,,,,,2
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,8,2019-05-05 02:02:38,,-1,-1,,,1-2-3,1-2-3,20
2019-05-05,85,e2eef06e-beaa-4b49-acaf-38e057e1cd6e,48,2019-05-05 02:08:07,,7,13,,,,,5
网友评论