2020年小红书数据分析笔试题
这里给大家介绍电商小红书数据分析岗位的笔试题。题目涉及的数据,是存在到数据蛙数据库中,数据获取联系小青蛙(datafrog01),一共有6道题目如下:
题目一:计算好评率
题目二:用户行为分析
题目三:使用ABTest对新算法进行评估
题目四:销量下降了怎么办
题目五:请你估算营业额(费米思想)
题目六:思维拓展
题目一:计算好评率
需要统计2019年3月1日至2019年3月31日,用户“小张”提交的“母婴”类目下“DW"品牌的好评率(好评率=‘好评’评价量/总评价量),写出sql语句进行查询。
用户评价详情表::
id(评价id,主键)
create_time (创建时间,格式‘2019-01-01’)
user_name(用户名字)
goods_id (产品id,外键)
sub_time ('提交时间',格式‘2019-01-01 23:10:01)
sat_name (评价类型,包括’好评‘,’中评‘,’差评‘)
商品详情表:b字段
goods_id (外键)
goods_name (商品类目)
brand_name (品牌名称)
解题思路
1.好评率=“好评”评价量/总评价量
2.要求**的好评率,则要使用where条件筛选指定商品的情况
3.又因为条件要指定商品名,所以要两个表做关联
select
count(1) as all_comments
sum(case when sat_name='好评' then 1 else 0 end)as good_comments
sum(case when sat_name='好评' then 1 else 0 end)/count(1) as good_rate
from redbk_userjudge as a
left join redbk_goodsinfo as b
on a.goods_id=b.goods_id
where b.goods_name='母婴'
and b.brand_name='DW'
and a.user_name='小张'
and a.sub_time>='2019-03-01'
and a.sub_time<='2019-03-31';
题目二:用户行为分析
有订单事务表:redbk_orders
有收藏事务表:redbk_favorites
请用一句sql语句取出所有用户对商品的行为特征,特征分为已购买,购买未收藏,收藏未购买,收藏且购买
解题思路:
1.需要得到user_id和item_id的购买和收藏的组合情况,使用这两个主键进行关联。
2.根据是否可以关联来判断是否购买和是否收藏。
3.使用full join外连接,但是sql使用union。
select
a.user_id,
a.item_id,
1 as '已购买',
case when b.item_id is null then 1 else 0 end as '购买未收藏',
0 as '收藏未购买',
case when a.item_id=b.item_id then 1 else 0 end as '收藏且购买'
from redbk_orders a
left join redbk_favorites b
on a.user_id=b.user_id
and a.item_id=b.item_id
union
select
a.user_id,
a.item_id,
case when b.item_id is not null then 1 else 0 end as '已购买',
0 as '购买未收藏',
case when b.item_id is null then 1 else 0 end as '收藏未购买',
case when a.item_id=b.item_id then 1 else 0 end as '收藏且购买'
from redbk_favorites a
left join redbk_orders b
on a.user_id=b.user_id
and a.item_id=b.item_id
order by user_id,item_id
;
题目三:使用ABTest对新算法进行评估
经过一番研究后,我们开发出了商品页面上“相关商品”模块的一个新的推荐算法,并且打算通过AB Test(50%用户保留原先的算法逻辑为控制组,50%用户使用新的算法逻辑为实验组)来对新的算法效果进行评估。假设你是此次实验的数据分析师,请问你会如何评估控制组和实验组的表现?(假设需要数据都可取到)请按重要性列出最重要的三个指标并给出你的分析过程/思考。
思路:
指标: 销售额、点击量、转化率
分析过程:
1.设原假设为使用新的推荐算法后上述指标降低或不变,备择假设为使用新的推荐算法后上述指标增加。
2.选择显著性水平临界值为5%,选择2周时间采集数据。
3.使用T检验,计算P值。
4.分析结论,如果P值小于5%,那么原假设不成立,备择假设成立,即使用新算法后指标提升。
反之无法推翻原假设,不能证明使用新算法后指标提升.
针对AB Test的拓展阅读,我们也提供了相应的文献,欢迎大家在最后的链接领取相关资料。
题目四:销量下降了怎么办
此题为业务题:
如果我们发现,某店铺的X品类在今年3月的销量,比去年3月的销量下降了50%,如果你是负责此次分析的数据分析师,你会如何分析?请写出你的分析思路/过程/想法。
解题思路:
1.先定位问题:外部市场环境,内部问题:渠道、新老用户、地区、时间段、某个商品
2.进行指标成分拆解
销售额 = 访客数 * 下单率 * 客单价 - 退货金额
访客数 = 新客户 + 老客户, 新客户 = 渠道的流量 * 转化率
下单率 = 页面访问量 * 转化率
订单取消率 = 订单取消数/订单总数
3.针对指标的变化进行提建议
促销活动、商品优化、渠道优化
题目五:请你估算营业额(费米思想)
小红书上海办公室楼下有一便利店,面积约为20平方米,主要提供零食及饮料。请预估该便利店每周的营业额是多少?
解题思路:
费米思想的两个步骤:
1.把问题进行拆解,直到拆解到不能拆解需要估算的基本问题
2.对基本问题的估算,不要估算其本身,而是先估算其上下界,然后在10倍的范围内估算出数值。
营业额 = 消费人数 * 平均消费金额 (区分工作日和周末)
消费人数 = 营业时间 * 单位时间消费人数 (区分高峰时段 + 低峰时段)
估算:
每天按照12h营业时间计算,其中客流量大有4h,客流量小8h(正常估)。
休息日平均营业额=1/4工作日平均营业额(正常估)。
工作日流量大的时候,每3分钟接待一人次,人均消费8元(高估)。
一个店10平米,我们假设50%的比例,那就是10个平米可以站下5个人(低估)。
那这样工作日高峰时间段每小时消费人数= 1h/3min * 5 = 20 * 5 = 100 个,非高峰就算30个(高估)
那工作日一天 营业额 = 4 h * 100 个 * 8元 + 8 h * 30 个 * 8元 = 5120
一周的营业额 = 5120 * 5 + 5120/4 * 2 = 28160
题目六:思维拓展
如果APP有一个功能是用户的位置信息能够每隔1分钟上传一次数据库,那么怎么发挥它的作用?
1.根据定位信息可以获取用户的生活区域,从而分析出用户的消费水平,推荐相应价格区间适合用户消费的商品。
2.可以分析用户的活动习惯,例如如果用户经常出入健身房可以推荐运动器材,如果用户经常出入服装店,美容店餐厅等地可以为用户推荐服装,美容项目等。
3.推测用户的职业,比如教师,医生,程序员等,为他们推荐符合他们职业需求的商品。
4.用户位置实时地向用户推荐周边的生活服务,比如提供附近的商店,附近的住宿等等。还原用户行为轨迹,交通拥堵分析,热点区域确定,各区域停留时长,从而确定用户的行为习惯,进行更好的服务提供、及消费迎合。
参考
- 文章需要的数据源联系:datafrog01
-
题目讲解视频链接如下:
网友评论