细分思维的两种维度:1、横向细分对一个主体按照树形结构不断细分到最小分支的过程;产品标题-->关键词-->类目词+...[作者空间]
join长尾 背景 sql在join执行阶段会将join key相同的数据分发到同一个执行instance上处理。...[作者空间]
用户分析是电商数据分析中重要的模块,在对用户特征深度理解和用户需求充分挖掘基础上,进行全生命周期的运营管理(拉新-...[作者空间]
开始阅读《数据运营之路--掘金数据化时代》规模大小、流通速度、多样性是数据的内在属性,而数据通过业务逻辑、挖掘数据...[作者空间]
题目一:计算好评率 需要统计2019年3月1日至2019年3月31日,用户“小张”提交的“母婴”类目下"DW"品牌...[作者空间]
背景: 随着移动设备的完善和普及,移动互联网+各行各业进入了高速发展的阶段,这其中以O2O(Online to O...[作者空间]
数据分析的魅力不在于数据,而在于分析[作者空间]
数据源:文档:同一压缩包下的订单对应呼叫、应答、取消、完单时间(抽样100名乘客)内容:2018年3月5日-201...[作者空间]
RFM分析方法是指通过影响企业销售和利润的客户行为字段里的最看重的3个变量:R(Recency),客户消费新鲜度,...[作者空间]
数据化运营中的数据分析项目类型比较多,涉及不同的业务场景、业务目的和分析技术。一个成功的数据分析项目,首先要有准确...[作者空间]
关于分析师,数据分析师将直接面临新的挑战(也是一次转型机会):在原有分析师职业定位上,为了与业务应用更加贴合,开始...[作者空间]
窗口函数作为辅助列在计算中的应用题目一:存在一张学生成绩表(class),字段有year、subject、stud...[作者空间]
题目1: 有十万个淘宝店铺,每个顾客访问任意一个店铺时都会生成一条访问日志。访问日志存储表为visit,其中访问用...[作者空间]
hive中groupby优化_HiveSQL常用优化方法全面总结[https://blog.csdn.net/we...[作者空间]
1、rank() over()--1,2,2,4 注意:使用rank()over()的时候,空值是最大的,如果排序...[作者空间]
常见的信用风险模型有下面三种: Application(申请评分)模型 通过客户申请时的信息,预测客户将来发送违约...[作者空间]
问题: 在pandas中的数字一直以科学计数法显示,不便于查看 解决办法:[作者空间]
错误描述: 解决方法: 使用二进制写入模式(‘wb’)来开启待操作文件,采用字符写入模式(‘w’)。 即可解决。[作者空间]
一、几个基础概念 1、贝叶斯理论:先验分布+数据(似然)=后验分布2、二项分布、Beta分布与共轭分布先验分布和后...[作者空间]
或者 但group by 的效率要优于distinct.[作者空间]