数据来自哪里?
存储层:各种用户信息表,产品,设备,
报表层:提取存储层里的信息形成报表
分析计算层:进一步的展示分析报表
展示层:
看什么数据?
渠道指标:渠道标识,pv,uv,下载
用户相关:新增用户,注册用户,活跃用户,用户活跃度,客单价
收入相关:收入,毛利,净利,成本
效率相关:流量转化,活跃转化,留存率,付费比
如何选择合适的数据?
存在的问题
技术样本不够:比如发了1000份调查问卷,我们只是拿到了愿意填调查问卷的人的建议,没有拿到哪些不愿意搭理我们人的建议。
辛普森悖论
得到的数据代表什么?平均数代表大众吗?等等
数据用最小颗粒度搜集
数据真实,避免盲区:调研报表数据就不真实,开机时间是真实的
数据统计的样本覆盖足够大
数据抽样的方法科学
数据会进行标准化的处理:有的特殊数据要标准化处理
业务指标综合多种情况来看
网友评论