大数据入门篇-朝阳医院2016年销售数据分析

作者: 十三学僧 | 来源:发表于2017-08-18 22:06 被阅读0次

朝阳医院2016年销售数据分析

本关学习内容:R语言第三章(知识点链接https://zhuanlan.zhihu.com/p/28610253)和第四章(知识点链接https://zhuanlan.zhihu.com/p/28610422),简单的数据处理和分析

实践项目:根据朝阳医院2016年销售数据.xlsx分析月均消费次数,月均消费金额,客单价,消费趋势。

实践项目的:学习和使用简单的数据处理和分析,巩固和实践所学的内容,加深理解简单处理数据处理和分析的过程。

做此项目的大致流程:读取excel数据(选用openxlsx来读取)->数据预处理->数据分析;其中数据预处理包括了列名重命名,删除缺失数据,处理日期,数据类型转换,数据排序等相关知识。

下面我们就来做此项目吧!

朝阳医院2016年销售数据.xlsx部分内容如下:

一:读取excel数据

1.下载安装openxlsx包和stringr包(R语言的字符串处理包)

2.读取excel数据

二:数据预处理

列名重命名后:

三:数据分析:

业务指标1:月均消费次数

月消费次数=消费的总次数/月数

注意:同一天同一个人购买所有消费次数当算作消费一次。

本例子以社保卡号和消费时间为切入点

结果如下:

业务指标2:月均消费金额

月均消费金额=总消费金额/月份数

业务指标3:客单价pct(per customer transaction)

客单价=总消费金额/总消费次数

业务指标4:消费曲线图

本关心得:多敲代码,多练习,多做项目,才会让基础更扎实!

                                                                                                                              十三西游记(公众号十三西游记) 

                                                                                                                                                     2017/08/18记

相关文章

网友评论

    本文标题:大数据入门篇-朝阳医院2016年销售数据分析

    本文链接:https://www.haomeiwen.com/subject/cgczrxtx.html