美文网首页
自行车业务分析 1.1

自行车业务分析 1.1

作者: 人间桑 | 来源:发表于2020-06-08 19:08 被阅读0次

    一、自行车整体销售表现

    1.1、从数据库读取源数据:dw_customer_order

    作业 1.1.1、从Mysql读取dw_customer_order,形成DataFrame格式,赋予变量gather_customer_order,注意Mysql账号是有adventure_ods权限

    #读取源数据。不同城市,每天产品销售信息

    #创建数据库引擎

    engine = create_engine("mysql://frogdata001:Frogdata!123@106.13.128.83:3306/adventure_ods?charset=utf8")

    gather_customer_order=pd.read_sql_query('select * from dw_customer_order',con=engine)

    #设定对应数据库的引擎,然后引用引擎

    #查看源数据前5行,观察数据,判断数据是否正常识别

    gather_customer_order.head()

    作业 1.1.2、查看源数据类型:dw_customer_order

    gather_customer_order.info()

    作业 1.1.3、利用create_date字段增加create_year_month月份字段

    #查看数据类型

    gather_customer_order['create_date'][0]

    #增加create_year_month月份字段。按月维度分析时使用

    gather_customer_order['create_year_month']=gather_customer_order.create_date.apply(lambda x:x.strftime('%Y-%m'))

    gather_customer_order['create_year_month'].head()

    #注意strftime用法

    #关于时间与字符串的相互转换:https://www.cnblogs.com/strivepy/p/10436213.html

    https://www.csdn.net/gather_2c/MtjaMg5sNTM0LWJsb2cO0O0O.html

    作业 1.1.4、筛选产品类型cplb_zw中的自行车作为新的gather_customer_order,目前存在如图情况,你需要剔除掉其余2个

    #筛选产品类别为自行车的数据

    gather_customer_order = gather_customer_order[gather_customer_order['cplb_zw']=='自行车']

    gather_customer_order.head()

    相关文章

      网友评论

          本文标题:自行车业务分析 1.1

          本文链接:https://www.haomeiwen.com/subject/jihdtktx.html