业务背景:
一般影响整体业绩的往往会是一些头部商品,如果发现总体指标变动较大时,首先需要去看头部商品的变动。
需求说明:
计算2017年4月销量Top10的商品以及商品类别。
计算2017年4月销量Top10的商品以及商品类别在2017年1月的销量情况。
计算2017年4月销量Top10的商品以及商品类别在2016年4月的销量情况。
计算逻辑说明:
先计算4月销量Top10商品,然后计算2017年1月、以及2016年4月每种商品的销量,然后进行链接(相当于Vlookup),就能算出本月销量Top10商品在其他月份的销量情况。
1 导入相关库
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from dateutil.parser import parse
plt.rcParams["font.sans-serif"]='SimHei'#解决中文乱码
plt.rcParams['axes.unicode_minus'] = False#解决负号无法正常显示的问题
2 导入数据
data_2017 = pd.read_csv(r"D:\360MoveData\Users\86159\Desktop\2017年1月&2017年4月数据.csv",parse_dates = ["STime"])
data_2017.head()
image.png
data_2017.info()
image.png
data_2016 = pd.read_csv(r"D:\360MoveData\Users\86159\Desktop\\2016年1月&20164月数据.csv",parse_dates = ["STime"])
data_2016.head()
image.png
image.png
3 数据预处理
data_2016["date"] = [parse(str(time)) for time in data_2016["SDate"]]
data_2017["date"] = [parse(str(time)) for time in data_2017["SDate"]]
data_2016["月份"] = [time.month for time in data_2016["date"]]
data_2017["月份"] = [time.month for time in data_2017["date"]]
image.png
4 分商品数据
还是老套路,先把要用的数据先取出来
image.png
image.png
image.png
image.png image.png
image.png
image.png image.png
5 分类别数据
image.png
image.png
image.png
image.png
image.png image.png
6 分析总结
网友评论