一、学习目标:
1.清晰数据分析的概念与类型。
2.能够运用方法与工具进行数据分析。
3.能够结合自身的工作应用数据分析。
二、教学大纲
课程目录三、课程内容
沃尔玛经典营销案例:啤酒与尿布数据可以为我们带来什么?
单纯的数字仅是一个符号或是一种表述,是一种线索更是引发我们思考的源头,关联的数字放在一起会为我们带来怎样的不同呢?
“啤酒与尿布”的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。
在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店,直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入,这就是“啤酒与尿布”
思考现在让我们来练一练,A客户1季度的拿货量是30公斤,看到这个描述,您有哪些想法呢?
a.这个客户的拿货量在所有客户中的排名是怎样的?
b.这个客户的拿货量与去年同期有什么变化?
c.与同样拿30公斤货品的其它客户对比,货品结构有什么相同与不同?
d.第一季每个月的拿货量和销量的态势是否一致?
e.从每一季度的拿货量,您得到的结论是预判是怎样的?
数据分析的类型数据分析概念
数据分析指收集数据,加以汇总、整理、分析,提取有用信息和形成结论的过程。
数据分析类型
1、描述性数据分析
包括样本基本资料的描述,作各变量的次数分配及百分比分析,以了解样本的分布情况。主要作用是对数据有一个整体概览,平均值可以体现整体的平均水平;最大值、最小值可以体现数据的范围;众数可以体现最经常出现的数值(这个一般较少用到);中位数可以体现居于中间位置的数据;标准差体现这一组数据波动情况,标准差越小,说明一组数据彼此越接近,标准差越大,说明一组数据内部差异越大。此外,以平均数和标准差来描述市场导向、竞争优势、组织绩效等各个构面,以了解样本企业的管理人员对这些相关变量的感知,并利用t检验及相关分析对背景变量所造成的影响做检验。
2、探索性数据分析(exploratory factor analysis)
从一组变量中抽取公共因素时,没有或不用先前的经验,有多少个公共因素影响观测变量,公共因素之间、特殊因素之间的关系等,都需要通过对观测数据的分析来探知。这种因素分析假定:(1)各观测变量均直接受全部公共因素影响(2)各观测变量都只受一个特殊因素影响;(3)特殊因素之间互不相关;(4)所有公共因素与所有特殊因素都不相关:(5)所有的公共因素之间均不相关或均相关。
4、验证性数据分析
你已经有事先假设的关系模型等,要通过数据分析来对你的假设模型进行验证。
数据类型包括结构化数据和非结构化数据,前者包含二分类型如性别,男或女;多分类型如职业有市场、财务、人力资源等;有序类型如进货量,10公斤、20公斤、30公斤等;数值类型如年龄、收入等。而非结构化数据,包括文本、音频、视频、图片等。
常用指标1.平均数:
算术平均数:(arithmetic mean)是指在一组数据中所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。
把n个数的总和除以n,所得的商叫做这n个数的算术平均数。
平均数公式应用举例1,3月8日妇女节某区域的同规模客户拿货A系列的平均金额或公斤是X,对比发现U客户少于平均数,则我们需要判断与沟通确认是什么原因导致U少拿了,是对货品没有信心,还是对促销期备货不敏感,亦或是在其它品牌拿了货品。
应用举例2:在店铺中有五名员工,1月的店铺平均人效是X,则拿每个人的人效与平均人效对比,对于超过平均人效的员工进行嘉奖,并分析超出的原因总结经验进行复制;对于低于平均人效的人员进行鼓励并分析原因,是什么导致人效较低,该从哪几个方面进行改善并在下一个付诸行动。
2.绝对数与相对数
绝对数:通常反映一定时间、地点条件下的规模、水平,带有各种单位,比如某个区域的粮食总产量、固定资产投资额、社会消费品零售总额等。
相对数:通常以增长幅度、增长速度、指数、倍数等表现形式出现,比如各类价格指数、GDP增长率、规模以上工业增加值增长率等。
相对数往往是对绝对数进行加工后取得的。在统计中,绝对数和相对数的组合运用既能反映水平,也能反映速度,以此来全面地描述经济社会现象,比如2017年二季度X品牌销售额达2234万元,这是绝对数,同比增长1%,这个1%就是相对数。
3.百分比与百分点
百分数(或称百分比)是一种表达比例,比率或分数数值的方法,通常不写成分数的形式,而采用百分号(%)来表示,如82%代表百分之八十二,或82/100、0.82。成和折则表示十分之几,举例如“七成”和“七折”,代表70/100或70%或0.7,百分比后面不能接单位。
增减百分比,是表述某一指标报告期水平比基期水平增加或减少的相对程度,是以百分比(%)表示的,其计算公式为:
增(减)速度(%)=(某指标报告期数值-该指标基期数值)*100%
增(减)速度(%)=某指标报告期数值*100%-100%
百分点是指不同时期以百分数的形式表示的相对指标(如:速度、指数、构成等)的变动幅度,是用以表达不同百分数之间的“算术差距”(即差)的正确单位。百分点是百分比中相当于1%的单位,它是一个量词。它是分析百分比增减变动的一种表现形式。当两个百分数比较时,如果用“和”或“差”表示,称为百分点。
例如,某客户销售额今年增长速度是19%,去年增长速度为16%,今年比去年的增长幅度提高了3个百分点(19%-16%)而不是说提高了3%。
例如,今年销售上升了8%,去年销量上升了10%,今年比去年销量上升幅度下降了2个百分点(8%-10%),而不是降低了2%。
用百分数表达其比例关系,或者百分点表达其数值差距。
4.频数与频率
频数:频数是事件的实际发生次数,表示某一项或某一组出现的次数,是直观的数量;
频率:频率是事件的发生率,是对于总体而言该组在总体中所占的比例,频数/总数=频率,频率总数一定等于1。
频率=频数/总次数
例如:将一枚硬币抛五次,假设正面在上3次,反面2次,那么总次数是5,事件“正面在上”的频数是3,它的频率=3/5;事件“反面在上”发生的频数是2,它的频率=2/5。
5.比例与比率
比例,比例是一个总体中各个部分的数量占总体数量的比重,用于反映总体的构成或者结构。
正比例:两种相关联的量,一种量变化,另一种量也随着变化,如果两种量中相对应的两个数的比值(商)一定,这两种量就叫做成正比例的量,他们的关系叫做正比例关系。如果用字母x和y表示两种关联的量,用k表示它们的比值,成正比例关系可以用下面式子表示:y/x=k(一定)
反比例:两种相关联的量,一种量变化,另一种量也随着变化,如果两种量中相对应的两个数的乘积一定,这两种量就叫做成反比例的量,他们的关系叫做反比例关系。如果用字母x和y表示两种关联的量,用k表示它们的乘积,成反比例关系可以用下面式子表示:xy=k(一定)
例如,旅途所需的时间与旅行速度成反比;挖洞所需的时间(大概)与挖掘人数成反比。
比率,即比值,两数相比所得的值。比率表示总体中的一部分与总体作比较,一般用百分比的形式表示。
6.倍数与番数
倍数一个整数能够被另一个整数整除,那么这个整数就是另一整数的倍数。
①一个整数能够被另一个整数整除,这个整数就是另一整数的倍数。如15能够被3或5整除,因此15是3的倍数,也是5的倍数。
②一个数除以另一数所得的商。如a÷b=c,就是说,a是b的倍数。例如:A÷B=C,就可以说A是B的C倍。
③一个数的倍数有无数个,也就是说一个数的倍数的集合为无限集。
注意:不能把一个数单独叫做倍数,只能说谁是谁的倍数。
翻番:数量成倍增长的意思,成积数增长。
翻倍:基数乘倍数。
举例:
原本N
翻番是2N,翻两番是2²N=4N
翻倍是x2,翻两倍是(1+2)N=3N
“翻n番”就是乘以2的n次方。举例:5翻3番是:5*2^3=40
"翻n倍"就是乘以(1+n)。例如:5翻3倍是:5*(1+3)=20
目录2:数据分析流程 明确目的 目的有三 营运规划寻找客户未来的成长引擎,如从人效、货品结构、客单价、卖场布局及情景营销方面。
确定客户发展的助力和阻力,老板的成就动机评估,运营的资金评估,店铺SWOT的评估。
为长期规划和短期规划制定“Growing map"发展路线图,或是梦想版。
营运规划比如,新年期间黄金的购买量增多;年纪大些的对推拉手镯的接受度高(结合到终端客户的年龄及销售数量与其它款式的进行对比),年轻的对光面简约款更为青睐(同样结合年龄和销量二个维度来进行对比)。
第一季度的期初确定的指标是X元,第1月达成Y元,第2月达成Z元,第3月达成N元,则达成率=(Y+Z+N-X)/X*100%,如大于100%打出做对了什么,如小于100%找出未达成的原因。
绩效分析量化的KPI,如X月计划开店数Y,实际达成Z,达成率Z-Y〉0则达标,否则未达成指标。
量化的KPI,老客户翻牌计划数Y,实际达成Z,达成率Z-Y〉0则达标,否则未达成指标。
量化的KPI,如X月的计划销售额是Y元,实际达成Z元,达成率Z/Y*100%-1〉0则达标,否则未达成指标。
盈亏平衡点(Break Even Point,简称BEP)又称零利润点、保本点、盈亏临界点、损益分歧点、收益转折点。通常是指全部销售收入 等于全部成本时(销售收入线与总成本线的交点)的产量。以盈亏平衡点的界限,当销售收入高于盈亏平衡点时企业盈利,反之,企业就亏损。盈亏平衡点可以用销售量来表示,即盈亏平衡点的销售量;也可以用销售额来表示,即盈亏平衡点的销售额。
目录之数据收集数据结合使用目的的不同,收集的渠道也不同,如果进行经营分析则需要从数据库中提取;如果是用于行业分析则从公开的出版物进行提取;如果是进行托管项目则是通过市场调查获取。
数据收集前可结合目的进行模板的设定,并依据设定的字段进行数据的收集与整理。
目录之数据处理 数据处理数据处理抱括数据的清洗和数据的加工,在我们获取到原始数据后,可能其中的内容不都适用于分析,为了清晰地进行分析,可以进行清洗。
重复的数据:可以通过排序,手工删除重复的数据;可以用COUNTIF函数 。
缺失的数据:发现并及时进行补充,定位输入CRTL+G,查找替换CRTL+F,重复输入CRTL+回车键。
检查数据逻辑:如白天营业而数据发生期在晚上,则数据逻辑是有问题的,需要核实。利用IF函数进行处理。
数据的加工:
数据抽取-采用查找、透视表、IF等功能进行处理。分段分列用LEFT、RIGHT;字段合并用&,字段匹配VLOOKUP。
数据计算-加减乘除;函数计算平均值AVG,最大MAX,最小MIN。
数据分组-比如收到的调研,大家事先没有统一格式,那么就要将关键词进行分组对照分析。或者从不同的EXCEL表中调数据可以用函数VLOOKUP。
数据转换-如有人写的日期是2018-6-9有人写的是9th,JUNE,2018,那么就需要在EXCEL中的单元格设置中设置日期格式为XX年XX月XX日,统一格式,方便对比和分析。同时还有数据表的行列转换,可以通过选择性粘贴实现,数据录入方式转变换通过格式设定达成。
目录之数据分析 4P理论价格:价位带同样是品牌定位的关键因素,如在手机中众所周知的华为手机分为几个不同系列的价位带,有商务的MATE系列,荣耀和畅玩系列都是针对不同消费群体的。再者如眼镜品牌中的木九十价位带定在了600-900为主价格带,正好处于韩国潮牌和国内眼镜超市的空白地带。
促销:结合到店铺的不同生命周期使用不同的促销手法,如刚开业的店铺为了提升知名度和客流量促销的目的在于引流;老店铺的促销则在于VIP顾客的回店与激活。
场地:PLACE可以翻译为渠道也可以翻译为场地,鉴于对于可控因素的把控在此视为场地,因为渠道定了是在一定的周期才能进行调整的。而店铺场地内的内容则是可以进行调整的,如动线、拦截点、陈列等。
产品:产品可谓是零售的魂,让产品会说话,让产品可以有别于其它的产品是我们长期不断提升的追求,结合到生活方式、结合到场景化,挖掘产品的USP及FAB并且运用TPO,同时进行人货对接才能让产品真正活泛起来。
逻辑树逻辑树又称问题树、演绎树或分解树等。麦肯锡分析问题最常使用的工具就是“逻辑树”。逻辑树是将问题的所有子问题分层罗列,从最高层开始,并逐步向下扩展。
把一个已知问题当成树干,然后开始考虑这个问题和哪些相关问题或者子任务有关。每想到一点,就给这个问题(也就是树干)加一个“树枝”,并标明这个“树枝”代表什么问题。一个大的“树枝”上还可以有小的“树枝”,如此类推,找出问题的所有相关联项目。逻辑树主要是帮助你理清自己的思路,不进行重复和无关的思考。
逻辑树能保证解决问题的过程的完整性;它能将工作细分为一些利于操作的部分;确定各部分的优先顺序;明确地把责任落实到个人。
逻辑树是所界定的问题与议题之间的纽带;它能在解决问题的小组内建立一种共识。
用户行为以上这个案例是互联网的一个举例,实际我们在零售环节可以结合到一些数据来展现顾客的行为轨迹,如进店率、留店时间、试用率、成交率、连带率、回店率、转介率等。
5W2H对比法,[1] 也叫对比分析法或者比较分析法,是通过实际数与基数的对比来提示实际数与基数之间的差异,借以了解经济活动的成绩和问题的一种分析方法。
基于对比对象的不同,可以大致分为与目标对比、与不同时期对比、与同级部门单位地域对比、行业内进行对比、与活动对比。
除了上面对象不同,我们还有以下的对比方式:
水平对比法(Benchmarking)又称标杆法。是对照最强有力的竞争对手或已成为工业界领袖的公司,在产品的性能、质量和售后服务等各方面进行比较分析和量度,并采取改进措施的连续过程。
水平比较法包括两个重要的方面,一方面制订计划,不断地寻找和树立国内、国际先进水平的标杆,通过对比和综合思考发现自已产品的差距;另一方面不断地采取设计、工艺和质量管理的改进措施,取人之长、补已之短,不断提高产品的技术和质量水平,超过所有的竞争对手,达到和保持世界先进水平。
采用水平对比法不是单纯地模仿,而是创造性地借鉴。通过深入的思考、研究,集众家之长,开展技术创新,实现产品性能的提升。只有掌握了突破性的技术,才有可能领先世界。为了更好地开展水平对比法,应当建立有关的数据库,并不断更新。水平对比法在美国已获得广泛的应用和明显的成效。
TIPS:可以采用找-抄-超的形式最终实现自身的提升与飞越。
例如针对某一个绩效评估要素,比较员工与员工的绩效水平,看谁做的“更好”,记录每个员工被比较时,属于“更好”的次数,根据次数的高低给员工排序。和直接排序法类似,这是一种更为细致的通过对比排序来考核绩效水平的方法,它的特点是每一个考核要素都要进行人员间的两两比较和排序,使得在每一个考核要素下,每一个人都和其他所有人进行了比较,所有被考核者在每一个要素下都获得了充分的排序。也是一种相对的定性评价方法。
归纳法是指把具体个别的事物,分别加以综合,从而获得一般结论的方法。所以,在逻辑学中,一贯把从个别走向一般的思维形式称为归纳。对比则是通过对不同事物的比较,寻求其同中之异或异中之同的研究方法。
归纳对比法综合运用,可以把零散的、不成系统的知识系统化、理论化,还可以通过比较,找出事物的相同点和不同点,把相近的事物区分开来。
优序对比法是先需要构建判断尺度,一般情况下,重要程度判断尺度可用1,2,3,4,5五级表示,数字越大,表明重要性越大。当两个目标对比时,如果一个目标性为5,则另一目标重要性为0;如果一个目标为3,则另一个目标为5。
如:对于以下课程的授课需求度评估如下
课程名称 1 2 3 4 5
产品 A
服务 A
品牌 A
管理 A
从上面的举例中不难看出排序:产品/品牌-管理-服务。
漏斗分析法举例漏斗分析法除了应用在电商之外还可以应用在零售,如进店率、试用率、成交率就是一个漏斗。
交叉分析法又称立体分析法,是在纵向分析法和横向分析法的基础上,从交叉、立体的角度出发,由浅入深、由低级到高级的一种分析方法。这种方法虽然复杂,但它弥补了“各自为政”分析方法所带来的偏差。
通常用于分析两个变量之间的关系,例如各个报纸阅读和年龄之间的关系。实际使用中我们通常把这个概念推广到行变量和列变量之间的关系,这样行变量可能有多个变量组成,列变量也可能有多个变量,甚至可以只有行变量没有列变量,或者只有列变量没有行变量。
应用举例:
(1) 市场容量:即市场空间,指各生产厂商所面对的市场发展空间的大小。以手机市场为例,我们希望研究北京地区的手机市场空间,那么我们可以以北京作为我们的基准,行变量选择拥有手机建立交叉表,运算结果中的列百分比就是手机拥有者在北京地区的市场规模。
(2) 品牌份额:某品牌的销售量或消费量占整个品类销售量或消费量的比例,仍旧以手机为例,我们以手机拥有作基准,行变量选择各个手机品牌,运算结果中的列百分比就可以给出手机个各品牌在被研究对象中的一个市场份额。使用可以使用排序的功能给出一个简单的顺序关系。如下表所示。
总量分析法:因为经济人追求的是资源配置的总体效率的最高,而效率在量的分析中本质上就是平均量的概念,是两个总量的对比,所以,经济人采用的总量分析就必须是平均量对比的分析法,是经济人实现目标的必然选择。
结构分析法是在统计分组的基础上,计算各组成部分所占比重,进而分析某一总体现象的内部结构特征、总体的性质、总体内部结构依时间推移而表现出的变化规律性的统计方法。结构分析法的基本表现形式,就是计算结构指标。
如一月份黄金销售占比50%,镶嵌销售占比42%,其它占比8%,合计是100%。
分组就是根据研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组,使组内的差异尽可能小,组间的差异尽可能大。分组分析法是在分组的基础上,对现象的内部结构或现象之问的依存关系从定性或定量的角度做进一一步分析研究,以便寻找事物发展的规律,正确的分析问题和解决问题。其原则是穷尽和互斥。
分组分析法是以按品质标志分组分析法为前提条件,通过品质标志分组分析法,可以分析现象的类型特征和规律性;利用按数量标志分组分析法分析现象总体内部的结构及其变化;利用相关_关系分组分析法可以分析社会经济现象之间的相关关系。这三种分组分析法在实际中常常结合在一起使用。
目录之数据呈现 柱状数据图 折线图 图型举例1 图型举例2
网友评论