商业智能数据分析师,花随花心。
大家好,我是花老师。今天,这堂课是整个PBI系列的第14课,核心关键词正如本文名字一样,搜索、逻辑回归、分类预判。当然,这么讲肯定是不好理解的,不过没关系,稍后我会好好给大家分享。
还没有看过上13堂课的同学,要记得提前预习,文章名如下:
《PBI系列 车图 色彩搭配 数据分析 01》花随花心著
《PBI系列 竞品评论 流量 词云分析 02》花随花心著
《PBI系列 快选 人气新品池 品质档 03》花随花心著
《PBI系列 天猫国际 搜索 属性分析 04》花随花心著
《PBI系列 京东 词根分析 时段流量 05》花随花心著
《PBI系列 关键词 多维度 市场分析 06》花随花心著
《PBI系列 类目大词 群店 竞争透视 07》花随花心著
《PBI系列 搜索环境 竞店 二维矩阵 08》花随花心著
《PBI系列 店铺分类 地区透视 关系 09》花随花心著
《PBI系列 象限分析 雷达 区间分段 10》花随花心著
《PBI系列 搜索环境 波动性 集中度 11》花随花心著
《PBI系列 权重 相关系数 指标关联 12》花随花心著
《PBI系列 快选池 聚类分析 二维化 13》花随花心著
那么,接下来,就让我们正式进入主题。
正文
实际上,今天要分享的内容,需要用到微软官方数据挖掘套件,我在PBI系列第12堂课里头的视频有分享过如何进行安装,当然,我这边也有现成的压缩包,如果需要的话可以找我要。
我们先简单来看下今天的核心关键词,分别是搜索、逻辑回归、分类预判。从今天这堂课,您可以学到的东西就是如何对数据进行预判。所谓的预判,就是说我只要提供一部分指定的现成数据,就可以借助套件进行数据挖掘,用逻辑回归算法进行分析后,得出最终的结论。
简单来说,就是判断真假的关系。比如性别,只有男和女,比如是否重复购买,只有是或者否,一般来说正向用1表示,负向用0表示。就好比如今天的内容,新品是否属于官方直营,我用1表示是,0表示否,把数据进行1和0来表示之后,更有利于我们的电脑的运算。
毕竟,电脑的CPU运算是二进制,就是0和1。
这个方法一般是用在客户数据上,比如通过分析一些客户是否经常性购买我们自己家的产品,来分析出这些客户数据的特征。
假如说有新的客户数据录入进来的话,我们可以根据这些客户数据进行预判,判断是否重复购买,如果会的话,可以加大联系密度,多送一些优惠券给人家,多给优惠。
然而,我今天用的是却是搜索数据,这是天猫国际上关键词[红酒 干红]的数据,并且是新品排序。也就是说,这些产品都是新品。
什么是新品,我应该不用解释了吧。我今天的目的只有一个,通过多个关键词的数据,来分析出红酒类目当中,究竟什么样的新品是属于天猫国际的官方直营店的。
于是乎,我用PBI将数据源进行处理之后,得到下面的数据表,如图所示
之后,把数据表复制到Excel当中进行数据挖掘,如图所示
最后,通过逻辑回归算法处理之后,我得到了一个表格,通过这份表格,我可以很快判断出来到底官方直营的产品都有什么特征,如图所示
正如上面这个图所示,有两个字段,一个叫做倾向于1,一个叫做倾向于0。1代表直营,0代表非直营。
通过红蓝色块的占比分析,我们可以看出来,基本上有如下特征。
是否海外:否
有无描述:无
月销量:837.320 - 2,991.239
是否包税:已包税
也就是蓝色块占比最多的那些字段,当然由于这里只有596个新品,数据量有限,因此会出现很大的误差。如果数据量增加到上万条的话,估计预测结果会更准。
然后我用新的数据进行预测,左边红色框框是预测结果,右边则是实际情况,很容易看出来,结果很大程度上还是挺准的,准确率也很容易计算,我们只需要把错误率算出来即可。
比如说,我从数据源中拿了30条数据,预测错误的数据为0条,因此目前的错误率为0%,准确率为100%。当然,这个是因为数据量太少,凑巧算出这么高的正确率。
之后,我重新随机生成了一些数据进来,根据刚刚的说法,很快就可以判断出到底哪些新品是官方直营店的。这样子我们就学会了如何进行数据预判。
另外,今天所下载的天猫国际新品搜索数据,用的是我自己研发的数据分析工具箱,如图所示
目前为止,这个是第5代版本,一共有15个免费功能,当然随着我后面的不断更新,肯定会加入更多实用功能进来,尽请期待!
以上内容,基本上可以让大家了解到这个图表是干嘛用的。当然,其中技术方面的细节,我都会留到(付费)视频、(免费)音频当中进行详细介绍。不过,从这个系列开始,与以往不同的是,我会加入一段漫长的无声操作视频,将自己完整的操作过程记录下来,这样大家就不会说不清楚其中的细节了,由于是无声,因此我在音频当中会减掉这部分内容。
希望我今天的分享能对大家有所帮助,谢谢!想要获取这堂课的核心技术的同学,如下所示操作即可
推荐 | 原创系列
《PBI系列》已经连载了13期,每1期都有3个核心关键词,如果自己想要提升数据图表方面的能力的话,就赶紧上车,这个系列结合了电商数据,还是那句话,希望大家在电商方面的数据分析能力越来越强!
《数据挖掘电商系列》目前已经更新了7招,通过数据算法挖掘数据规律,提炼更多价值信息。
《Excel高阶报表系列》目前已经更新了5招,全面解析电商数据分析报表的实现技术。
《Excel数据图表360招》目前已经更新了16招,属于基础Excel数据处理过程当中必备的常用技能。
《数据分析系列之生意参谋》目前更新到第九期,重点讲解如何借助官方数据分析工具进行深入分析。
电商相关的各类型分析篇章,有涉及到买家,店铺流量或者竞争对手分析这块,需要配合高阶报表方能实现。
数据化运营实战技能,包含各种用于运营方面的数据分析拆解技术。
结束 | 自我简介
网友评论