美文网首页知啦专栏电商微商互联网、电商、产品、运营、文案策划、生活
《数据挖掘电商系列之评论区产品卖点》花随花心著

《数据挖掘电商系列之评论区产品卖点》花随花心著

作者: 花随花心 | 来源:发表于2018-07-01 09:50 被阅读3次

    序言 | 传道授业

    商业智能数据分析师,花随花心。

    说实话,这段时间真的是憋死我了。我的社交软件一直有同学在问,什么时候开课?哈,我自己也算不准,因为我在做一款软件。初代版本已经成形,我放到自己的群里头,今天的这堂课也是要拿软件当中的其中一个功能来进行讲解。

    题目大家都已经看到了,叫做评论区产品卖点。顾名思义,我指的就是通过买家评论的地方来获取数据,然后通过数据算法来进行解析,最终尽可能看到我们自己想要的那部分数据即可。

    可是,苦逼的是这些数据,平台并没有直接给我们提供。哦,不对,应该说,即使提供了,也很鸡肋,数据处理超麻烦的。并且,也不是所有人都对浏览器的操作很熟练,复制粘贴这种苦活,希望从今天开始,我能帮助大家减少一点工作量。

    话又说回来了,虽然我这段时间花了不少时间在研究,但是鉴于工作上的关系,软件目前只提供3个功能,分别是平台的PC端综合排序搜索,以及买家详情页评论区的数据,还有供货商上面联系方式等等,这些统统都已经实现。

    当然,我这里强调一句,毕竟是初代版本,以后会慢慢更新迭代,所以其他功能,随着我的灵活时间的增加,会陆续增加到里头,这点大家放心。另外,软件收费吗?

    嗯…...嗯……嗯…. 只能这么说,目前提供的功能是免费对外开放的,当然后续也会增加一些付费功能,但是并不妨碍大家的正常使用,这一点我先说好。

    OK,说了这么多,我们接下来就正式开始进行学习。

    正文 | 产品卖点

    有人说,花老师能不能讲点别的类目?其实我也想。那么,我们今天就来研究遥控飞机吧。正如上面这张图,大家看到的是各种各样的遥控飞机,并且,价格也不尽相同。虽然,我们现在看到的是PC端的数据,但是其实无所谓。因为我已经点了人气排序,不管是PC端还是无线端,我关心的是我要找什么竞争对手来研究,这个才是重点。

    其实,平台上的商品浩如烟海,与其广撒网钓大鱼去研究,何不如就冲着一家店铺去搞,就一个字,抄。其实很简单,你能不能拿着A店的店铺风格,换上B店的产品?当然,这个不是今天的重点。我们直接点击类目第一的产品进去看看,如图所示

    简单的产品介绍,大家自己看吧,我们接下来来看看评论区的数据,如图所示

    累计评价是649个,然后就是描述分4.9,当然最重要的是后面这几个标签,分布是质量不错,适合人群,还有服务好之类的,当然,这边看到的标签不一定齐全,有部分标签浏览器没有显示出来,不过工具箱已经能够抓取到,如图所示

    简单的操作,三两下就把数据抓取到了,打开文件之后,我们来看看结果如何,如图所示

    上面是一部分截图,实际上的数据远不止如此,我们先来重点看看刚刚讲到的区域,如图所示

    自己可以对比看看,数据是刚好对的上的,我们通过这里,是不是发现多了4个标签,分别是功能不错,外观不错,好玩,以及操作不错等等。这里,其实有个小技巧,如果标签出现问题,只要能够让其他隐藏的标签顶上去,那么自然就把不好的标签给隐藏起来了。

    接下来,我们来对比一下,上面的数据和下面的数据是否一致,如图所示

    如果有些买家进行了追评的话,这部分数据都被我过滤掉了,工具箱提供的都是第一次留言的数据,这点大家留意一下。其实,我们可以看到,原先很多时候,比如这里头的颜色分类,或者尺码,或者买家留言评论的时间,都被我们忽略掉了。

    就好比如这里头的时间段,获取下来之后,简单做个时间分布图,其实就可以看出买家基本什么时候有时间了。通过分析SKU的数量占比,很快就可以知道这款产品,究竟是哪个SKU好卖,这个也帮助我们减少了很多不必要的款式的备货。并且,评论里头的内容,如果能提取一些关键词出来,然后进行总结评价,是不是就可以快速判断出,买家到底在想什么,对什么最满意。而这部分也是我们需要重点关注的。选款其实就可以这么来,因为人家已经明明白白告诉你了。

    获取数据是第一步,怎么处理就是第二步了。第二步,有2个专业名词,分别叫做数据清洗和数据预处理,使用起来的时候,往往是混着来的,没有随先随后的区别。至于什么是数据清洗,什么是数据预处理,这个我在视频和音频里头再详细讲。

    简单来说,就是把重点的数据处理成我们需要的格式,就这么简单,如图所示。

    很多人以为这里的买家名字没什么用,因为已经被处理过了,其实即使没处理过,请问你又能拿来干嘛呢?灰色手段我就不说了,正常来说,不管是什么样的,我们都可以拿来当频数统计,也就是人数。

    比如,上面的这些时段,经过处理后,可以明确知道年月日,以及时分,然后缺的恰好人数统计,通过组合之后,我们很容易看出来,基本上在最近的6月份里头,买家大部分有时间的是什么时候。因为时间关系,我只爬取了5页数据,因此数量有限,大家凑合着看吧,大致意思能明白即可。

    通过散点图,快速知道这款产品复购率如何,很明显,大部分人都只买1次,有少数是2次购买,甚至3次购买的也有,当然,随着数据量的增加,这个图会越来越接近真相。稍微处理一下,结果就出来了,真的,这些数据都是从刚刚的数据里头处理后得到的,你再看看现在是什么情况先,如图所示

    剩下的,就是买家评论里头的数据了,如图所示

    随着数据量的增加,你会越来越觉得这堆文字很难看,密密麻麻的都不知道在说什么。但是,如果我把TA处理成这个样子,你再来看看,如图所示

    越是在上面的气泡,说明频数越大,也就是买家最在乎的点,是不是很神奇,其实很简单,学数据分析,连这个都不会,其实会让人笑掉大牙的。

    希望通过一个简单的功能,能让你节省点时间,多研究重点数据,才是王道!

    OK,今天的内容我们就讲到这里,如果你想学习本文背后所蕴含的技术的话,请查看视频(免费)、音频(免费)同步版本,花老师与你不见不散,如图所示,再会!!!

    推荐 | 原创系列

    《Excel高阶报表系列》目前已经更新了5招,全面解析电商数据分析报表的实现技术。

    《Excel数据图表360招》目前已经更新了16招,属于基础Excel数据处理过程当中必备的常用技能。

    《数据分析系列之生意参谋》目前更新到第九期,重点讲解如何借助官方数据分析工具进行深入分析。

    电商相关的各类型分析篇章,有涉及到买家,店铺流量或者竞争对手分析这块,需要配合高阶报表方能实现。

    数据化运营实战技能,包含各种用于运营方面的数据分析拆解技术。

    结束 | 自我简介

    相关文章

      网友评论

        本文标题:《数据挖掘电商系列之评论区产品卖点》花随花心著

        本文链接:https://www.haomeiwen.com/subject/corcuftx.html