近几天遇到不少优秀的友友,但是由于关注上限问题,以致于想关注而不得。因此,取关行动势在必行,但一直不忍心下手,生怕取关不当而导致大量掉粉。
其中最核心的问题是:但到底要先取关谁先呢?先取关不怎么更文的?文章数少的?字数少的?获赞数少的?持钻数少的?
烦!难不成要一个个点开主页来看吗?看下谁的数据好,谁的不好,然后再将不好的取关掉?一想到这工作量,我就泄气了!好丧!
但是,做决策总得有数据作支撑啊,不能瞎决定。而当今时代,手动获取数据是最笨且最慢的方法了,总得找一个更加方便快捷的办法来。咦?何不写个程序,把数据先收集起来,然后分析分析,再做决定!
像我这种理工男,不会点python怎么行?虽说大学学过c/c++,但是早就还给老师了!数学软件MATLAB主打的是矩阵运算,对于数据挖掘,还是算了吧。所以,只能用python了。
半年前曾自学过一段时间的python,写了一些爬虫程序,但终究没学到家,许多地方派不上用场,不过一些简单的总算还能对付得过去。但以我东一榔头西一棒子的性格,也有好几个月没用了,重新打开编辑器的那一刻,竟也不知从何下手!于是我不得不拿出之前的程序加上百度研究了老半天才有了思路!
仿照之前的程序框架,修修改改,调试了老半天,终于可运行了!于是我决定将友友们主页可见的6个数据都爬出来进行对比,包括:关注、粉丝、文章、字数、收货喜欢、总资产等。最终,爬出了900个已关注的友友的数据!因为可见的关注上限也就900个,即使我关注了1800多个。
将数据导出到excel,进行排序。这不排不知道,一排吓一跳!我了个天,怎么这么多0!文章数为0、字数为0、获得喜欢为0的有50多个!真是“踏破铁鞋无觅处,得来全不费工夫!”想想,连文章都不写的,我关注你们干嘛?就你们了!这大概就是数据驱动决策!
大数据驱动决策很快,我就将这50多位神送走了。但是总觉得不过瘾,得趁热打铁!所谓半斤八两,只写了1篇的跟1篇都没写的有什么区别?取关!接着又觉得,2篇的跟1篇的有什么区别?取关……直到我把文章数为1-10的全都取关了!
还不够?紧接着我又想到,写了十几篇的字数小于1000的,也太敷衍了吧?取关!然后又觉得,2000字和1000字有什么区别?取关!直到我把字数小于10000的也都取关了!
还不够?我立马又想到,写了十几篇文章上万字总资产还小于10的也忒差了吧?取关!小于20的跟小于10的有什么区别?取关!直到我把总资产小于100的都取关了!
应该差不多了!过瘾!我也算是践行了一次“断舍离”中的“舍”了!
上千喜欢而整个过程中令我感到疑惑的是,文章数为0的友友,获得喜欢数却有上千的!难不成是文章违规被删了?另外有些文章数只有1-2篇的,获赞数也能达到上百!我特意数了他的文章的获赞数,加起来也没有那么多啊?难不成帖子的获赞数也算在内了?
无论如何,经过这一次,也算是给自己涨了一次见识,开了一次眼界!不过,今天这篇文章只要是记录自己取关的整个思路和过程,跟大数据决策似乎没多大关系!
额……好吧,我承认,我又标题党了!
网友评论