最近看了静觅大神的一篇文章 利用新接口抓取微信公众号的所有文章 http://cuiqingcai.com/4652.html ,主要是 微信官方 “对所有公众号开放,在图文消息正文中插入自己帐号和其他公众号已群发文章链接的能力”,那么可以通过微信订阅号的后台可以找到 搜索微信公众和对应公众号的所有文章列表接口了。
感谢大神的无私分享!!!
微信公众号管理后台但是这种办法最多只能采集到微信公众号的所有文章详情链接,没法采集到文章的阅读数、点赞数和评论。所以还是需要用到之前提到的中间人代理的方法来采集这些详细数据。 微信公众号文章采集系统---开箱即用 https://segmentfault.com/a/1190000010402887
这里我主要用到了 静觅大神 通过python 获取微信公众平台登录cookie的方法,拿到cookie之后获取文章列表数据都是通过 php来实现的。主要是对php熟悉一些,以及为了兼容之前写的其他代码。
python 获取微信公众平台登录cookie这个获取cookie的方法只有32行的代码,需要安装 chromedriver , selenium 。
selenium 是做网页测试的工具,模拟网页的操作。这里需要注意的是 chromedriver 实际相当于是selenium 下的一个驱动,用来驱动电脑上安装的 chrome浏览器。所以 chromedriver 和 chrome浏览器有个版本对应关系,实际使用上面的代码的时候需要先检查一下你机器上的chromedriver 和 chrome浏览器的版本是否如下图所示对应起来的。
chromedriver 和 chrome浏览器对应关系同时 附上 chromedriver 各个版本的下载地址。
http://chromedriver.storage.googleapis.com/index.html
在获取公众号所有文章的列表数据会涉及到太多自己写的另外一个平台的业务逻辑,就只贴出获取文章列表数据的主要代码
其实,利用以上的代码逻辑之后,要获取一个公众号的所有文章列表数据就变得快多了,之前完全通过代理的方式需要下拉完公众号里面的所有历史消息,浪费大量的时间。
对于获取点赞数、阅读数和评论信息,还是利用中间人代理的方法是比较靠谱的。
在我实际的写关于采集微信公众号文章的代码 以及和一些不是太懂技术的朋友交流的过程中发现,让不懂技术的人去照着教程搭建环境,或者是由于机器的环境问题需要调试代码的时候,整个过程下来不只是对方会崩溃,我也会崩溃。
其实换个角度来看,这也正式产品和代码的区别,程序员沉浸在自己的世界中玩弄自己的代码,以为别人调试不好自己写的代码是对方SB,殊不知,代码和产品的区别在于,产品是给人用的,是要让一个不懂技术的人不用付出太多的学习成本就能使用,程序员没有站在用户的角度去设计反而是程序员的SB。
包括之前做过一个微信公众号采集开箱即用的镜像,本想是让不懂技术的人能够上手即用,从后面的反馈来看也是一个及其失败的产品,用户需要付出大量的学习成本,而且还会遇到很多技术上的词汇就懵逼了。
所以,这篇文章是一篇写给程序员朋友看的,如果你不是程序员而想要搭建这样的代码还是放弃算了。
对于一个程序员来讲,写好代码离设计一个好的产品还有千里之远。好的产品设计不只是用户体验的问题还有很多产品如何在市场上竞争的问题等等。程序员会写出很多给程序员看的代码,但是写出给用户使用的产品却需要花费大量的时间精力。这也是为什么一个"看似"简单的软件却要卖很高的价钱的原因,因为简单的"看似"是最后呈现给产品使用者所能够看到界面,而背后的功能和技术成本是看不到的。
拿微信公众号文章采集系统来说,我做过一个网站(网站介绍看这里 http://www.jianshu.com/p/1d26dd73dda8) 通过几个页面把最终的采集结果呈现给用户,用户只能看到采集到的文章信息。而这背后的通过代理器去拦截微信中的请求这样的技术方案值多少钱呢?又或者说上面提到的采集所有文章的方法值多少钱呢?其实很难用金钱来衡量。那我说下我个人开发这个产品的心理过程,最开始是觉得微信文章采集这个事情是有一定的技术难度,我纯粹是想个人挑战一下。后来做着做着发现其实很多人对微信文章的采集是有需求的,愿意为之付费的,然后就慢慢的考虑如何做出一个产品可以帮人采集微信文章来变现。很难用我在这个产品上的时间乘以我单位时间值的钱 计算这个产品的价钱,因为没人愿意为一个搭建起来及其复杂,使用起来及其繁琐的产品付费。
这里我可以给大家透露一些外包公司如何估算价钱的方法,虽然在这里不适用。首先外包公司一般接活都是针对一些有比较成型的技术解决方案,比如:开发网站,开发小程序,开发一般的app。技术人员对自身开发过的东西都比较有经验了,看到功能需求一般就可以大致估计需要多长时间完成。比如开发一个app需要3个人30天的开发时间,按照每个人每天500元的成本,那么这个app的开发成本最少是 500*3*30 = 45000元, 这是最少的,作为公司运营还需要把公司运营成本和公司的利润加进去,所有开发一个app的成本10万左右都算正常的了。
但是话又说回来,对于一些没有成型的技术解决方案,其实是不适合用上面这种方案来计算的。市场上更多的是对商业模式的探索,比如说对于微信公众号文章采集开源出来的解决方案大多只适合程序员自己玩玩,并不是太适合普通用户使用,所以一些懂技术的就把该方案用在其他产品上来变现,而适合普通用户使用的一些公众号文章采集软件主要是通过采集数量或者会员的方式来收费。
所以,程序员写代码的目的还是最后能够生产出一个给用户使用的产品,通过产品来变现,而代码本身是没有太多的变现能力的 。
既然上面提到了,那我也继续谈下,软件行业的两种变现模式,一种是上面说到的外包模式,说白了就是时间换钱,另外一种是开发有持续变现能力的产品,这种模式的风险高,但是一旦成功了就有源源不断的收入。
外包模式的人员角色主要有技术和产品,开发产品的模式还需要有运营,所以要开发一个好的产品实际上是需要产品+技术+运营三方一起努力。有持续变现能力的产品对于大多软件开发公司都是及其有吸引力的。
感觉越说越跑题了,打住了。
网友评论