Python3.6用爬虫方式：刷文章阅读量

作者: 呆呆冬 | 来源:发表于2017-08-25 12:22 被阅读188次

Python3.6用爬虫方式：刷文章阅读量
用python爬虫方式：刷文章阅读量
python菜鸟开发日记-迷你IP资源代理池的开发
Scala爬虫刷博客阅读量
如何刷微信公众号阅读量，公众号文章刷阅读量多少钱
一般刷微信阅读量的软件或者平台都有那些？刷微信阅读量？有用么？
解密：公众号阅读量真假？虚假忽悠的人会死的很惨，客户和广告主被忽
在简书里，如何让你的文章增加阅读量？用实例说明（原创）
微头条如何刷展现量，今日头条如何刷阅读量，展现量播放量
微博去哪刷阅读量，微博怎么刷播放量，微博如何刷点赞

参考文章：http://www.jianshu.com/p/25341e5365d6

利用python爬虫来抓取你要的网页内容，实际上是对该内容的一次阅读，这样可以带来阅读量的增加，但这种完全可以用jmeter并发访问页面接口来搞定，所以仅作为Python学习案例。
这次以爬取我自己的CSDN博客为例，其他的网站也许要另行设置（还没试）。

使用python第三方包有：bs4、requests、time，利用以下命令安装：

pip3 install bs4
pip3 install requests

代码如下：

from bs4 import BeautifulSoup
import requests
import time

url =('http://blog.csdn.net/weixin_38222476/article/details/70159827')

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'}

# xrange( )函数是python 2.x中的一个函数，在Python 3中，range()的实现方式与xrange()函数相同，所以想在python 3中运行程序，将xrange( )函数全部换为range( )即可。
for i in range(10000):
    time.sleep(1)
    req = requests.get(url,headers =headers )
    soup = BeautifulSoup(req.text,'lxml')
    rank = soup.select('#blog_rank')
    view = soup.select('.article_manage .link_view .title')
    print (view)
    print (i)

需要注意的是，如果运行代码时，提示以下错误：