美文网首页我的Python自学之路
简易爬虫抓取糗事百科热门

简易爬虫抓取糗事百科热门

作者: LEONYao | 来源:发表于2016-07-27 20:18 被阅读652次

我刚学python不久,参考 静觅博客http://cuiqingcai.com/1052.html写的这个爬虫

我没用正则表达式,用了beautifulsoup

代码比较简易

import urllib2
from bs4 import BeautifulSoup

 url = 'http://www.qiushibaike.com/hot/'

user_agent = 'Mozilla/5.0 (Windows NT 6.1)'

headers = {'User-agent' : user_agent}

request = urllib2.Request(url,headers= headers)

response = urllib2.urlopen(request)

cat_img = response.read().decode('utf-8')

bs0bj = BeautifulSoup(cat_img,"html.parser")

namelist = bs0bj.findAll('div', "content")

for name in namelist:

print(name.string)
QQ截图20160727202440.png

相关文章

网友评论

    本文标题:简易爬虫抓取糗事百科热门

    本文链接:https://www.haomeiwen.com/subject/xfoojttx.html