第四课 Python爬虫简单爬取新浪新闻列表

作者: DYBOY | 来源:发表于2017-09-06 14:55 被阅读206次

第四课 Python爬虫简单爬取新浪新闻列表
python爬虫
各类链接
Python爬虫入门-爬取新浪新闻
Python爬虫实战之爬取链家广州房价_03存储
拉勾爬虫实战
Python学习
Python3 基于asyncio的新闻爬虫思路
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存
基于scrapy框架的Python爬虫爬取新浪新闻

新闻列表页网页结构：

输出h2：

res = requests.get('http://news.sina.com.cn/china/')

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text,'html.parser')

for news in soup.select('.news-item'):

if( len(news.select('h2')) >0 ):

print(news.select('h2')[0])

.text

如法炮制：

获取新闻时间标题超链接

res = requests.get('http://news.sina.com.cn/china/')

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text,'html.parser')

for news in soup.select('.news-item'):

if( len(news.select('h2')) >0 ):

h2 = news.select('h2')[0].text

time = news.select('.time')[0].text

a = news.select('a')[0]['href']

print(time,h2,a)

注：本文属于原创文章，转载请注明本文地址！

作者QQ:1099718640

CSDN博客主页：http://blog.csdn.net/dyboy2017

Github开源项目：https://github.com/dyboy2017/spider

第四课 Python爬虫简单爬取新浪新闻列表
新闻列表页网页结构：输出h2： res = requests.get('http://news.sina.com...
python爬虫
一、新闻爬虫实战（爬取新浪新闻首页所有新闻内容）思路：1、爬取新闻首页2、得到各新闻链接3、爬取新闻链接4、寻找有...
各类链接
爬虫使用python-aiohttp爬取今日头条【Python】爬虫爬取各大网站新闻 Scrapy 模拟登录新...
Python爬虫入门-爬取新浪新闻
运行环境：Python3.6.0 所需的包：爬取结果：
Python爬虫实战之爬取链家广州房价_03存储
问题引入系列目录： Python爬虫实战之爬取链家广州房价_01简单的单页爬虫 Python爬虫实战之爬取链家广...
拉勾爬虫实战
0 引言一次简单的 Python 爬虫练习：输入目标城市和目标职位，从拉勾网爬取相关的职位列表数据...
Python学习
python爬虫(五) python爬虫爬取豆瓣电影Top250数据利用python爬取豆瓣电影TOP250页面...
Python3 基于asyncio的新闻爬虫思路
Python写爬虫是非常方便的，爬取的目标不同，实现的方式也有很大不同。新闻爬虫的方便之处是，新闻网站几乎没有反爬...
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存
Python爬虫-豆瓣电影Top250-各项信息爬取及xls保存目的采用python爬虫爬取豆瓣电影Top25...
基于scrapy框架的Python爬虫爬取新浪新闻
一、简单思路下图新浪新闻中心的首页，也就是我们要爬取的第一页：新浪新闻中心的国际板块此页下拉发现有五个小栏目：...