Python爬虫实例（2）

Python爬虫实例（2）

作者: fairy小倩 | 来源:发表于2019-06-12 12:55 被阅读0次

Python爬虫实例（2）
Python网络爬虫
python爬虫学习-day7-实战
Python 基础爬虫目录
python爬虫学习-day5-selenium
python爬虫学习-day6-ip池
python爬虫学习-day3-BeautifulSoup
python爬虫学习-day4-使用lxml+xpath提取内容
python爬虫学习-day2正则表达式
python爬虫学习-day1

在上一篇我们已经把要怕的网页抓取到了，接下来就是细化内容。

image.png

1.页面内容分析

首先我们看到左侧导航栏就是课程的目录，那么我们可以先把课程目录已经对应的链接爬出来。

2.抓取目录以及目录链接

我们使用美丽的汤 BeautifulSoup来实现这一目的
接上篇文章，先导入包：

image.png

接下来我们打印一下soup看下结果：

image.png

我们要抓取的数据是链接以及标题，去掉没用的信息，从上图中我们看到，我们需要的是<div class="design" id="leftcolumn">下面的所有a标签中的信息

image.png

看下效果：

image.png

已经把想要的内容抓取过来了，现在就是截取href的链接内容以及title内容，我们注意到，href链接没有网站的网址，我们可以自己拼接上：
依然打印出来看看效果：

image.png

正式我们想要的内容，接下来就利用循环抓取全部的内容吧：

image.png

3.将内容写入文件

image.png

这样我们就将抓取的内容写入到文件里保存起来了。需注意，文件内容包含数字，在将list写人文件时，要先转换成字符串。

image.png

有了以上的内容，我们就可以得到Python3所有的课程列表以及链接了。

相关文章

Python爬虫实例（2）
在上一篇我们已经把要怕的网页抓取到了，接下来就是细化内容。 1.页面内容分析首先我们看到左侧导航栏就是课程的目录...
Python网络爬虫
Python开发简单爬虫（Python2.X版本，Eclipse工具）一、爬虫介绍爬虫调度端：启动、停止爬虫，...
python爬虫学习-day7-实战
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
Python 基础爬虫目录
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
python爬虫学习-day5-selenium
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
python爬虫学习-day6-ip池
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
python爬虫学习-day3-BeautifulSoup
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
python爬虫学习-day4-使用lxml+xpath提取内容
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
python爬虫学习-day2正则表达式
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...
python爬虫学习-day1
目录 python爬虫学习-day1 python爬虫学习-day2正则表达式 python爬虫学习-day3-B...

网友评论

本文标题：Python爬虫实例（2）

本文链接：https://www.haomeiwen.com/subject/oxhrxctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python爬虫实例（2）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！