用python爬取招聘信息

作者: 李明轩Matthew | 来源:发表于2018-07-10 21:40 被阅读39次

用python爬取招聘信息
python爬取招聘信息
Python数据分析基础：网页数据获取
爬虫设计
Python爬取腾讯视频电影信息并绘制散点图
Python爬取招聘
【Python爬虫案例学习17】爬取拉钩网数据
python+lxml 爬取网页信息及储存
前程无忧python岗位信息爬取和分析
python 爬取 51job招聘信息

今天模仿完成了一个小实验，通过python脚本爬取应届生招聘网招聘信息的标题和链接（模仿自https://blog.csdn.net/yaojingdedaogao/article/details/53175458），结果大致如下：

应届生重庆

1.源代码

jupyter notebook

2.解释：

第二段代码通过调用request库，使代码模仿浏览器（header）对目标网站发起访问，获取后续的网页内容content。（chrome浏览器->network->任意name->headers）
第三段代码调用os库，类似linux命令生成JD文件夹
第四段代码调用BeautifulSoup库，提取页面中的HTML元素，比如td、class、a、href等

3.收获：

1 浏览器获取headers，也是从同样位置得知网页编码格式
2 find_all()返回的是列表，fain返回的是搜索的结果
3 os.getcwd()获取当前工作路径，os.path.join()拼接路径
4 request.get()返回的是结构体content，print不出来，需要print(content.text)