爬虫作业1

作者: 万能滴小笼包 | 来源:发表于2017-07-05 11:27 被阅读87次

目标确定

马上就要进入招聘季啦,各大公司和众多求职者都已“蓄势待发”。

我个人也得充分准备下争取拿到个好工作啦

所以对于求职这方面信息就是爬虫的重要目标。

爬取的数据

我个人偏向于对公司信息的了解,这个公司的综合评分啊、环境啊、氛围啊、面试经验啊都需要了解一番,做到心里有谱才好。

对应的网站

1.看准网 (重点)

2.企业口碑网

要爬取的url

  1. http://www.kanzhun.com/

  2. http://www.qykb.cn/

筛选的规则

初步是这样规划的

1.首先,得到公司的基本信息,包括公司名称、地点、企业类别、公司规模等

2.其次,筛选出公司的综合评分、平均月薪等待遇

3.再深入探究一点,就是筛选出该公司目前有“数据”、“分析”相关的职位,将职位信息爬取出来

4.在面试一栏中,筛选出有“数据”、“分析”主题的面试信息,包括评论者给公司和面试过程打的标签、评论的文本信息等,后期会主要处理文本信息,得到关键字样。

大体要爬取的内容是这些,而筛选规则在每一条中或多或少涉及到,后续涉及到具体的操作时会有更具体的筛选规则。

相关文章

  • 爬虫作业1

    目标确定 马上就要进入招聘季啦,各大公司和众多求职者都已“蓄势待发”。 我个人也得充分准备下争取拿到个好工作啦 所...

  • 爬虫课程作业1

    作业 Q1,要爬取的数据类别 Q2,对应的数据源网站 Q3, 爬取数据的URL Q4,数据筛选规则(选做) Q1,...

  • python猫眼电影爬虫+Django+Echarts图表

    一.爬虫作业:抓取猫眼电影网站数据 二.Django+echarts图表 三.爬虫和django代码 猫眼爬虫gi...

  • python-爬虫基础(慕课网)

    二.爬虫简介以及爬虫的技术价值 2-1:爬虫是什么? 2-2:爬虫技术的价值? 三.简单爬虫架构 3-1:简单爬虫...

  • 7.爬虫概述

    爬虫概述 知识点: 了解 爬虫的概念 了解 爬虫的作用 了解 爬虫的分类 掌握 爬虫的流程 1. 爬虫的概念 模拟...

  • 【Python爬虫】--第二周_1作业

    练习十三 练习十四 练习十五 练习十六 练习十七

  • Python爬虫群作业-Week1

    一直有关注向右老师的爬虫文章,总是不明觉厉。因缘际会,加入了向右老师的Python爬虫起步群,实在幸运。 个人背景...

  • Python爬虫实战笔记_1 实战作业

    爬取商品信息 由于58的二手商品平台转转上线,爬取的方法与老师的讲解有一些不一样: 58的二手商品新平台转转,全是...

  • 爬虫04作业

    本次作业 爬取大数据专题所有文章列表,并输出到文本中保存。 每篇文章需要爬取的数据:作者、标题、文章地址、摘要、缩...

  • 爬虫作业2

    分析要爬取目标的网页的网页结构与元素标签位置信息 任务回顾 1.爬取网页:看准网 http://www.kanzh...

网友评论

    本文标题:爬虫作业1

    本文链接:https://www.haomeiwen.com/subject/mvifhxtx.html