一、使用scrpy爬取拉勾网(厦门地区)前端职位数据
数据爬取过程可以参考慕课网教程。

二、使用Excel分析前端职位数据
使用Excel数据透视表(样本200个)↓

底薪9k及以下主要为50人以下及50-200人规模的企业。注:72%前端职位在底薪9k及以下;
底薪10k-14K以上各个规模企业均等分布;
底薪15K及以上主要为50-200人及以上规模的企业↓

职位主要集中思明区/湖里区;
思明区各层次底薪均匀分布,湖里区主要为底薪9K及以下职位,集美区 底薪9K及以下 和 10K及以上 的职位均匀分布;↓

经验要求1-3年的职位占46%,其次为3-5年占35%;
经验1-3年及经验不限职位大部分底薪为9K及以下;
经验3-5年职位底薪均匀分布于9K及以下和10K及以上;
经验5-10年底薪10K-25K↓

职位学历要求 本科及以上 和 大专及以上+不限学历 各占一半左右;
只要求大专及以上+不限学历底薪5K及以下的占比较高;↓

底薪5K中:学历只要求大专及以上+不限学历占比72%;
底薪6K-9K中:学历只要求大专及以上+不限学历占比58%;
底薪10K-14K中:学历只要求大专及以上+不限学历占比46%;
底薪15K-25K中:学历只要求大专及以上+不限学历占比21%;↓

三、使用python词云
分析岗位职责及任职要求,并生成词图↓

附上python代码
from wordcloud import WordCloud
with open("/home/yy/桌面/l0x8df/a.txt",'r') as file_object:
f = file_object.read()
# 读取分析的文件
wordcloud = WordCloud(font_path = "/home/yy/桌面/l0x8df/a.ttf",background_color="white",width=1000, height=860, margin=2).generate(f)
# 你可以通过font_path参数来设置字体集
# width,height,margin可以设置图片属性
#background_color参数为设置背景颜色,默认颜色为黑色
# generate 可以对全部文本进行自动分词,但是中文支持不好
import matplotlib.pyplot as plt
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
wordcloud.to_file('a.png')
网友评论