美文网首页数据科学与PythonPython数据采集与爬虫python数据分析
拉勾网前端职位数据分析(Excel,Python工具)

拉勾网前端职位数据分析(Excel,Python工具)

作者: 算法进阶 | 来源:发表于2018-05-15 23:52 被阅读237次

    一、使用scrpy爬取拉勾网(厦门地区)前端职位数据
    数据爬取过程可以参考慕课网教程。

    爬取原数据.png
    二、使用Excel分析前端职位数据

    使用Excel数据透视表(样本200个)↓

    数据透视表.png

    底薪9k及以下主要为50人以下及50-200人规模的企业。注:72%前端职位在底薪9k及以下;
    底薪10k-14K以上各个规模企业均等分布;
    底薪15K及以上主要为50-200人及以上规模的企业↓

    薪资下限与公司人数规模的关系.png

    职位主要集中思明区/湖里区;
    思明区各层次底薪均匀分布,湖里区主要为底薪9K及以下职位,集美区 底薪9K及以下 和 10K及以上 的职位均匀分布;↓

    薪资下限与公司位置分布.png

    经验要求1-3年的职位占46%,其次为3-5年占35%;
    经验1-3年及经验不限职位大部分底薪为9K及以下;
    经验3-5年职位底薪均匀分布于9K及以下和10K及以上;
    经验5-10年底薪10K-25K↓

    薪资下限与个人经验要求.png

    职位学历要求 本科及以上 和 大专及以上+不限学历 各占一半左右;
    只要求大专及以上+不限学历底薪5K及以下的占比较高;↓

    薪资下限与学历分布.png

    底薪5K中:学历只要求大专及以上+不限学历占比72%;
    底薪6K-9K中:学历只要求大专及以上+不限学历占比58%;
    底薪10K-14K中:学历只要求大专及以上+不限学历占比46%;
    底薪15K-25K中:学历只要求大专及以上+不限学历占比21%;↓

    薪资下限与个人学历要求.png

    三、使用python词云
    分析岗位职责及任职要求,并生成词图↓

    前端词云图.png
    附上python代码
    
    from wordcloud import WordCloud
    with open("/home/yy/桌面/l0x8df/a.txt",'r') as file_object:
        f = file_object.read()    
    # 读取分析的文件
    wordcloud = WordCloud(font_path = "/home/yy/桌面/l0x8df/a.ttf",background_color="white",width=1000, height=860, margin=2).generate(f)
    # 你可以通过font_path参数来设置字体集
    # width,height,margin可以设置图片属性
    #background_color参数为设置背景颜色,默认颜色为黑色
    # generate 可以对全部文本进行自动分词,但是中文支持不好
    import matplotlib.pyplot as plt
    plt.imshow(wordcloud)
    plt.axis("off")
    plt.show()
    
    wordcloud.to_file('a.png')
    

    相关文章

      网友评论

        本文标题:拉勾网前端职位数据分析(Excel,Python工具)

        本文链接:https://www.haomeiwen.com/subject/mmredftx.html