最近有些纠结于工作上的事情,正好单位发布2017年度任务表,使用之前对《巨婴国》进行词频统计一样的方法,看看单位今年的工作都有什么特点。
任务
对整个任务表进行分词并统计词频后,过滤掉停用词和数字,可以得到整个任务表的词频信息。词频最高的10个词见下表:
词 | 次数 |
---|---|
月 | 179 |
试验 | 112 |
GRAPES | 92 |
模式 | 80 |
预报 | 78 |
方案 | 74 |
业务 | 55 |
系统 | 52 |
分析 | 48 |
改进 | 48 |
词频最高的“月”主要用于描述时间节点,可以忽略。其余九个词完美诠释单位的核心任务:改进GRAPES模式,在试验系统基础上,建立业务系统,为预报服务。
模式研发和系统业务是两个部门的名称,整个任务中,“研发”仅出现14次,远低于“模式”和“业务”、“系统”。可见单位对将研发成果转化为业务还是很重视的。
进度
任务截止期限以月为单位,单独对任务进度列进行分析,就能知道今年的进度安排是否符合尽量将任务分散到各个月份的原则。下图中横坐标表示月份,纵坐标表示以当月为截至期限的任务数。
每月进度可以很明显看到,年中和年尾各有两个明显的波峰,1-3月任务偏少,其它月份任务数量大体相当。年中和年尾是都有总结,需要完成的任务必然会多。前3月都在讨论工作计划,自然不会完成太多的任务。从其他月份看,今年的安排还是符合分散到各月原则的。
人员
最后看下每个人承担的任务数,只需统计分配人员一列。分词可能会将人名拆开,需要对分词的数据进行一定的修正,但好在按词频排序后,被拆开的人名基本都排在相邻位置。
下图横坐标是每人承担的任务数,纵坐标是人数。
每人承担的任务数可以看到大部分员工承担1-3项任务,少部分员工承担的任务超过7项。下面的箱线图展现得更加直观。
每人承担的任务数 - 箱线图中位数为每人3项任务,3/4的员工承担任务在5项以内。
到此,我有些跑偏了,以上全当成闲暇时间的练习吧。
题图来自 pixabay,统计图使用 plot.ly 绘制。
网友评论