今天笔者突发奇想将最近几年的工单和运维事件从数据库导出来,然后使用python来分析一下。为啥会有这个想法呢,缘于前段时间看的《SRE Google运维解密》——“手工操作和工单处理等传统运维工作不应该占用非常多的时间, 50%的时间应该花在工程项目上,以减少未来的琐事和增加服务上。”
那么应该控制50%的实践,笔者以为就是一是定位到琐事,二是干掉琐事。关于干掉琐事,就需要优化流程,自动化应该手动操作的内容,反思与决策如何才能让这些系统更容易管理,同时针对产品问题应该转移压力给技术开发团队,这个就涉及到团队管理方面的内容,每个组织处理方法各不相同。知道怎么解决,那么应该怎么知道需要解决哪些问题呢?哪一些问题花了大量时间?今天笔者使用python做了个简单的数据分析来定位什么事情花了最多的时间。
笔者使用了三个核心的库来完成:pandas、jieba、wordcloud。数据提取是直接在sql server上选择导出csv文件,碍于数据敏感就不展示了,然后再使用脚本进一步分析。代码较少完全归功于python库已经造好了轮子,只需关于业务层面即可。
1、数据库提取工单记录,转为csv文件;
2、pandas读取csv文件的特定行;
3、jieba中文分词;
4、wordcloud进行词频绘图。
![](https://img.haomeiwen.com/i24447700/6ec00dbcb3ef6bc6.png)
生成的png文件就是根据词频绘制的词云图,很好的展示了出现概率较高的词语,可以直接定位到某个具体的业务工单。同时pandas已经读取到全部数据,可以根据这个词语来进一步匹配搜索下级的业务点,再针对性的优化。
网友评论