话说手里有个锤子,看什么都像钉子。上午一边听着政府工作报告,一边看着手里好像有好几把小锤子,就在想,除了一堆给力的数据,怎么用数据分析的方式从不同角度看报告。
晚上回家,开工:
先找到官方全文:https://baijiahao.baidu.com/s?id=1623778868224158198&wfr=spider&for=pc
第一把锤子:emeditor,全文复制粘贴:
Ctrl+H 调出替换窗口,用\n替换[^\x{4e00}-\x{9fa5}],分句,这里用到一把万能螺丝刀-正则表达式:
再用\n替换掉\n\n,多点几遍替换全部,去掉空行:
保存到桌面,命名“gzbg.txt”
第二把锤子,python:
屏幕一闪,结果出来了:
第三把锤子,Excel,copy过去,排序整理,取前50高频词
最后上第四把锤子,echarts的词云工具wordcloud.js:
高频词串成不重词一句话,就是:加快推进发展综合服务建设,全面加强实施城市管理改革
闲着的锤子,还可以试试中央政府和各省市区的政府工作报告,高频词关联分析下,看看哪家与总报告的关联度最高。
网友评论