一、学习原因
反思提高工作效率过程中,感觉到2019年下半年写的几个上百页的数据报告过程中,有诸多让自己觉得很心累的部分:
-
文字描述:写文字描述需要手动输入结果,容易出错;
-
交叉表:多个交叉分析结果,stata可以用tabout导出,但是,不同交叉结果需要手动合并成一个表;
-
百分比:涉及到百分比的结果,stata中都是不带%的,在写报告尤其是作图时,需要手动转换;
-
结果再分析:stata分析后的结果再分析的程度有限,需要再导入Excel手动再分析;
二、学习时间
2020年1月2日-1月9日
三、学习方法
参照之前写过的报告,从数据导入、数据查看、数据统计分析、数据作图、作表,Rmarkdown写报告一步一步地进行学习,按照需求百度学习结果。
四、学习经过
从SPSS过渡到stata,再到R,学习曲线比较缓和
时间 | 内容 | 遇到的问题 |
---|---|---|
2020.1.2 | Rmarkdown了解;制作报告word模板;导入数据;文本及分析结果结合; | |
2020.1.3 | Rmarkdown做饼图; | 导出图片不可编辑;分辨率有问题;图片不能居中;Rmarkdown除了标题和正文,没有其他样式【图标题设为标题6,再用vba统一将样式A转为样式B】; |
2020.1.6 | 优化计算方法;ggplot改成pie画饼图; | 脚注的数字无法上标;做出来的简单图很难调好看; |
2020.1.7 | 尝试结合officer包解决图表问题 | R不能生成office图表,生成的图还是很丑;ggplot学习曲线还是挺陡峭的; |
2020.1.8 | 专注R进行描述统计分析,尤其是多个交叉结果导出;可以将交叉结果合并输出CSV文件;百分比的结果可以都加上% | |
2020.1.9 | 实现R批量写不带图表的报告 |
五、学习成果
-
能用R解决学习原因中的问题:
-
写文字和统计分析同时进行;
-
多个交叉结果可以合并输出;
-
结果可以加上%导出;
-
进行基础描述分析,并对结果进行再分析;
-
-
了解并学习markdown的语法,并开始用markdown进行写作;
-
能够用R实现不带图表的分析报告批量生成;
六、学习结论
-
报告:Rmarkdown适合写统计+文字的报告,不太适用于目前公司这种大量图表的数据报告;
-
清洗:清洗还是stata比较好用,主要是,数据量上万后,数据导入R比较慢,而且,数据窗口加载也比较慢(不知道是不是电脑的原因),数据操作的交互可视化不强,这对于掌握数据情况的要求较高;
-
分析:R适用于更深入的复杂统计,建模,结果再深入分析的数据分析,不适用于目前公司数据报告中的频率和交叉等描述统计;
-
效率:单纯写一次性的的大量数据图表的报告,效率并不高。第一,R学习曲线较为陡峭;第二,要满足现在的数据报告,用R分析,还得结合VBA和Excel,效率不一定更高;
-
提升:作为技能提升,学习R有必要,更容易产生“玩转数据”的感觉;
七、最后感受
未来学习:虽然目前数据报告用R的空间并不大,但是,感觉R还是很值得学习的,以后也会尽可能找机会用R进行分析,有助于锻炼对数据的更深入的理解,以及加深统计分析能力。
网友评论