美文网首页
R初学总结

R初学总结

作者: Hobbit的理查德 | 来源:发表于2020-01-10 23:33 被阅读0次

一、学习原因

反思提高工作效率过程中,感觉到2019年下半年写的几个上百页的数据报告过程中,有诸多让自己觉得很心累的部分:

  • 文字描述:写文字描述需要手动输入结果,容易出错;

  • 交叉表:多个交叉分析结果,stata可以用tabout导出,但是,不同交叉结果需要手动合并成一个表;

  • 百分比:涉及到百分比的结果,stata中都是不带%的,在写报告尤其是作图时,需要手动转换;

  • 结果再分析:stata分析后的结果再分析的程度有限,需要再导入Excel手动再分析;

二、学习时间

2020年1月2日-1月9日

三、学习方法

参照之前写过的报告,从数据导入、数据查看、数据统计分析、数据作图、作表,Rmarkdown写报告一步一步地进行学习,按照需求百度学习结果。

四、学习经过

从SPSS过渡到stata,再到R,学习曲线比较缓和

时间 内容 遇到的问题
2020.1.2 Rmarkdown了解;制作报告word模板;导入数据;文本及分析结果结合;
2020.1.3 Rmarkdown做饼图; 导出图片不可编辑;分辨率有问题;图片不能居中;Rmarkdown除了标题和正文,没有其他样式【图标题设为标题6,再用vba统一将样式A转为样式B】;
2020.1.6 优化计算方法;ggplot改成pie画饼图; 脚注的数字无法上标;做出来的简单图很难调好看;
2020.1.7 尝试结合officer包解决图表问题 R不能生成office图表,生成的图还是很丑;ggplot学习曲线还是挺陡峭的;
2020.1.8 专注R进行描述统计分析,尤其是多个交叉结果导出;可以将交叉结果合并输出CSV文件;百分比的结果可以都加上%
2020.1.9 实现R批量写不带图表的报告

五、学习成果

  1. 能用R解决学习原因中的问题:

    1. 写文字和统计分析同时进行;

    2. 多个交叉结果可以合并输出;

    3. 结果可以加上%导出;

    4. 进行基础描述分析,并对结果进行再分析;

  2. 了解并学习markdown的语法,并开始用markdown进行写作;

  3. 能够用R实现不带图表的分析报告批量生成;

六、学习结论

  1. 报告:Rmarkdown适合写统计+文字的报告,不太适用于目前公司这种大量图表的数据报告;

  2. 清洗:清洗还是stata比较好用,主要是,数据量上万后,数据导入R比较慢,而且,数据窗口加载也比较慢(不知道是不是电脑的原因),数据操作的交互可视化不强,这对于掌握数据情况的要求较高;

  3. 分析:R适用于更深入的复杂统计,建模,结果再深入分析的数据分析,不适用于目前公司数据报告中的频率和交叉等描述统计;

  4. 效率:单纯写一次性的的大量数据图表的报告,效率并不高。第一,R学习曲线较为陡峭;第二,要满足现在的数据报告,用R分析,还得结合VBA和Excel,效率不一定更高;

  5. 提升:作为技能提升,学习R有必要,更容易产生“玩转数据”的感觉;

七、最后感受

未来学习:虽然目前数据报告用R的空间并不大,但是,感觉R还是很值得学习的,以后也会尽可能找机会用R进行分析,有助于锻炼对数据的更深入的理解,以及加深统计分析能力。

相关文章

  • R初学总结

    一、学习原因 反思提高工作效率过程中,感觉到2019年下半年写的几个上百页的数据报告过程中,有诸多让自己觉得很心累...

  • 初学R语言

    加入工作以来,我一直是业务部门,也就是提数据需求,然后自然有人帮我算数,所以学习一门数据处理语言也不是很紧迫。 正...

  • 初学总结

    初学python,被pyalgotrade支持python2还是3的问题搞得头大,决定换换脑子,对初学遇到的坑总结...

  • 关于加载本地版R包的基因教训

    加载本地R包对于大部分R语言初学是一个难题,今天我们来聊一聊如何正确的安装离线R包。 GEOmirror R包是从...

  • Vim初学者的资源总结

    之前我写过两篇文章《Python初学者的资源总结》、《Linux初学者的资源总结》,主要是包含了Python和Li...

  • Git的初学者资源总结

    之前我写过两篇文章《Python初学者的资源总结》、《Linux初学者的资源总结》,主要是包含了Python和Li...

  • python分数的四则运算

    适用于初学着看看,没有很深入的知识与语法,大神可以越过。 代码 r1 = Arithmetic(9, 10)r2 ...

  • EventBus初学总结

    什么是EventBus? EventBus是基于发布/订阅者机制的,对事件进行发布和接受,例如Intent、Han...

  • GreenDao初学总结

    什么是GreenDao? Greendao是一款用于数据库创建与管理的框架,用来操作数据库,它省去了数据库的建表操...

  • Rxjava初学总结

    什么是Rxjava? Rxjava是基于观察者模式,使用操作符和异步操作来处理复杂的业务 基于观察者模式的Rxja...

网友评论

      本文标题:R初学总结

      本文链接:https://www.haomeiwen.com/subject/ehfvactx.html