- 通过阅读来学习,包括了阅读经典的教材、代码、论文、学习公开课。
- 通过牛人来学习,包括同行的聚会、讨论、大牛的博客、微博、twitter、RSS。
- 通过练习来学习,包括代码练习题、参加kaggle比赛、解决实际工作中的难题。
- 通过分享来学习,包括自己写笔记、写博客、写书、翻译书,和同伴分享交流、培训新人。
本文用于收集各类R语言的学习资源,用于学习、练习和分享。
1. 图书参考
1.1 初学入门
- 《R语言实战》R in Action
从统计角度入手,分高中低三部分由浅入深的讲解了如何用R来实现统计分析。 - 《R语言编程艺术》The Art of R Programming
从程序编写的角度入手,对R的本身特点进行了清晰的介绍。 - 《learning R》
这本书没有单纯的讲语法,而是和的流程结合了起来,从数据获取到数据整理再到分析和报告,有一气呵成的感觉,此外最后两章讲如何写稳健的R代码以及写包都是非常精彩的。 -
《153分钟学会R》
主要是R常见问题解答。
1.2 参考手册
本节主要介绍R语言快捷参考手册和各种功能强大的R语言包的介绍。
- 《R语言参考手册》
- 《R语言基础包函数中文帮助文档(中英文对照v1.0)》
- 《R Cookbook》
- 《R in a Nutshell》
以上两本为词典式的案头参考手册,以便随时查阅。 - 各类包的参考手册
如:gglpot2、rcharts、quantmod
1.3 统计进阶
本节主要学习统计计量知识,和通过R语言的实现。
- 《A Handbook of Statistical Analyses Using R》
- 《Modern Applied Statistics With S》
这两本书基本上涵盖了统计的一些高阶内容,例如多元分析、多层回归模型、荟萃分析、生存分析等内容。案例丰富,公式不多,值得反复学习参考。
1.4 数据绘图
ggplot2,是R中最优秀的绘图包。
- 《ggplot2 Elegant Graphics for Data Analysis》
- 《R Graphics Cookbook》
这本书也是RStudio公司的人出的,似乎是Hadley的学生吧,主要是各种ggplot2包的例子,也包括了用其它包来画图,建议通读一遍。
除了ggplot2外,R还可以通过rcharts和RStudio公司的shiny来实现可交互式的数据展示。 - rcharts包
1.5 经济投资
1.6 数据挖掘
- 《Practical Data Science with R》
以R本身的扩展包和函数入手,很有体系的介绍了数据科学的各个方面。 - 《An Introduction to Statistical Learning》
这本书可以说是另一本数据挖掘大作《The Elements of Statistical Learning》的R实现手册,体系结构基本一致,更强调用R来实现,更难得的地方是提供了很好的习题。 - 《Data Mining with R Learning with Case Studies》
- 《Machine Learning for Hackers》
两本侧重于数据挖掘的R书,全是以案例为线索,示范的代码量很大。跟一遍下来会有很大的收获。 - 《Data Mining explain using R》
用基本函数来实现各种机器学习算法,对理解算法底层很有帮助。 - 《Data Science in R》
以案例为主的书,需要一定的数据挖掘基础。
1.7 科学计算
- 《Introduction to Scientific Programming and Simulation Using R》
- 《Mastering Scientific Computing with R》
除了统计分析外,独特之处在于使用R来做数值分析,如求根,最优化,数值积分。还包括了一些常见的模拟技术。书后的习题和最后的案例非常有用。
1.8 高级编程:
- 《R Programming for Bioinformatics》
- 《software for data analysis programming with R》
如果你是初学者,不要去看上面两本书。如果你想进阶为专家级R用户,那你需要精读它们。前者讲解了R少为人知的一面,例如字符处理、正则表达和XML,还有报错处理以及与其它语言的交互。后者更是编写生产级代码的圣经指南。 - 《Advanced R programming》
Hadley的力作,清楚的讲解了R的函数式编程思想和写R包的各种细节,要迈入R高手,不得不读。 - 《数据科学中的R语言》
李舰和肖凯的作品
2. 网络资源
- R语言官方站
http://www.r-project.org/ - R-blogger 丰富的R博客资源
http://www.r-bloggers.com/ - R语言资源汇总
https://github.com/qinwf/awesome-R - R语言搜索引擎
<http://www.rseek.org/ - R函数在线帮助
http://www.rdocumentation.org/ - stackoverflow关于R的问答
http://stackoverflow.com/questions/tagged/r - 一个入门级的R在线教程
http://tryr.codeschool.com/ - 交互式的R在线教程
https://www.datacamp.com - 统计之都
http://cos.name/ - Hadley Wickham大神
http://hadley.nz - 肖凯的个人博客
http://xccds1977.blogspot.com
https://www.zhihu.com/people/xiao-kai-93 - 谢益辉的个人博客
http://yihui.name - 尾巴AR的个人博客
http://www.cnblogs.com/weibaar/ - 美国计算机世界杂志提供的R语言初学者入门资料
http://www.computerworld.com/s/article/9239625/Beginner_s_guide_to_R_Introduction - R and Data Mining
http://www.rdatamining.com - 各种cheatsheet
http://cran.r-project.org/doc/contrib/Short-refcard.pdf http://www.rstudio.com/resources/cheatsheets/ - spatial.ly
spatial.ly is written by James Cheshire. James is a lecturer at the UCL Department of Geography where he researches, teaches and maps. - Oliver Uberti博客
https://oliveruberti.com
James Cheshire and Oliver Uberti are the author of 《LONDON: The Information Capital》
3 视频资源
Coursera上约翰.霍普金大学的数据科学系列课程该系列课程包含如下几门课。
1.《数据科学家的工具箱》
该课程主要介绍了数据科学家常用的一些工具。包括R、 RStudio、 Git 、Github ,这里强烈推荐RStudio,作为R的一个集成开发环境(IDE), 它可以在Latex、 PDF、 markdown、 html 中游刃有余,并且是个强大的Literate Programming 工具。除了以上提及的强大工具之外,还介绍了数据的类型、数据分析的方法过程、以及数据科学的一些知识点。
2.《R语言程序开发》
主要内容包括:1)R概述,R的数据类型和对象,数据的读写操作;2)R中的控制流,函数式编程,作用域,时间数据类型;3)循环函数,检查代码漏洞的方法;4)数据模拟实现,代码风格规范。
3.《获取和整理数据》
完成这门课程将获得技能:1)从各种资源获取数据;2)数据清洗的原则;3)数据整理的工具与技巧。
4.《探索性数据分析》
完成这门课程将收获:1)运用R中的base,lattice,ggplot2等绘图系统进行数据的可视化展示;2)对不用类型的数据运用基本的数据展示原则创造丰富多样的分析图;3)基于特定问题出发,运用探索高维数据的统计技巧,创造多维度数据的可视化方式。
5.《可重复性研究》
通过这门课程,你将学会:1)使用Rmarkdown撰写文档;2)在分析报告中嵌入R代码;3)用knitr等相关工具编译Rmarkdown文档;4)进行可重复性的数据分析研究。
6.《统计推断》
这门课主要介绍统计推断的基础。可以收获:1)统计推断的概览;2)进行统计推断的模型假设;3)复杂统计推断的技巧。
7.《回归模型》
这门课教会学生:1)如何进行拟合线性模型,如何进行残差分析;2)进一步探索如何引入哑变量解决特殊的模型设定问题;3)介绍广义线性模型,特别是Poisson回归和Logistic回归。
8.《实用机器学习》
完成这门课将收获:1)经典机器学习算法;2)如何应用多种机器学习工具;3)如何对真实数据进行模型评估和预测。
9.《数据产品开发》
内容涵盖:1)如何创造统计产品以进行交互式探究;2)重点学习如何探究不确定性的统计结果;3)如何创造Shiny应用,以及数据产品相关的R扩展包。
作者:黄耀鹏
链接:https://www.zhihu.com/question/21654166/answer/64127931
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
网友评论
library(rJava)
Error : loadNamespace()里算'rJava'时.onLoad失败了,详细内容:
调用: fun(libname, pkgname)
错误: JAVA_HOME cannot be determined from the Registry
Error: ‘rJava’程辑包或名字空间载入失败,
我的QQ372335839,想认识下大神,向您请教