关于我很多同志都已经不再陌生,但是几个核心的概念在一项长期的工作中是需要重申一下的。就是关于这个人是个什么人的问题。
我将要在简书上刷第五本书了:《R语言数据科学》,前五本分别是:
- 《数量生态学》 || 90% 完成
- 《环境与生态统计》 || 60% 完成
- 《机器学习实战》 || 0.1% 完成
- 《高通量测序技术》 || 6%完成
所谓善始者实繁,克终者盖寡。但是有些时候又是不断地开始,点燃一个又一个新的念头,以使自己知道哪个姿势才是舒服的。618买了一床的书,但是从哪里开始呢。所以一个主题阅读的需求就提上日程了,就是要围绕一个核心展开宽泛的阅读。摆在我面前的依然是两大语言:R和python。python我是仰慕已久的,一直都很想用,也很想来刷一刷,但是作为第五次的备选,依然没有选上。
还是选一本R语言的书来做吧!
--- 你为什么要这么做?
···时间总要被用掉啊
2019年半年以来,我的R语言有没有长进呢?可以说是没有。用R解决的所有问题不过是:在Google上查询内容时加一个“R",或者在R里面用问号去看参数。这可以说是我学习R和用R在目前最高的境界了,然后就是得益于我的第一门编程语言Markdown,在R里面组织一下文档。
没有创造过任何东西,可以说是一只老菜鸟了。菜鸟也需要温暖啊,学习也需要细节。险以远至者少,奇伟瑰怪常在险远。还是在R的世界都呆一会吧,至少知道什么叫S4类,尝试一下R的面向对象编程,用R做做挖掘,而不是一味地copy人家的代码。
每每念及此,不免伤怀感喟,拍案不已。以自己的知之甚少,羞愧难当。我已不再是那个阳光男孩,带着青春期后遗症蹒跚进入中年。要是我真的成熟了,是不是不会在这啰嗦这些没用的,而是直接写本书的前言。
其实本书主要讲了一个R包:tidyverse。说是数据科学不过是数据处理,dityverse重新定义了一套处理数据的函数,使得数据转化更加高效和人性化。本书并没有提出什么数据科学的算法模型,这些东西是R的强项。所以边界要找好,也不要期望太高。
因为tidyverse 是一门新的语法,所以并不是上了年纪的人才适合,对于R语言的初学者也是可以看的,我就是一个初学者。当然,更这本书只是为了完成任务——以后可能会开始更多的书,它们都有一个特点:都带有代码。
燃尽图。
本书共五个部分,二十二章,而2019年还有六个月:
- 探索
- 数据处理
- 编程
- 模型
- 沟通
我将重点关注的是数据处理,编程和沟通这几个领域。当需要交作业时,我会拿出这本书来完成任务。我有一个长长的写作列表,但是只有这个表越来越长才能有助于这个列表的完成。Everything takes time 。
我也有一个长长的阅读列表《R语言数据科学》《R语言编程艺术》《R语言数据可视化之美》《高效R语言编程》《基于R语言的机器学习》《R包开发》,关于python的书要比R的至少厚出5倍吧。
当然我还有长长的未完成的列表,似乎永远都完不成。
选择这本书的好处是不要安装各种包,我写R代码的时间远远小于我安装R包的时间,我几乎每天都在处理R包安装报错。我真的想学习好R语言,真的(说这话的时候,作者都快哭了)。
思考:学用R语言必备良器是什么?
参考答案:Google。
网友评论