美文网首页
给女朋友写的生统资料_Part1

给女朋友写的生统资料_Part1

作者: 城管大队哈队长 | 来源:发表于2019-05-08 13:27 被阅读0次

因为深感生统的节奏比较快,可能女票跟不上节奏,所以写了一个简略的manual,只针对生统的一些相关操作,不涉及高深的R操作。如果大家觉得还要加什么东西,可以在下面留言。

前期准备

  • 语言问题:

对于 R 或者 R studio来说,我非常建议把语言更改成英文。这样,在你报错的时候,比较方便去搜索

  • 工作路径:

对于有R studio的来说,频繁地切换 setwdgetwd 可能不是一个很好的选择。所以我比较推荐新建一个Project,这样你每次你的任务都会是独立的。新建完Project之后你就可以把作业相关的数据放在你的Project里面。在后面读取的时候,就不用切换 setwd 或者打一大串目录了。

  • 保存问题:

我比较推荐的是在Tools-Global Options—General那里,将Save Worksapce to .RData on exit那里设置为Never。这可能会导致你每次打开你的Project,变量都还得重新打一遍。但这可以保证你的代码的可重复性。

  • 镜像及安装问题:

生统课上的如果包都很小,所以镜像设置其实是无所谓的。
如果想安装某个包的话,使用如下代码

## 以安装pwr包为例,注意加引号
#install.packages("pwr")

数据读取

生统课上用到的文件一般给的都是 txt 或者 csv 文件,这意味一般着只需要使用 read.table 这个命令来读取文件就可以了。
让我们先来看一下read.table这个函数怎么用。

?read.table

不懂的时候寻求谷歌或者?+命令,是一个很好的习惯

你会发现read.table()里面跟了一大堆东西,其中跟我们可能相关的是

  • file:代表你要读的文件路径
  • header:表达你是否要添加表头,默认值是FALSE,我们一般要设置为TRUE
  • sep:sep代表是你用什么样的形式来分割你读取的文件,一般生统的文件可能会以空格,制表符,逗号来分割。分别对应sep = " ",sep = ",",sep = "\t"

我们来尝试读一个文件

test1 <- read.table("rawdata/test1.txt",header = T)
head(test1)
##   yield seed
## 1   383    1
## 2   406    1
## 3   351    1
## 4   400    1
## 5   390    1
## 6   361    1
  • 这里我们用了 header = T ,这样我们的数据就会有表头,或者说列名了。即 yield 和 seed。

  • TRUE和T是等价的,同理FALSE和F也是等价的。

  • csv是本质上是用逗号分割的文件,所以我们在读的时候加上 sep = "," 即可。

  • head代表的是你只输出你数据的前几行。同理,tail输出后几行。

  • 再次提醒一遍,感觉不懂命令是什么时候用?或者谷歌。

  • 你还可以用row.names=1,来将第一列当作行名。

相关文章

  • 给女朋友写的生统资料_Part1

    因为深感生统的节奏比较快,可能女票跟不上节奏,所以写了一个简略的manual,只针对生统的一些相关操作,不涉及高深...

  • 给女朋友写的生统资料_Part19

    聚类 聚类(clustering),指将样本分到不同的组中,使得同一组中的样本差异尽可能的小,而不同组中的样本差异...

  • 给女朋友写的生统资料_Part14

    之前我们提到了如果做多次的假设检验,就要考虑多重比较矫正的问题了。那有没有只用做一次检验就可以搞定的方法呢。其实是...

  • 给女朋友写的生统资料_Part15

    相关性 当我们在衡量两个变量的相关关系的时候,我们可以用协方差来进行描述。协方差的公式为 协即协同的意思,X的方差...

  • 给女朋友写的生统资料_Part11

    中心极限定理 中心极限定理 假设我们有一个总体,我们从总体中取出一个大小为5的样本。我们可以利用这个样本均值、方差...

  • 给女朋友写的生统资料_Part12

    我感觉到后面应该会讲的比较省略了,公式模板什么的套的比较多,因为主要是用来做考试复习和速查的。大家如果有什么疑问,...

  • 给女朋友写的生统资料_Part13

    Power(统计功效) 关于power,我觉得下面这张图已经解释的很好了。 当 H0 是正确的时候,拒绝了H0,就...

  • 给女朋友写的生统资料_Part16

    多元线性回归 多元线性回归的方程写为:其中代表第个预测变量,是对应的模型参数。可以解释为在所有其他预测变量保持不变...

  • 给女朋友写的生统资料_Part17

    逻辑斯蒂回归 我们之前提到的线性回归是利用X来预测Y,Y是连续型的数值变量。但有时候Y并不是连续型的变量,而是一种...

  • 给女朋友写的生统资料_Part18

    apply和function 差异基因的检验估计会用到function和apply。不过差异基因表达的functi...

网友评论

      本文标题:给女朋友写的生统资料_Part1

      本文链接:https://www.haomeiwen.com/subject/gnsmoqtx.html