美文网首页生物信息学数据科学与R语言r语言学习
Biostatistics(4)R实例:数据的概括性度量

Biostatistics(4)R实例:数据的概括性度量

作者: jlyq617 | 来源:发表于2018-01-04 16:38 被阅读39次

    R的入门

    我用的是MacBook pro的macOS系统,所以有一些代码会与Win系统的小伙伴有一些差别。
    关于R的下载:https://www.r-project.org
    另外推荐下载RStudio,它是一款R的编辑器,界面比R更加友好,且有一些自动补全等。平时大家还可以用RStudio提供的Rmarkdown平台写代码,比较方便保存、修改。
    下载地址:https://www.rstudio.com

    RStudio.png
    本次练习所用到的数据:https://pan.baidu.com/s/1jHX1ZOM

    数据的导入

    首先将数据a-1.txt下载到自己的电脑,然后打开查看:
    没错,我们有很多很多条数据,也许我们可以用excel打开它并计算平均数等值,但是显然excel一定会卡爆。另外,我们可以观察到第一行是‘x’并非一个数值而是这一列数据的名称,也就是我们常说的header。

    a-1.txt.png

    接着我们打开RStudio/R软件。
    此时要注意当前工作路径是否与数据保存的路径一致,不然会发生报错说文件不存在。

    image.png

    1.在R语言中,会看报错十分关键。建议大家不要使用中文版本,虽然你会发现中文比较容易看懂,但是当在浏览器中搜索中文版的报错时,几乎给不了你任何解答。
    2.我们在保存文件的时候要学会使用英文,因为你会发现用中文在读取文件以及使用其他各种指令的时候真的各种不方便。
    3.在输入R代码的时候务必注意时英文输入法,用中文的各种标点符合都可能会出现错误。

    改变工作路径
    getwd()命令可以得知我们当前的工作路径。
    setwd()命令可以让我们修改工作路径。

    image.png

    当然很多人可能并不能很快速地输入这一串的路径,没有关系我们也可以用傻瓜式的点击办法:

    选择路径.png

    然后选择到你保存a-1.txt文件的目录里即可。

    read.table('a_1.txt',header=T)
    a<-read.table('a_1.txt',header=T)#读取a_1.txt并保存到a
    b<-read.table('a_1.txt')#读取a_1.txt并保存到b
    

    上述三行代码有所不同:
    第一行并未保存,因此你输入后会直接将读取的结果显示在屏幕上,并无法进一步处理它。
    第二行与第三行都将读取的数据存储到一个变量中,而第二行的a将header设置为T(TRUE),也就是R不会把x当成一个值读入,而会认为它是一个header。但是b则把x也当作一个值。

    此时,RStudio就显示出其的优越性,点击右上框中b后面的表格图样我们便可在左上框查看其数据。我们会发现其header为V1。

    b.png

    计算数据的概括性度量

    attach(a)#该指令可以让我们直接用表中的变量名
    mean(x)#计算平均值
    sum(x)#计算总和
    max(x)#寻找最大值
    min(x)#寻找最小值
    range(x)#x的范围
    median(x)#计算中位值
    var(x)#计算方差
    sd(x)#计算标准差
    
    R演示.png

    当然我们还有其他很酷的函数可以用于描述性分析,可以让我们一下子看到多个统计量。

    #用summary()函数进行描述性分析
    summary(x)
    #用Hmisc包中的describe()进行描述分析
    library(Hmisc)#在使用之前要进行包的安装
    describe(x)
    #用psych包中的describe()进行描述分析
    library(psych)#在使用之前要进行包的安装
    describe(x)
    
    summary().png Hmisc.png psych.png

    另外我们还可以用boxplot(x)制作箱型图

    boxplot.png

    那么箱型图怎么看呢?


    iboxplot图解.png

    那么,第一次的练习就到此为止。关于包的加载等大家可以自己百度学习一下。~

    相关文章

      网友评论

      • 许四书:很棒的系列文章!:+1:🏻
        一个小问题:MacBook pro用的是macOS系统,而非iOS。iOS是iPhone的系统(嗯,我知道,这个不是文章的重点 哈哈)
        许四书:很好的文章,谢谢你写出来
        jlyq617:@许四书 23333当时一下子没想起来打完觉得有点怪异。。哈哈哈哈哈待会修改一下谢谢指正

      本文标题:Biostatistics(4)R实例:数据的概括性度量

      本文链接:https://www.haomeiwen.com/subject/rebrnxtx.html