美文网首页生物信息学数据科学与R语言r语言学习
Biostatistics(4)R实例:数据的概括性度量

Biostatistics(4)R实例:数据的概括性度量

作者: jlyq617 | 来源:发表于2018-01-04 16:38 被阅读39次

R的入门

我用的是MacBook pro的macOS系统,所以有一些代码会与Win系统的小伙伴有一些差别。
关于R的下载:https://www.r-project.org
另外推荐下载RStudio,它是一款R的编辑器,界面比R更加友好,且有一些自动补全等。平时大家还可以用RStudio提供的Rmarkdown平台写代码,比较方便保存、修改。
下载地址:https://www.rstudio.com

RStudio.png
本次练习所用到的数据:https://pan.baidu.com/s/1jHX1ZOM

数据的导入

首先将数据a-1.txt下载到自己的电脑,然后打开查看:
没错,我们有很多很多条数据,也许我们可以用excel打开它并计算平均数等值,但是显然excel一定会卡爆。另外,我们可以观察到第一行是‘x’并非一个数值而是这一列数据的名称,也就是我们常说的header。

a-1.txt.png

接着我们打开RStudio/R软件。
此时要注意当前工作路径是否与数据保存的路径一致,不然会发生报错说文件不存在。

image.png

1.在R语言中,会看报错十分关键。建议大家不要使用中文版本,虽然你会发现中文比较容易看懂,但是当在浏览器中搜索中文版的报错时,几乎给不了你任何解答。
2.我们在保存文件的时候要学会使用英文,因为你会发现用中文在读取文件以及使用其他各种指令的时候真的各种不方便。
3.在输入R代码的时候务必注意时英文输入法,用中文的各种标点符合都可能会出现错误。

改变工作路径
getwd()命令可以得知我们当前的工作路径。
setwd()命令可以让我们修改工作路径。

image.png

当然很多人可能并不能很快速地输入这一串的路径,没有关系我们也可以用傻瓜式的点击办法:

选择路径.png

然后选择到你保存a-1.txt文件的目录里即可。

read.table('a_1.txt',header=T)
a<-read.table('a_1.txt',header=T)#读取a_1.txt并保存到a
b<-read.table('a_1.txt')#读取a_1.txt并保存到b

上述三行代码有所不同:
第一行并未保存,因此你输入后会直接将读取的结果显示在屏幕上,并无法进一步处理它。
第二行与第三行都将读取的数据存储到一个变量中,而第二行的a将header设置为T(TRUE),也就是R不会把x当成一个值读入,而会认为它是一个header。但是b则把x也当作一个值。

此时,RStudio就显示出其的优越性,点击右上框中b后面的表格图样我们便可在左上框查看其数据。我们会发现其header为V1。

b.png

计算数据的概括性度量

attach(a)#该指令可以让我们直接用表中的变量名
mean(x)#计算平均值
sum(x)#计算总和
max(x)#寻找最大值
min(x)#寻找最小值
range(x)#x的范围
median(x)#计算中位值
var(x)#计算方差
sd(x)#计算标准差
R演示.png

当然我们还有其他很酷的函数可以用于描述性分析,可以让我们一下子看到多个统计量。

#用summary()函数进行描述性分析
summary(x)
#用Hmisc包中的describe()进行描述分析
library(Hmisc)#在使用之前要进行包的安装
describe(x)
#用psych包中的describe()进行描述分析
library(psych)#在使用之前要进行包的安装
describe(x)
summary().png Hmisc.png psych.png

另外我们还可以用boxplot(x)制作箱型图

boxplot.png

那么箱型图怎么看呢?


iboxplot图解.png

那么,第一次的练习就到此为止。关于包的加载等大家可以自己百度学习一下。~

相关文章

  • Biostatistics(4)R实例:数据的概括性度量

    R的入门 我用的是MacBook pro的macOS系统,所以有一些代码会与Win系统的小伙伴有一些差别。关于R的...

  • Biostatistics(3)数据的概括性度量

    2.1 数据的重要特征 1、中心性 Center:反映数据集中心点位置的代表值或平均值2、异众性 Variatio...

  • 数据的概括性度量

    统计数据经过整理和显示后,对数据分布的形状 和 特征有了一个大概的了解;如何找到数据分布的特征 和 各个代表值以及...

  • 统计思维导图与常用公式

    数据的概括性度量 集中趋势的度量众数(mode):一组数据中出现次数最多的变量(EXCEL函数:MODE(numb...

  • 3. 数据的概括性度量

    数据的分布特征可以用柱形图、折线图或饼图等各种图表直观地进行展现。反映数据的分布特征的代表值,通常用集中趋势、离散...

  • 统计学第二周——数据的描述性统计

    参考:.统计学第七版-第4章数据的概括性度量; 本周的主要学习内容是数据的描述性统计,本文主要从以下三个方面来进行...

  • 统计学(一)

    第四章 数据的概括性度量(应用中:对样本数据,计算某些统计值,来粗略的观察样本的分布情况。) 1. 样本:数据有...

  • R和Python数据结构对比

    本文内容概要: R语言数据结构及实例操作 Python语言数据结构及实例操作 R语言数据结构及实例解析 接下开始学...

  • Day6R包学习-谢大飞

    学习R包 包是 R 函数、实例数据、预编译代码的集合,包括 R 程序,注释文档、实例、测试数据等。R 语言相关的包...

  • 数据的描述性分析:概括性度量

    水平的描述 平均数(mean)也称为均值,常用的统计量之一。消除了观测值的随机波动,但易受极端值的影响。根据总体数...

网友评论

  • 许四书:很棒的系列文章!:+1:🏻
    一个小问题:MacBook pro用的是macOS系统,而非iOS。iOS是iPhone的系统(嗯,我知道,这个不是文章的重点 哈哈)
    许四书:很好的文章,谢谢你写出来
    jlyq617:@许四书 23333当时一下子没想起来打完觉得有点怪异。。哈哈哈哈哈待会修改一下谢谢指正

本文标题:Biostatistics(4)R实例:数据的概括性度量

本文链接:https://www.haomeiwen.com/subject/rebrnxtx.html