美文网首页生信星球培训第六十六期
生信学习小组Day5笔记-lamyusam_

生信学习小组Day5笔记-lamyusam_

作者: lamyusam_ | 来源:发表于2020-06-19 23:40 被阅读0次

R语言学习

今天,了解了R中的数据类型,初步学习R语言的数据结构。

R的数据类型

向量(vector)

  • R语言中的向量区别于数学中的向量概念,R语言的向量更类似于数学中集合的概念,即由若干个元素所构成的一维数组。R语言中这些元素可以是数值型或字符型。

c函数可以创建,向量中每一项元素都要用,号隔开。

x <- c(1,2,3,4,5)  # 创建数值型向量,赋值给变量x,x中包含五个元素。
y <- c("one","two","three") #  创建字符串型向量,赋值给变量y,y中包含三个元素。

Environment窗口,可以看到当前环境下,存在的所有变量的类型及其内容。

创建字符串型向量,一开始我总忘记加" ",然而不加引号就会提示对象找不到,因此在以后的学习中要特别注意这一细节

向量索引(从向量中提取元素)

1.根据元素位置

z <- seq(1,20,by = 2)  #利用seq函数从1-20之间每隔2取一个数,并赋值给变量z
z[6] #提取z向量第6位元素
z[-6]#提取除了第6位元素之外的其他元素
z[2:6]#提取第2到6位元素
z[-(2:6)]提取除了第2-6位的其他元素
z[c(1,6)]提取第一位和第六位元素

2.根据具体值

z[z==17] #提取值为17的元素
z[z<10]   #提取所有小于10的元素
z[z %in% c(1,2,3)]#提取向量z与向量c(1,2,3)的公有元素

数据框

在工作目录下新建一个lamyusam.txt文件,


这里以逗号作为分隔符

  • 使用read.table函数获取数据框
a <- read.table(file="lamyusam.txt",sep=",",header=T)
read.table参数说明
参考:https://www.jianshu.com/p/90e1d430c9ef
  • 设置行名和列名
a <- read.csv("lamyusam.txt")将数据框赋予变量a
colnames(a) #查看列名
rownames(a)#查看行名
colnames(a)[a]#默认行名就是行号
a <- readc.cs(file="lamyusam.txt",sep=", ",header =  T,row.names=1)# 修改第一列为行名
  • 数据框的导出
write.table(a,file=''lyc.txt",sep=",",quote=F)

在工作目录下创建了一个重新命名的修改过的数据框

  • 变量保存与重新加载
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(a,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令

+提取元素

#假设a是一个行列数分别不小于m和n的数据框
a[m,n]#提取第m行,第n列的元素
a[m,]#提取第m行的所有元素
a[,n]#提取第n列的所有元素
a[n] #也是提取第n列
a[m:n]#提取第m列到第n列的所有元素
a[c(m,n)]#提取第m列和第n列的元素
a$列名#提取该列名下的所有元素,局限在于只能提取一列

示例:

提取数据框中的变量

1.创建一个数据框

name <- c("A" ,"B","C","D","E","F","G","H")
age  <- c(22,21,23,23,34,19,12,43)
weight <- c(70,55,68,76,72,54,45,70)
height <-c(178,176,177,182,171,165,150,180)
data1 <- data.frame(name,age,weight,height)
示例数据框data1

2.使用$

提取年龄,身高,体重信息,并绘制年龄变量与身高(height)和体重(weight)的散点图

plot(data1$age,data1$height)
plot(data1$age,data1$weight)

如图:



这个方法需要在每个变量前面输入 data.1$,显然这看起来并不够简洁。

3.使用attach()detach()函数

 attch(data1) #将数据框添加到R的搜索环境中
plot(age,height) 
plot(age,weight)
detach(data1)#将数据框从搜索环境中移除

在绘图效果一样的前提下,达到了简化代码。
但这种方法也具有一定的极限性,当数据框的列名与其他对象名称相同时,则会报错。

如图:


因此,使用attch()函数前必须确保没有同名对象。

3.使用with()函数

with(data1,{
plot(age,height)
plot(age,weight)
})

在这种情况下,花括号{}仅仅针对数据框data1执行 ,不用担心对象名称冲突。

加油,明天继续...

相关文章

  • 生信学习小组Day5笔记-lamyusam_

    R语言学习 今天,了解了R中的数据类型,初步学习R语言的数据结构。 R的数据类型 向量(vector) R语言中的...

  • 生信学习小组Day1笔记-lamyusam_

    前言 本科毕业已经一周有余,每当闭上眼,过往的点点滴滴便开始如电影般清晰地在脑海中放映。回首过往的岁月,有苦也有甜...

  • 生信学习小组Day6笔记-lamyusam_

    R包学习 R语言的一大特点就是拥有许许多多的第三方扩展包,这些包可以从官方网站下载,但由于速度限制,需要在Rstu...

  • 生信学习小组Day3笔记-lamyusam_

    是一个管理软件的工具,类似于“应用商店”的概念,目前已成为很好的生物软件管理工具。今天从Miniconda入手,开...

  • 生信学习小组Day4笔记-lamyusam_

    新手上路依然清晰地记得,当初为了在Windows系统中安装R语言学习环境耗费了我多少精力,走了多少弯路最终才得以正...

  • 生信学习小组Day2笔记-lamyusam_

    2020/6/16学习生物信息,Linux是必须掌握的内容正所谓:"万事开头难,后面更难..." 在得到花花给的腾...

  • 生信学习小组Day7笔记-lamyusam_

    在生信星球的学习小组里,每一天的生活可以用两个字形容——“充实”花花给我们制定了很有层次的学习计划,内容有详有略、...

  • 学习小组Day6笔记——冬梅

    生信星球学习笔记-Day5学习R包 安装和加载R包 镜像设置操作界面设置CRAN的镜像:Tools→Globle ...

  • 学习小组Day5笔记--kan

    笔记来自生信星球学习小组资料 Day5 学习内容-R语言数据类型 1.思维导图镇楼 2.R语言数据类型 向量 ve...

  • Day-1--小陈

    生信星球-小组学习-day1 ##小陈 1.关于学习方法 学习、索引、小组讨论、正确提问、笔记、总结;心得 2...

网友评论

    本文标题:生信学习小组Day5笔记-lamyusam_

    本文链接:https://www.haomeiwen.com/subject/pdnvxktx.html