1.知识点
①R的赋值:<-
②代码都是带英文括号()的
③getwd():显示工作路径
④向量元素或者数字或字符串
⑤R中的表格称为数据框
⑥遇到不懂得函数或代码时:谷歌、百度搜索;?read.table 找example研究试运行一下
⑦数据类型
vector 向量
matrix 矩阵
array 数组
data frame 数据框
list 列表
2.向量
(1)区分标量和向量
①元素:数字或字符串(chr)等
②标量:一个元素组成的变量,如1、"peace" (必须用引号圈起一个字符串)
③向量:多个元素组成的变量,如c(1,2,3)、c("u","I","she")
④变量赋值:即给变量赋予一个数值、字符串或者时数据框
赋值(2)从向量中提取元素
①根据元素位置:x[4]、x[-4]、x[2:4]、x[-(2:4)]、x[c(1,5)]
向量中提取元素1(根据元素位置)②根据值:x[x==10]、x[x<7]、x[x %in% c(1,2,5)](存在于向量c(1,2,5)中的元素)
向量中提取元素2(根据值)(注意:两个==,一个=输出的是第十个数字)
③查看变量
查看变量看变量
3.数据框
①读取本地数据:read.table(file="huahua.txt",sep="\t",header=T)
读取本地数据sep 是函数的形式参数,多数情况下, seq 参数用来指定字符的分隔符号。不仅用在你所提到的输出,也用在输入,也用在字符串的合并与拆分上。
csv 文件是用逗号分隔的,故而 sep = ","
tsv 文件是用制表符分隔的,故而 sep = "\t"
常用的分隔符还有空格 sep = " "
分隔符是任意的,可根据具体情况指定的。
header:一个表示文件是否在第一行包含了变量的逻辑型变量。如果header设置为TRUE,则要求第一行要比数据列的数量少一列。
②读取本地数据并赋值:X<-read.csv('doudou.txt')
③ 查看列名:colnames(X)
查看行名:rownames(X)
④修改第一行的行名为bioplanet:colnames(X)[1]<-"bioplanet"
设置行名和列名⑤读取本地文件,并且修改第一列行名为1:X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)
⑥导出数据框,并且命名为yu.txt,分隔符改为逗号,字符串不加双引号:write.table(X,file = "yu.txt",sep = ",",quote=F)
数据框导出quote:用于对有特殊字符的字符串划定接线的字符串,默认值是TRUE(")或单引号(')
⑦保存当前所有变量为bioinfoplanet.RData:save.image(file="bioinfoplanet.RData")
保存其中一个变量X为test.RData:save(X,file="test.RData")
⑧加载test.RData:load("test.RData")
保存变量及重新加载⑨提取元素
X[x,y]:第x行第y列
X[x,]:第x行
X[,y]:第y列
X[y]:第y列
X[a:b]:第a列到第b列
X[c(a,b)]:第a列和第b列
X$列名:提取列
提取元素
网友评论