经过昨天的初步接触,已经了解了超超超超suba基础的小操作,还有万能的help(balabala)
以及老师们教给的?read.table
给变量赋值并提取向量中的值
基础代码如下
1.给变量赋予不同的值
x<- c(1,2,3) #将x定义为由元素1,2,3组成的向量
x<- 1:10 #从1-10之间所有的整数
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)
x<- rep(1:3,times=2) #1-3 重复2次
TIPs:
- 所有的符号要用英文的
-
:
是到的意思 a到b -
seq(a,b,by = n)
生成一组数从a到b,间隔为n
rep(x, time = , length = , each = ,)
x:代表的是你要进行复制的对象,可以是一个向量或者是一个因子。
times:代表的是复制的次数,只能为正数。负数以及NA值都会为错误值。复制是指的是对整个向量进行复制。
each:代表的是对向量中的每个元素进行复制的次数。
length.out:代表的是最终输出向量的长度。
————————————————
原文链接:https://blog.csdn.net/qq_27586341/article/details/91364510
2.从向量中提取元素
2.1 根据元素位置
>x[-4]#排除法,除了第4个元素之外剩余的元素
>x[2:4]#第2到4个元素
>x[-(2:4)]#除了第2-4个元素
>x[c(1,5)] #第1个和第5个元素
2.2根据值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
(都是从生信星球学习小组umu平台课程引用~)
TIPs:
-
c(1,5)
中的逗号是隔开,没有什么实际意义 - 提取向量中的某个确定的值用
==
双等号 -
%in%+向量
作用是提取向量中的全部元素
数据框
一定要将数据放到工作目录下哦~
1.读取本地数据
读取的基本格式:
read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"), row.names, col.names, as.is = !stringsAsFactors, na.strings = "NA", colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill = !blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#", allowEscapes = FALSE, flush = FALSE, stringsAsFactors = default.stringsAsFactors(), fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...)
read.csv2(file, header = TRUE, sep = ";", quote = "\"", dec = ",", fill = TRUE, comment.char = "", ...)
read.delim(file, header = TRUE, sep = "\t", quote = "\"", dec = ".", fill = TRUE, comment.char = "", ...)
read.delim2(file, header = TRUE, sep = "\t", quote = "\"", dec = ",", fill = TRUE, comment.char = "", ...)
header
a logical value indicating whether the file contains the names of the variables as its first line. If missing, the value is determined from the file format: header is set to TRUE if and only if the first row contains one fewer field than the number of columns.
一个逻辑值,指示文件是否包含变量名作为其第一行。如果缺失,则根据文件格式确定该值:当且仅当第一行包含的字段比列数少一个时,header被设置为TRUE。
sep
the field separator character. Values on each line of the file are separated by this character. If sep = "" (the default for read.table) the separator is ‘white space’, that is one or more spaces, tabs, newlines or carriage returns.
字段分隔符。文件中每一行的值用这个字符分隔。如果sep = "" (read.table的默认值)分隔符是' white space ',即一个或多个空格、制表符、换行符或回车符。
网友评论