R语言数据类型

作者: 地平线上的背影 | 来源:发表于2019-04-20 16:19 被阅读0次

R语言基础--数据类型-总结
生信学习小组Day5笔记-lamyusam_
Day5—刘强
R语言--变量与数据结构
第三-六章 R语言数据类型
R语言中的向量和标量
2019-08-10 Day-5 杜诗蓓
学习小组Day5笔记--kan
R 学习 DAY2（1）
R语言数据结构2021.1.19

1.字符串

1.连接字符串 - paste()函数

语法说明

paste(var-1，var-2..., sep = " ", collapse = NULL)

参数解释

var-1，var-2...， 表示要组合的任意数量的自变量
sep， 表示参数之间的任何分隔符。它是可选的
collapse， 用于消除两个字符串之间的空格。 但不是一个字符串的两个字内的空间

2.格式化数字和字符串 - format()函数

语法说明

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))

参数解释

x是向量输入
digits是显示的总位数
nsmall是小数点右边的最小位数
scientific，设置为TRUE以显示科学记数法
width指示通过在开始处填充空白来显示的最小宽度
justify是字符串向左，右或中心的显示。

3.提取字符串的一部分 - substring()函数

语法说明

substring(x,first,last)

参数解释

x，是字符向量输入
first，是要提取的第一个字符的位置
last，是要提取的最后一个字符的位置

2.向量

1.单元素向量

R语言中所有变量都以向量的方式储存，所以单个输入即为单元素向量

2.多元素向量

实现方式一：使用冒号

v <- 5:13
print(v)
[1]  5  6  7  8  9 10 11 12 13

实现方式二：使用Seq()函数

print(seq(5, 9, by = 0.4))
[1] 5.0 5.4 5.8 6.2 6.6 7.0 7.4 7.8 8.2 8.6 9.0

实现方式三：使用C()函数

s <- c('apple','red',5,TRUE)
print(s)
[1] "apple" "red"   "5"     "TRUE"

3.访问向量元素

访问向量元素时，用[]建立索引，索引从"1"开始
代码示例：

t = c(1,2,3,4,5,6,7,8,9)
a = t[2]
b = t[c(1,3)]

代码输出

[1] 2
[2] 1,3

索引中负值对应元素会被丢弃

#代码示例
c = t[-1,-5]
#代码输出
[1] 2,3,4,6,7,8,9

使用TRUE，FALSE，0，1亦可建立索引

d = t[0,0,0,0,0,0,0,1]
[1] 9

4.向量操作

向量运算：两向量可以进行加减乘除运算，直接使用运算符号即可（长度不一样的两个向量运算时，较短的向量会被重复以达到相同长度）

t = c(1,2,3,4,5,6)
q = c(1, 2)
#运算时 q = (1,2,1,2,1,2)

向量元素排序：排序函数 sort()

sort(x, decreasing = FALSE)

3.列表

1.创建列表

创建列表使用 list()函数，列表可以包含字符串，数字，向量，布尔值等

list_data = list('red','green',1,2)
#输出结果
[[1]]
[1] "red"

[[2]]
[1] "green"

[[3]]
[1] 1

[[4]]
[1] 2

2.命名列表元素

R语言中的列表可以重命名以便访问，使用 names()函数，同时命名多个列表元素时，可以用向量传入参数

names(list_data) <- c("1st Quarter", "A_Matrix", "A Inner list")

3.访问列表元素

访问列表元素可以使用索引，对于已命名元素，也可以使用名称访问元素

#使用索引访问
list_data[1]
#使用名称访问
list_data$NAME

4.操作列表元素

删除元素：列表元素删除操作，即将该元素标记为 NULL

ld[5] = NULL

更新元素：更新元素可以直接使用索引替换

ld[2] = 1

5.合并列表

合并列表可以使用 c()函数 合并列表

list.merged = c(list_1,list_2)
#输出结果【list_1 = c(1,2,3,4)  list_2 = c(4,5,6,7)】
[1] 1 2 3 4 4 5 6 7

6.将列表转换为向量

使用 unlist()函数 可以将列表转换为向量

4.矩阵

1.创建矩阵

创建矩阵使用 matrix()函数 ，函数参数为：

matrix(data, nrow, ncol, byrow, dimnames)

函数的参数说明：

data 是成为矩阵的数据元素的输入向量。
nrow 是要创建的行数。
ncol 是要创建的列数。
byrow 是一个逻辑线索。如果为TRUE，则输入向量元素按行排列。
dimname 是分配给行和列的名称，行列的名称用向量传入，c(rowname_list，colname_list)

2.访问矩阵元素

访问矩阵元素，可以使用矩阵索引

访问具体元素：M[row_n,col_n]
访问某行元素：M[row_n,]
访问某列元素：M[,col_n]

3.矩阵计算

矩阵计算使用运算符合和函数，要求矩阵行列相等

5.数组

数组常用于储存多维数据，数组仅接受数值输入

1.创建数组

创建数组使用 array()函数

array(data = NA, dim = length(data), dimnames = NULL)

data，表示输入数据，一般使用多维向量输入，如 c(vector_1，vector_2)
dim，表示数组的维度，输入为向量，如 c(row_n,col_n,dim_n)
dimnames，表示数组的维度名称，输入同样为向量

2.访问数组元素

访问数组元素主要使用索引

访问具体元素：A[row_n,col_n,dim_n]
访问某行元素：A[row_n,,dim_n]
访问某列元素：A[,col_n,dim_n]
访问某维元素：A[,,dim_n]

3.跨数组元素的计算

apply()函数可用于操作跨数组元素进行计算，其语法为：

apply(x, data, function)

x，表示操作的矩阵
data，表示用于操作的矩阵的维度，"1"表示对行进行操作；"2"表示对列进行操作
function，表示用于操作的函数

示例

a<-matrix(1:12,nrow=3)
apply(a,2,mean)
#输出结果
[1]  2  5  8 11

6.因子

因子是R语言中比较特别的数据类型，主要用于储存"类别"数据.R把表示分类的数据称为因子

因子是一个向量，通常情况下，每个元素都是字符类型，也有其他类型数据
因子具有因子水平，用于限制因子的取值范围

1.创建因子

通常情况下，R隐式把数据类型为字符的列创建为因子，因为R会把文本类型自动识别为类别数据，并自动转化为因子，但同时也可以通过 factor()函数 显式创建，语法如下：

factor(x = character(), levels, labels = levels,
       exclude = NA, ordered = is.ordered(x), nmax = NA)

x，表示用于创建因子的字符
levels，是水平的标签，字符类型，用于对水平添加标签，相当于对因子水平重命名
ordered，逻辑值，用于指定水平是否有序
nmax，水平的上限数量

2.因子水平

查看因子水平：使用 levels(factor) 查看
因子水平的标签：使用 factor()函数 创建因子时，可以通过 lables 参数为因子水平添加标签

 sex=factor(c('f','m','f','f','m'),levels=c('f','m'),labels=c('female','male'),ordered=TRUE)

7.数据帧

数据帧是表或二维矩阵列状结构，每一列包含一个变量的值，并且每一行包含来自每一列的一组值

列名称应为非空
行名称应该是唯一的
存储在数据帧中的数据可以是数字，因子或字符类型
每个列应包含相同数量的数据项

1.创建数据帧

创建数据帧需要使用 data.frame()函数 ，其语法如下

data.frame(data, row.names = NULL, check.rows = FALSE,
           check.names = TRUE, fix.empty.names = TRUE,
           stringsAsFactors = default.stringsAsFactors())

参数解释为：

data，表示输入数据
row.names，NULL或单个整数或字符串，指定某列用作行名，或者一个字符或整型向量用作数据帧的行名
check.rows:，如果是TRUE，那么就检查行长度和名称是否一致性

2.从数据帧中提取数据

使用列名称提取数据，使用示例：

data_cut <- data.frame(emp.data$name_1,emp.data$name_2)

使用切片方式提取数据，使用示例：

#提取行数据
data_cut <- emp.data[1:2,]
#提取列数据
data_cut <- emp.data[,2:3]

3.扩展数据帧

添加列：直接使用 列名称 即可添加数据，示例如下：

emp.data$new_col = c('向量')

添加行：一般需要使用 rbind()函数
创建同样的dataframe并使用该函数合并两者

网友评论

本文标题：R语言数据类型

本文链接：https://www.haomeiwen.com/subject/ibrlgqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！