向量:原子向量(逻辑型、整型、双精度型、字符型),列表
1. 原子向量
1.1 逻辑型
比较运算符构建逻辑向量
> c(1,2,3,4,5) >= 3
[1] FALSE FALSE TRUE TRUE TRUE
c()手动构建
> c(TRUE, FALSE, FALSE)
[1] TRUE FALSE FALSE
1.2 数值型
包括整型和双精度型,R默认是双精度型的,如果想创建整型数值,要在后面加一个L。
注意
- 双精度型是近似值,表示浮点数。不用==判断相等,用dplyr::near()。
- 整型有一个特殊值,NA;双精度型多三个,NaN、Inf、-Inf。辅助函数is.finite()、is.infinite()、is.na()、is.nan()可以判断这些特殊值。
1.3 字符型
在R中,唯一的字符串只被保存一次,别的拷贝只是生成指向该字符串的指针。
2. 使用原子向量
2.1 强制转换
显示强制转换
as.logical(), as.integer(), as.double(), as.character()
隐示强制转换
需结合上下文环境。常见的比如:数值环境下的逻辑向量
原子向量不能包含不同类型的元素,会转换为最复杂的元素类型,列表才可以。
> typeof(c(TRUE,1L,1.0,"1"))
[1] "character"
> typeof(c(TRUE,1L,1.0))
[1] "double"
> typeof(c(TRUE,1L))
[1] "integer"
> typeof(c(TRUE))
[1] "logical"
2.2检验函数
2.3向量循环
在R中会将较短的向量(这里包括"标量")循环/重复到与较长的向量相同的长度。
> 1:6+1
[1] 2 3 4 5 6 7
> 1:6+1:2
[1] 2 4 4 6 6 8
> 1:6+1:4 #不成整数倍关系时报警告
[1] 2 4 6 8 6 8
Warning message:
In 1:6 + 1:4 :
longer object length is not a multiple of shorter object length
但tidyverse()中更严格一些,只会对标量进行循环。短向量要用rep()手动重复。
2.4向量命名
> c(x=1,y=2)
x y
1 2
> vec <- c(1,2)
> purrr::set_names(vec,c("x","y"))
x y
1 2
2.5向量取子集
一般形式x[......]
使用包含整数的数值向量
> x <- c(11,22,33,44,55)
> x[c(1,2,4,4)]
[1] 11 22 44 44
使用逻辑向量取子集
> x[x >= 30]
[1] 33 44 55
使用字符向量取子集,针对命名向量
> x <- set_names(x,c("a","b","c","d","e"))
> x[c("a","b","a")]
a b a
11 22 11
3.递归向量(列表)
> xlist <- list(a = 1:3, b = "a strings", c = list(1,2))
#生成小的列表
> xlist[1:2]
$a
[1] 1 2 3
$b
[1] "a strings"
> xlist["c"]
$c
$c[[1]]
[1] 1
$c[[2]]
[1] 2
#生成元素本身
> xlist[[1]]
[1] 1 2 3
> xlist[["a"]]
[1] 1 2 3
#$提取列表命令元素,生成元素本身
> xlist$a
[1] 1 2 3
4.扩展向量
因子、日期、日期时间、tibble
tibble或是数据框可以看成是扩展的列表
> df <- data.frame(x=1:5,y=6:10)
> typeof(df)
[1] "list" #理解为包含两个元素的列表,第一个元素是向量1:5,第二个元素是6:10,竖着看
> attributes(df) #查看特性
$names #列名
[1] "x" "y"
$class #类
[1] "data.frame"
$row.names #行名
[1] 1 2 3 4 5
> df[[1]] #生成元素本身
[1] 1 2 3 4 5
> df[1] #生成小的数据框
x
1 1
2 2
3 3
4 4
5 5
网友评论