我们在来看一些书中罗列的处理数据的其他比较有用的函数。
随机数函数
- 生成服从正态分布的伪随机数
通过函数set.seed()
显式指定这个种子,这样下次复用代码依然可以使结果重现。
函数runif()
用来生成0
到1
区间上服从均匀分布的伪随机数
。
> runif(6)
[1] 0.8551465 0.3663286 0.4361905 0.7536699 0.6391011 0.9583179
> runif(6)
[1] 0.2430240 0.8443019 0.4113231 0.7202562 0.5849614 0.8344653
> set.seed(134)
> runif(6)
[1] 0.2003636 0.6275925 0.8814988 0.2512561 0.6099499 0.1697329
> set.seed(134)
> runif(6)
[1] 0.2003636 0.6275925 0.8814988 0.2512561 0.6099499 0.1697329
可以看到,没有设置随机种子前,两次调用函数生成的随机数序列是不同;但是设置之后,就实现了相同结果的复现。
其它实用函数
> x <- c(1,5,2,1,51,9)
> name <- "Jack"
> length(x) #对象x的长度
[1] 6
> seq(0, 20,3) #从0至20,间距为3生成序列
[1] 0 3 6 9 12 15 18
> rep(1:3, 2) #将1至3重复2次
[1] 1 2 3 1 2 3
> cut(1:10, 5, ordered_result = TRUE) #将连续型变量 x 分割为有着 n 个水平的因子使用选项ordered_result = TRUE 以创建一个有序型因子
[1] (0.991,2.8] (0.991,2.8] (2.8,4.6] (2.8,4.6] (4.6,6.4] (4.6,6.4] (6.4,8.2] (6.4,8.2] (8.2,10] (8.2,10]
Levels: (0.991,2.8] < (2.8,4.6] < (4.6,6.4] < (6.4,8.2] < (8.2,10]
> pretty(1:10, 20) #创建美观的分割点。 通过选取n +1个等间距的取整值, 将一个连续型变量 x 分割为 n 个区间。
[1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0
cat("Hello", name, file = "myfile", append = FALSE) #连接若干个对象, 并将其输出到屏幕上或文件中(如果声明了一个的话)
表中的最后一个例子演示了在输出时转义字符的使用方法。 \n
表示新行, \t
为制表符, \'
为单引号,\b
为退格。举个例子
> cat("Hello", name, "\n" , "How old \n are you?")
Hello Jack
How old
are you?
网友评论