美文网首页
读书笔记

读书笔记

作者: 看远方的星 | 来源:发表于2018-12-30 11:46 被阅读10次

Learning R

Ricbard Cotton著 刘军译

1、R是一种解释型语言(脚本语言),代码在运行之前不需要编译。
2、IDE:选择Rstudio
3、第一个程序 创建第一个数字(1)到第二个数字(5)的序列,每个相隔为1。mean是一个函数(计算算术平均值),括号内的向量称为函数的参数。

> mean(1:5)     #计算1到5的算术平均值
[1] 3

4、获取帮助:使用?或者help
?函数/数据集 : 查看某个函数或数据集的信息。 等同于help("函数/数据集")
?? 函数相关关键词:查找某个函数。等同于help.search("函数相关关键词")

image.png
image.png image.png
image.png

1、向量化的三个含义:
第一含义:运算符或函数能作用于向量中的每个元素,而无需显式地编写循环语句。
第二含义:当一个函数把一个向量作为输入时,能计算汇总统计。
第三含义:参数的向量化。

2、使用==来比较非整型变量可能会带来问题。要检查两个数字是否一样,不要使用==,而使用all.equal函数。

all.equal(sqrt(2) ^ 2, 2) ## [1] TRU

3、在R中,不只是加号(+),其他所有算术运算符都是向量化的。

4、使用<<-来对全局变量赋值。创建了一个可在任意地方使用的变量:
x <<- exp(exp(1))

5、使用函数语法来对变量赋值:
赋值函数需要两个参数:要赋值的变量名以及要赋予该变量的值。
assign("my_local_variable", 9 ^ 3 + 10 ^ 3 )
使用assign函数会使代码可读性变差,因此须谨慎使用

6、R中的所有变量都有一个类,表明此变量属于什么类型 在R中“最小的”数据类型是向量。R包含三种不同类别的数值变量:浮点值numeric、整数integer和复数complex。

7、即使把R程序安装在64位操作系统上,所有的浮点数仍是32位的(“双精度”),而16位(“单精度”)的数字是不存在的。

8、R中最大的全精度浮点数是1.8e308。最小正数是2.2e-308。最大的整数为2^31 - 1。最小的负整数为-2 ^ 31 +1。
R中的三个内置数字类几乎能适用于所有用途。这些极限值还不够你用,你可以从Rmpfr包中得到更高精度的值,或从brobdingnab包得到非常大的数字。


1、R不区分整个字符串和单个字符——只包含一个字符的字符串与其他字符串的处理相同。你无需用空字符(\0)来终止字符串。

2、因子(factor),即拥有标签的整数,调用as.integer可以清楚地看到这些整数。这些标签被限制在称为因子水平(levels of the factor)的特定值中("female"和"male")默认情况下,因子水平按字母顺序分配。

3、原始类raw存储向量的“原始”字节2。每个字节由一个两位的十六进制值表示。它们主要用于保存输入的二进制文件的内容,因而比较少见。

4、使用as.raw函数可把0到255之间的整数转换为原始值(raw)。此范围之外的数字将全部视为0,分数和虚部也被丢弃。

5、 1)字符(character)向量或数组里须包含字符串,
2)逻辑(logical)向量或数组须只能包含逻辑值。 3)列表(list)则不一样,它比较灵活,列表里的每一项都可以是不同的类型,甚至能包含其他列表。 4)数据框(data frame)像是矩阵和列表的共同产物。它既像矩阵一样是矩形的,又像列表一样,每一列都可以有不同的类型。

6、"^is"是一个正则表达式 : 匹配所有以'is'开头的字符串。

7、baseenv函数 : 返回base包中所有的环境。

8、转型(casting): 改变一个对象的类型。
第一种方法 :
x <- "123.456" as(x, "numeric") ## [1] 123. 第二种方法(推荐此种方法,效率比第一种稍高) :
as.numeric(x) ## [1] 123.

9、当在控制台输入一个运算或者变量时,结果就被打印出来,因为R隐式调用了对象的print方法。
10、summary函数 : 能为不同的数据类型提供汇总信息。例如,数值变量会被汇总统计出平均数、中位数,以及一些分位数(quantile)。


1、ls( ) : 列出现有变量名称。

2、rm(list = ls( )) : 删除所有变量,小心使用。

3、命名 :
第一种办法: name = value
c(apple =1,bananas =2,"kiwi fruit =3,4)
第二种办法:
x <- 1:3
names(x) <- c("apple", "bananas", "kiwi fruit")
附: 获取向量名称
names (x)
## [1] "apple" "bananas" "kiwi fruit"

4、索引: 只要访问向量中的部分或个别元素。也被称为子集、下标或切片。


友情阅读推荐:

相关文章

网友评论

      本文标题:读书笔记

      本文链接:https://www.haomeiwen.com/subject/vtqvlqtx.html