library(sqldf)
library(tcltk)
library(ggplot2)
- library()和install.packages()
install用于联网、在线安装、本地安装
install.packages('package_name')
library()在R语言中用来加载第3方包
library(my_package)
working_directory = "C:/Users/实验"
setwd(working_directory)
- getwd(),获取当前工作目录
setwd(),设置当前工作目录(改变)
括号内的参数是字符串,需要引号
ab_exp_id = '实验调整_20190305'
file_name = paste(working_directory, "/", ab_exp_id,".csv",sep="")
data_tmp<- read.csv(file_name)
- paste(),多字符串使用 paste() 函数来组合。它可以将任意数量的参数组合在一起
- <-赋值,注意和=及<<-的用法区别
data_tmp$profit <- data_tmp$commission - data_tmp$final_subtract - real_cash_rate*data_tmp$final_cashback
- $:取某个object(数据框,list比如lm object,etc)的某个部分
data_tmp$dt<-as.character(data_tmp$dt)
- as.numeric 转化为数值型
- as.logic 转化为逻辑型
- as.complex 转化为复数型
- as.character 转化为字符型
- as.array 转化为数组
- as.data.frame 转化为数据框
exp_id<-unique(data_tmp$ab_exp_id)
- unique(),返回对象的不同值
exp_report <- merge(data_exp_A,data_exp_B)
- merge 连接两个数据,官方参考文档语法
merge(x, y, by = intersect(names(x), names(y)),
by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all,
sort = TRUE, suffixes = c(".x",".y"),
incomparables = NULL, ...)
x,y 要合并的两个数据集
by,用于连接两个数据集的列,intersect(a,b)值向量a,b的交集,names(x)指提取数据集x的列名
by = intersect(names(x), names(y)) 是获取数据集x,y的列名后,提取其公共列名,作为两个数据集的连接列, 当有多个公共列时,需用下标指出公共列,如names(x)[1],指定x数据集的第1列作为公共列
也可以直接写为 by = ‘公共列名’ ,前提是两个数据集中都有该列名,并且大小写完全一致,R语言区分大小写
by.x,by.y:指定依据哪些行合并数据框,默认值为相同列名的列
all,all.x,all.y:指定x和y的行是否应该全在输出文件
sort:by指定的列(即公共列)是否要排序
suffixes:指定除by外相同列名的后缀
incomparables:指定by中哪些单元不进行合并
data_tmp_exp <- subset(data_exp_ab,exp == i)
- subset(),条件筛选函数
options(digits = 2)
- 数字位数的设置,options(digits=n),n一般默认情况下是7位,但实际上的范围是1~22,可以随意设置位数。
options(digits=10)
eg:R的整数表示能力设为10位。
网友评论