一、读入文件
(一)导入csv文件
安装和运行readr包
read_csv(文件保存路径,col_types, col_names)
第二个参数改变变量类型 = (变量=col_double())
第三个参数默认T,导入文件第一行是列名
(二)导入EXCEL文件
安装运行readxl包
read_excel(文件路径,col_names, sheet',range)
前两个参数同csv,sheet参数是excel有多个表时,表的名字
range参数指定范围,左上角到右下角,如A1:D10
(三)导入txt文件
read.csv(文件路径,sep)
sep是文本中的分隔符是什么
(四)文本编辑器
先创建dataframe 命名为啊a,给定每列变量类型
a <- edit(数据框的名字) 一定要赋值给数据本身,否则白做
二、内置数据集
data()查看已有数据集
head(iris,10)——查看iris数据集前10行数据
tail(,)——查看后面多少行
str()查看变量属性,内部结构
names(数据集名字)[]——查看数据集第几列的变量名
nrow() ncol() dim() length()——查看数据集的行数 列数 维度 列数
attributes()——显示对象的属性,输出结果是List类型
summary(数据集)——每列变量的描述统计
三、把数据写入文件
write.csv(数据集名字,保存路径,row.names = F)不要输出行名
sink(保存路径) 保存内容 sink()——三行代码实现
网友评论