一、基本数据操作 dataframe
na.omit(数据集)——删除缺失值
names()——查看数据集列的名字
names(数据集)[第几列]<- '新列名' ——修改列名
若不知道在第几列的话 通过names(数据集)%in%(修改列名的向量)——判断前面的是不是在后面的向量中
names(数据集)[names(数据集)%in%(修改列名的向量)] <- (新名字的向量)
数据集$列名 或 数据集['列名'] ——创建新的一列 美元符号返回向量,[]返回的还是数据框
根据条件来创建变量air_narm$YMO <- ifelse(air_narm$AGE<30,'YOUNG',ifelse(air_narm$AGE>60,'OLD','MIDDLE')
sum(air_narm$YMO) != air_narm$YMO_2)——看两列不同的有几个
先常见一个保留的列名向量,数据集[向量]——保留愿数据集的列 或 数据集[,保留列名的向量]
剔除列的话,在向量前加个负号 或者 names(数据集)%in%(修改列名的向量) 生成逻辑向量
subset(数据集,逻辑向量(选TRUE的行),列的信息不写就是全选)
网友评论