在数据处理时,常需要对数值型数据进行归类,如我们收集收入时往往需要给出最直观的变量来告知我们这个值的收入是高、低还是中等。cut函数可实现这一目的。
income<- c(1050,2030,3020,4030,5080,8000,9500,12000,5000,2300,30000)
age<-c(20,30,40,50,55,33,55,77,88,22,33)
dat<-data.frame(age,income)
image.png
如果希望加一列来将income分类为 low,medium以及high,标准为income<=3000定义为low, 3000<income<=8000为medium, income>8000为high,运用cut函数,命令如下:
dat$lveel<- cut(dat$income,breaks=c(-Inf,3000,8000,Inf),labels=c('low','medium','high'))
image.png
网友评论