长数据
长数据一般是指数据集中的变量没有做明确的细分,即变量中至少有一个变量中的元素存在值严重重复循环的情况(可以归为几类),表格整体的形状为长方形,即 变量少而观察值多。
data1
image.png
宽数据
宽数据是指数据集对所有的变量进行了明确的细分,各变量的值不存在重复循环的情况也无法归类。数据总体的表现为 变量多而观察值少。
如将上述表格按年龄组展开
data2
reshape2可以轻松地在宽格式(wide-format)和长格式(long-format)之间转换数据。
主要用到两个函数:melt和cast
melt:将wide-format数据“熔化”成long-format数据;
dcast:获取long-format数据“重铸”成wide-format数据。
以上述两个表格转化为例:
dcast:data1转化成data2,即保留年份和月份,将年龄组分别展开
data2<-dcast(data1,年份+月~年龄组)
合并数据到一列时使用melt,生成的variable的为原来的四个年龄分组,value为原来的比例
data1<-melt(data2, id.vars = c("年份",'月'))
image.png
欢迎关注~
参考:
https://blog.csdn.net/qazplm12_3/article/details/83618497
https://blog.csdn.net/Ray_zhu/article/details/78679913
网友评论