美文网首页NGS
长宽数据转换

长宽数据转换

作者: 生信编程日常 | 来源:发表于2020-05-30 23:55 被阅读0次

    长数据

    长数据一般是指数据集中的变量没有做明确的细分,即变量中至少有一个变量中的元素存在值严重重复循环的情况(可以归为几类),表格整体的形状为长方形,即 变量少而观察值多。
    data1


    image.png

    宽数据

    宽数据是指数据集对所有的变量进行了明确的细分,各变量的值不存在重复循环的情况也无法归类。数据总体的表现为 变量多而观察值少。
    如将上述表格按年龄组展开
    data2


    reshape2可以轻松地在宽格式(wide-format)和长格式(long-format)之间转换数据。

    主要用到两个函数:melt和cast
    melt:将wide-format数据“熔化”成long-format数据;
    dcast:获取long-format数据“重铸”成wide-format数据。

    以上述两个表格转化为例:
    dcast:data1转化成data2,即保留年份和月份,将年龄组分别展开

    data2<-dcast(data1,年份+月~年龄组)
    

    合并数据到一列时使用melt,生成的variable的为原来的四个年龄分组,value为原来的比例

    data1<-melt(data2, id.vars = c("年份",'月'))
    
    image.png

    欢迎关注~

    参考:
    https://blog.csdn.net/qazplm12_3/article/details/83618497
    https://blog.csdn.net/Ray_zhu/article/details/78679913

    相关文章

      网友评论

        本文标题:长宽数据转换

        本文链接:https://www.haomeiwen.com/subject/bfmkzhtx.html