美文网首页
相关性及PCA分析

相关性及PCA分析

作者: 斩毛毛 | 来源:发表于2020-11-27 22:15 被阅读0次

    简要介绍相关性及PCA分析

    1、 相关性分析

    本次使用数据如下所示:


    • 加载数据
    data <- read.table('quality.txt',header = T,sep = "\t",row.names = 'Samples')
    
    • 相关性分析
    library(corrplot)
    corrplot::corrplot(cor(data),type = 'upper',
                            addCoef.col = 'black')
    
    ## 参数:
    type:  上半部分
    a ddCoef.col: 添加相似值的颜色
    

    结果如下


    2、PCA分析

    还是用上述数据

    • 加载包
    library(ggfortify)
    library(cluster)
    
    • 基础图形
    autoplot(object = prcomp(data), data = data)
    #参数解析
    # autoplot函数是ggplot包所属的一个函数。可以实现基于特殊对象实现快速绘图。
    # object指定绘图对象
    # data指定绘图数据集
    # prcomp函数基于给定数据集进行PCA分析
    # cleandata为进行分析的数据集
    
    • PCA聚类,用pam函数来代替prcomp函
    autoplot(object = pam(data, 2), frame = TRUE, frame.type = 'norm')
    #参数解析
    # pam函数功能类似prcomp函数,区别在于它会将PCA的结果进行K-means聚类分析,在 
    # 函数的参数中,cleandata为数据集,3为K-means聚类的K值,简单理解就是设置最终聚成几类。
    # frame是一个逻辑值,设置是否在聚成一类的数据点周围添加外框来突出展示。
    # frame.type设置添加的外框类型,norm代表添加椭圆,默认为多边形
    
    • 继续修改图片
    #添加图片标题
    autoplot(object = pam(data, 2), frame = TRUE, frame.type = 'norm') +
    labs(title="PCA Analysis") + 
      
      #图片标题居中,设置字体大小为20
      theme(plot.title = element_text(hjust = 0.5 ,size = 20),
            
            #删除图例标题
            legend.title = element_blank()) +
      
      #手动指定图列的颜色与名称 
      scale_fill_manual(values = c('red','blue'),labels = c('A','B')) +
      scale_color_manual(values = c('red','blue'),labels = c('A','B'))
    

    ** 以上PCA分析内容来自 R语言绘图-PCA图形优化 **

    相关文章

      网友评论

          本文标题:相关性及PCA分析

          本文链接:https://www.haomeiwen.com/subject/ajpfwktx.html