美文网首页
机器学习专题:R实现(2)

机器学习专题:R实现(2)

作者: 挽山 | 来源:发表于2020-06-30 08:01 被阅读0次

    1. 数据集划分和预处理

    setwd()
    library(readr)
    
    # 完整矩阵
    sampleTraits<-read_csv("2-datTraits_95.csv", col_names = T) 
    datExpr<-read_csv("3-normdatExpr_DEseq_95_miRBAse_batch.csv", col_names = T) # 标准化矩阵
    head(names(sampleTraits));head(names(datExpr))
    
    # 矩阵转置
    miR<-as.vector(unlist(datExpr[,1]))
    datExpr_t<-t(datExpr[,-1])
    colnames(datExpr_t)<-miR 
    rownames(datExpr_t)<-sampleTraits$Diagnosis
    datExpr_t[c(1:3),c(1:3)]  # 列为样本,行为变量
    
    #数据集划分
    library(caret)
    miR1<-read_csv("7.4-for_svm_sec_log2fc.csv") #加上oob方法结果不变7
    
    miR<-unlist(miR1) #**1、7
    F_svm<-datExpr_t[,miR];dim(F_svm)
    
    set.seed(1)
    devide_sub<-createDataPartition(y = rownames(F_svm), p=0.65, list=FALSE)
    train_data<-F_svm[devide_sub, ];dim(train_data) #65%的german_credit数据作为训练数据
    test_data<-F_svm[-devide_sub, ];dim(test_data)  #35%的german_credit数据作为测试数据
    
    #数据预处理
    group_train = row.names(train_data)
    group_test = row.names(test_data)
    input_train<-data.frame(group = group_train, train_data)
    input_test<-data.frame(group = group_test, test_data)
    

    一、k近邻模型

    二、随机森林模型

    三、支持向量机模型

    四、神经网络模型

    五、LR回归模型

    六、贝叶斯模型

    相关文章

      网友评论

          本文标题:机器学习专题:R实现(2)

          本文链接:https://www.haomeiwen.com/subject/vjukhhtx.html