1. 数据集划分和预处理
setwd()
library(readr)
# 完整矩阵
sampleTraits<-read_csv("2-datTraits_95.csv", col_names = T)
datExpr<-read_csv("3-normdatExpr_DEseq_95_miRBAse_batch.csv", col_names = T) # 标准化矩阵
head(names(sampleTraits));head(names(datExpr))
# 矩阵转置
miR<-as.vector(unlist(datExpr[,1]))
datExpr_t<-t(datExpr[,-1])
colnames(datExpr_t)<-miR
rownames(datExpr_t)<-sampleTraits$Diagnosis
datExpr_t[c(1:3),c(1:3)] # 列为样本,行为变量
#数据集划分
library(caret)
miR1<-read_csv("7.4-for_svm_sec_log2fc.csv") #加上oob方法结果不变7
miR<-unlist(miR1) #**1、7
F_svm<-datExpr_t[,miR];dim(F_svm)
set.seed(1)
devide_sub<-createDataPartition(y = rownames(F_svm), p=0.65, list=FALSE)
train_data<-F_svm[devide_sub, ];dim(train_data) #65%的german_credit数据作为训练数据
test_data<-F_svm[-devide_sub, ];dim(test_data) #35%的german_credit数据作为测试数据
#数据预处理
group_train = row.names(train_data)
group_test = row.names(test_data)
input_train<-data.frame(group = group_train, train_data)
input_test<-data.frame(group = group_test, test_data)
一、k近邻模型
二、随机森林模型
三、支持向量机模型
四、神经网络模型
五、LR回归模型
六、贝叶斯模型
网友评论