这也是一种基于决策树的方法,这是一种深度树的集成方法(deep forest ensemble method )
如何使用
想要在R里面使用,需要在计算机上安装一下设备:
- python 3x
- Numpy
- Scikit-learn
之后,安装R包
install.packages('gcForest')
使用fcForest
- fit(X,y) 在输入数据X和相关目标y上训练gcForest;
- predict(X) 预测未知样本X的类别;
- predict_proba(X) 预测未知样本X的类概率;
- mg_scanning(X, y=None) 对输入数据执行多粒度扫描;
- window_slicing_pred_prob(X, window, shape_1X, y=None)对输入数据执行窗口切片并通过随机森林发送它们。如果提供目标值'y',则使用切片数据训练随机森林;
- cascade_forest(X, y=None) 执行(或训练如果'y'不是None)级联森林估计;
- gcdata(x) 将R数据结构转换为Python数据结构;
- model_save(model,path) 将经过训练的模型保存在磁盘中
- model_load(path) 将训练模型从磁盘加载到R环境;
例子
library(gcForest)
sk <- reticulate::import('sklearn')
train_test_split <- sk$model_selection$train_test_split
data <- sk$datasets$load_iris
iris <- data()
X <- iris$data
y <- iris$target
data_split <- train_test_split(X,y,test_size=0.33)
X_tr <- data_split[[1]]
X_te <- data_split[[2]]
y_tr <- data_split[[3]]
y_te <- data_split[[4]]
gcforest_m <- gcforest(shape_1X = 4L,window = 2L,tolerance = 0.0)
gcf_model <- gcforest_m$fit(X_tr,y_tr)
网友评论