xgboost的sklearn接口总结
xgboost的sklearn接口官网
sklearn的参数寻优(RandomizedSearchCV)
1. XGBRegressor
2. XGBClassifier
参数详解
objective:
其他params:
3. fit(X,y)
fit(X,y): 可以加earlystop来防止过拟合。eval_set: 控制早停的数据集,通常为验证集。eval_metric: 控制早停的参照函数。如果值向有利方向变化小于某阈值,并超过early_stopping_rounds轮,就停止迭代。
predict(X): 输出为预测值。如果是XGBClassifier,predict输出为分类结果,如果想输出属于每个类别的概率,则需用predict_prob。
4. 参数搜索
GridSearchCV
RandomizedSearchCV(estimator, param_distributions, n_iter, scoring,cv)
参数详解
estimator: 输入的模型,其中必须包含score function,来评价参数优劣。
param_distributions: (dict), 待选的参数
n_iter: 搜索次数
scoring: 值得注意的是,'mean_squared_error'在此处应写为’neg_mean_squared_error', 因为模型默认筛选score大的,对mse取负数来达到这个条件。
cv: 可以输入int, 代表为K折验证法;可以输入其他的CV splitter;也可以自行输入(train, test)的index形成的array。这个index,要对应fit函数中的X。
网友评论