H2O操作记录 分布式随机森林
数据集下载
数据集可以从这个网址进行下载:https://s3.amazonaws.com/h2o-public-test-data/smalldata/flow_examples/ad.data.gz。
数据集导入

2018-05-08-11-26-41.jpg
数据集解析

2018-05-08-11-28-26.jpg
点击Parse
:

2018-05-08-11-29-02.jpg
点击View
查看数据集

2018-05-08-11-30-32.jpg
点击最后一列,查看标签列的分布情况。
模型构建
选择分布式随机森林
算法:

2018-05-08-11-31-28.jpg
参数界面截图:

2018-05-08-11-35-16.jpg

2018-05-08-11-35-38.jpg

2018-05-08-11-36-04.jpg

2018-05-08-11-36-28.jpg
该算法比较重要的参数是下面这个截图:

2018-05-08-11-37-32.jpg
点击“构建”:

2018-05-08-11-38-07.jpg
模型结果

2018-05-08-11-38-52.jpg
与XGBoost
差不多,但是这个可以下载POJO
,XGBoost
好像不能下载。

2018-05-08-11-39-38.jpg

2018-05-08-11-39-56.jpg

2018-05-08-11-41-02.jpg
本文标题:H2O操作记录 分布式随机森林
本文链接:https://www.haomeiwen.com/subject/exrkhqtx.html
网友评论