随机森林
哈喽,今天小编给大家介绍的是TUTU(https://www.cloudtutu.com/)网站上新添的randomforest2分析,即随机森林模型分析。目前平台上有两个随机森林的分析,如下图,小伙伴们可根据自己的需求选择对应的工具。
image随机森林(Random forest)
随机森林(Random forest)是利用多棵决策树对样本进行训练并预测的一种分类器。独木不成林,随机森林可以弥补单个决策树泛化能力弱的问题。在机器学习中,随机森林作为一个包含多个决策树的分类器, 其输出的类别是由个别树输出的类别的众数而定的。一般来说,随机森林中任意两棵决策树的相关性越大,错误率越大;每棵决策树的分类能力越强,整个森林的错误率越低,它可以分析高维度数据,并且不用做特征选择,是模型预测的利器。
应用举例:
通过应用随机森林建模(分类程序),我们基于不同的预测变量预测了所有 39 种植物物种的空间共现模式(即聚合或分离),包括物种- 植物之间整体根相关真菌 OTU 的相对丰度 (RA)、系统发育 (PL)、功能性状 (FT)、丰富度 (RICH) 和群落组成 (COMM) 的水平差异,以及截断值为 0.5 和 0.9 时共享(或独特)核心根相关真菌 OTU 的修正相对丰度 (MRA) 谱。(Root-associated fungal community reflects host spatial co-occurrence patterns in a subtropical forest)
注意事项
以下还是关于网站使用的一些注意事项:
1.绘图免费:网站绘图是免费的,免费的,免费的,重要的话说三遍。网址是:https://www.cloudtutu.com/,一般用谷歌或者火狐浏览器登录,输入验证码即可登录成功并使用,遇到网络不好的情况,也可以换下其他浏览器。
2.工具查找:在“微生物分析”一栏,所有的工具都在里面,没有找到相应工具的小伙伴可能需要耐心往下翻翻,一般新上的工具会排在前面。
3.使用说明:有用户反映上传数据上传不上去,这种情况一般是因为文件格式或者内容里有不识别的字符,与示例数据形式相左或者文件数据量太大了,需要时间上传。每个工具右侧有“帮助文档”一栏,使用较多的部分工具也新增了“常见问题”,小伙伴使用时请务必按照这两个说明进行操作,不然可能会出现上传不成功甚至画不出来的情况。
4.问题反馈:如果有画图的问题解决不了,或者有一些画图需求,改进建议等等,可以联系“小图”,小图的二维码贴在页面右侧,一眼就可以看到。
5.其他****:TUTU网站上的绘图工具可以处理一般数据量的文件,但是如果数据太大(比如十几兆或者几十兆的数据),有些工具是画不出来的(如零模型、RC指数等等)...毕竟资源有限,还请各位客官见谅
使用方法
1 TUTU网站登录
①登录网址:www.cloudtutu.com(推荐使用360或者谷歌浏览器)
②输入用户名和密码(已经为大家填好了),输入验证码后即可登录;
③登录后在“微生物分析”那一栏找到randomforest2,点击进入;
④请按照界面右侧的说明书或者下文进行操作。
2 上传文件
※※※目前平台仅支持.txt(制表符分隔)文本文件或者.csv文件的文件上传,最好传txt文本文件!
※※※请您务必按照示例数据的格式调整数据!上传文件中不可带有:中文、中文字符、空格、重复名称等!!!
a)准备2个数据文件(形式参照示例数据,如微生物物种丰度表、基因表达量矩阵等等);
b)文件1:OTU表,表格需要带表头和列名,每一列为样本名,每一行为各种指标数据名,例如OTU等;文件2:TAX表:表格需要带表头和列名,文件1中otu对应的分类水平;
c)请提交txt(制表符分隔)文本文件或者.csv文件。操作方法为:全选excel中的所有内容(ctrl+A),复制到记事本中,将记事本文件另存后点击“上传”按钮上传该文件。
3 参数设置
3.1 在界面右侧编辑分组信息:需要对所有样品进行分组,本网站支持在线修改分组名称的功能。有在线输入(方式一)和手动粘贴(方式二)两种方式。(绘图前必须检查分组名称)
image
3.2 分类水平选择:按需自行设置
4 下载文件
点击“运行”开始作图,点击“下载”保存结果文件。PDF格式的文件可通过矢量图编辑工具进行编辑。
image
5 作图后处理
TUTU云平台提供的是PDF格式的矢量图,可通过矢量图处理软件进行编辑和调整(如:文字字体,文字大小,图片分辨率等)。
网友评论