16.算法选择

16.算法选择

作者: 袁一帆 | 来源:发表于2016-03-14 14:46 被阅读189次

Scikit 官方图

简单看一下（点击看大图）
四大类解决方案

分类
回归
聚类
降维

预测结果是一个类别，且现在有已标记数据的情况

对于大量数据（10w+），在线学习
1.1 利用SGD（stochastic gradient descent ）随机梯度下降方法
1.2 SDG，效果不好改用 kernel approximation 核逼近的方法
对于非海量数据
2.1 线性SVC（多分类是一对一模式）
2.2 若不管用，则

2.2.1 文本数据用朴素贝叶斯
2.2.2 非文本数据用KNN，
2.2.3 效果不好则尝试基于SVC和投票分类器的集成学习

预测结果是一个类别，没有标记好数据的情况

对于知道类别数量的情况
1.1 利用KMeans
1.2 效果不好，则利用Spectral Clustering（谱聚类）或者高斯混合模型聚类
对于不知道类别数量的情况
2.1 数据量小的情况时用MiniBatch Kmeans，或者VBGMM

预测结果是一个连续的数值

小数据量
1.1 一小部分特征重要的情况用：Lasso（）或者ElasticNet（）
1.2 利用RidgeRegression或者SVR（linear）
1.3效果不好用集成式回归和SVR（rbf）
大数据量
2.1 随机梯度下降（SGD Regressor）

预测结果也不是一个数值

随机主成分分析（randomized PCA）
效果不好则观察数据集大小
2.1 大数据集用核逼近
2.2 小数据集利用Isomap(Isometric Feature Mapping)和谱嵌入（spectral embedding）
2.3 效果不好则用，LLE

相关文章

网友评论

本文标题：16.算法选择

本文链接：https://www.haomeiwen.com/subject/dywxlttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|16.算法选择|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！