今天测试一个很经典的案例,算是对最近的几个算法的复习。下面就是使用SVC、KNeighborsClassifier、DecisionTreeClassifier、RandomForestClassifier、GradientBoostingClassifier、GridSearchCV来进行测试,并获得score分值。
可以参考这里,里面有数据和代码。Gender Recognition by Voice | Kaggle
1、数据探索
voice的csv文件是3168*21,最后一列是标签男女,且所有数据没有空值。
2、数据转换
将末尾的标签转为数值1、0,1代表male,0代表female。
3、数据处理
将特征转为标准正态分布,使用train_test_split对数据进行训练测试分离。
4、逻辑回归分类LogisticRegression()
5、SVC分类SVC()
6、KNN分类KNeighborsClassifier()
7、决策树分类DecisionTreeClassifier()
8、随机森林分类RandomForestClassifier()
9、GradientBoosting分类GradientBoostingClassifier()
10、GridSearchCV分类GridSearchCV()
分数统计如下。
网友评论