实例数据操作02

实例数据操作02

作者: 六六的建斌 | 来源:发表于2017-07-19 18:02 被阅读0次

实例数据操作02
R和Python数据结构对比
实例数据操作
STL容器之list
STL容器之set/multiset
基于Linux的MySQL操作实例（软件安装，mysql基本操作
STL容器之vector
在WPF中使用SQLite
Spark实例-操作Hive数据
mysql技术内幕学习总结

今天看数据预处理，其实预处理和不处理，对结果的得分有很大的影响，最好是先比较两者的差异，再决定要不要用，预处理一般包括

scaler.fit(X_train)

X_train_scaled = scaler.transform(X_train)

三个步骤：1导入相关的预处理模块，并初始化，

2 匹配要处理的数据（一般都是因变量测试的和训练的）

3 转换匹配处理后的结果

scaler = Min Max Scaler()

scaler.fit(X_train)

X_train_scaled = scaler.transform(X_train)

X_test_scaled = scaler.transform(X_test)

这个可以将两部合为一体： X_scaled_d = scaler.fit_transform(X)

但卧槽

还有一种常见的：

##preprocessing using zero mean and unit variance scaling

from sklearn.preprocessing import StandardScaler

Principal Component Analysis (PCA)

Original shape: (569, 30)

Reduced shape: (569, 2)

擦，，看不懂打

from sklearn.cluster import KMeans

from sklearn.datasets import make_blobs

from sklearn.cluster import KMeans

# generate synthetic two-dimensional data

X, y = make_blobs(random_state=1)

# build the clustering model

kmeans = KMeans(n_clusters=3)

kmeans.fit(X)

data_dummies = pd.get_dummies(data) 生成哑变量

数字进行编码

demo_df = pd.Data Frame({'Integer Feature': [0, 1, 2, 1],

'Categorical Feature': ['socks', 'fox', 'socks', 'box']})

模型检测和提高

k-fold cross-validation, 最常用的交叉验证

最常用的函数是cross_val_score(), 第一个参数是选择的模型，第二个是因变量，第三个是输出值，默认是三重交叉验证，可以改变重数

A common way to summarize the cross-validation accuracy is to compute the mean:，最常用的是输出其均值

print("Average cross-validation score: {:.2f}".format(scores.mean()))

from sklearn.model_selection import Grid Search CV

from sklearn.svm import SVC

grid_search = Grid Search CV(SVC(), param_grid, cv=5)

X_train, X_test, y_train, y_test = train_test_split(

iris.data, iris.target, random_state=0)

grid_search.fit(X_train, y_train)

print("Test set score: {:.2f}".format(grid_search.score(X_test, y_test)))

Test set score: 0.97

print("Best parameters: {}".format(grid_search.best_params_))

print("Best cross-validation score: {:.2f}".format(grid_search.best_score_))

Precision-recall curves and ROC curves:

from sklearn.metrics import precision_recall_curve

precision, recall, thresholds = precision_recall_curve(

y_test, svc.decision_function(X_test))

Receiver operating characteristics (ROC) and AUC

相关文章

实例数据操作02
今天看数据预处理，其实预处理和不处理，对结果的得分有很大的影响，最好是先比较两者的差异，再决定要不要用，预处理一般...
R和Python数据结构对比
本文内容概要： R语言数据结构及实例操作 Python语言数据结构及实例操作 R语言数据结构及实例解析接下开始学...
实例数据操作
在所有的自带数据里面，统一的套路都是， from sklearn.datasets import * 引模块 x=...
STL容器之list
构造函数插入和删除操作实例大小操作赋值操作存取反转实例自定义数据必须重载<运算符
STL容器之set/multiset
构造函数赋值操作大小操作插入删除实例查找实例更改set容器排序规则自定义数据寻找上下限实例 ...
基于Linux的MySQL操作实例（软件安装，mysql基本操作
基于Linux的MySQL操作实例（软件安装，mysql基本操作，mysql数据类型，建表、插入数据操作）前言 ...
STL容器之vector
单端动态数组遍历输出构造函数实例自动扩容机制赋值操作容量操作实例使用swap收缩空间数据存取实...
在WPF中使用SQLite
SQLite数据操作流程打开数据库连接针对要操作的数据库，建立一个SQLiteConnection实例conne...
Spark实例-操作Hive数据
Spark操作Hive数据库，实现数据表创建，数据加载，以及数据查询。实例代码如下：
mysql技术内幕学习总结
一、mysql体系和存储引擎 1、数据库和数据库实例的区别数据库：存储数据的文件数据库实例：可以操作数据的程序...

网友评论

本文标题：实例数据操作02

本文链接：https://www.haomeiwen.com/subject/hwbkkxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|实例数据操作02|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！